FUTOPIX | Antropología y los Agentes Personales de IA
Toma 13 | Una Carta de Navegación para Construir Agentes Personales de IA
Espejito, Espejito…
La gente me está haciendo las mismas preguntas a dondequiera que voy. Me las hacen en los aviones, en los seminarios, después de las conferencias, en los grupos de WhatsApp, e inclusive en los consultorios médicos, cuando se enteran de que trabajo en el área de tecnología e IA. Muchos me miran con una mezcla de curiosidad, miedo y escepticismo, sentimientos de los que tanto habla Harari al describir a las sociedades cuando se enfrentan a una nueva historia: intuyen que algo grande está cambiando, pero todavía nadie les ha dibujado un mapa que les ayude a hacer visible tales cambios.
Muchos de los cuestionamientos que me hacen mis interlocutores giran alrededor de las siguientes preguntas: ¿qué es exactamente un agente de IA? ¿Cualquiera puede construirlos? ¿Son algo más que Google con esteroides? ¿Qué hace un antropólogo como yo en el mundo de la tecnología y de la IA?
Ya se trata de un tema recurrente y que causa curiosidad, trataré de resolver todas estas cuestiones en esta Toma, no sin antes advertir que muchas de estas preguntas esconden los miedos ocultos de la gente, que piensa que este nuevo mundo de la IA está reservado exclusivamente para ingenieros; que algo muy grande y muy grave está por sucederle a la sociedad, y que sin la guía adecuada muchos se perderán la oportunidad de asistir conscientemente a este cambio de paradigma.
La verdad, pienso que muchos tienen razón al tener un poco de miedo y de escepticismo frente al tema. Ya que la IA y los Agentes Personalizados no son simplemente otra herramienta más en nuestra caja de posibilidades digitales. Tales asistentes “inteligentes” son la próxima frontera para entender cómo los humanos organizamos el conocimiento, la acción, la memoria, la identidad y el significado.
Los Agentes de IA, a los cuales llamaremos de aquí en adelante los AIA, serán nuestros nuevos consultores, colaboradores, aprendices, analistas, investigadores, ejecutadores, pensadores y, si los diseñamos bien, serán nuestros gemelos digitales, nuestras antonomasías, el espejo en el que coevolucionaremos como especie. Kevin Kelly diría que son parte del technium, esa red viva de tecnología que evoluciona con nosotros y a través de nosotros.
Un AIA no representa tal cosa como “Google con esteroides”. Por el contrario, es una proyección de nuestro conocimiento multiplicado en el tiempo y en las posibilidades; un acelerador de nuestra inteligencia elevado a una nueva potencia. Son al mismo tiempo una extensión digital de nuestras intenciones, una ampliación de nuestra frontera cognitiva, un espacio al que antes no podíamos entrar, un aliado simbólico en la coreografía de nuestras vidas.
Sin embargo, existen innumerables retos. En la medida en la que la IA y los Agentes se hacen más poderosos, estos sufren de una debilidad fundamental: ni la IA ni los agentes entienden el mundo humano al que están entrando. Estas tecnologías aún están lejos de entender las complejidades del contexto humano, los rituales, la identidad, las narrativas, la cultura, las jerarquías, el silencio, los tabúes, las emociones o los complejísimos sistemas simbólicos que nos hacen ser lo que somos, ¡humanos! Clifford Geertz lo resumió con precisión: estamos “suspendidos en redes de significado que nosotros mismos hemos tejido”; los modelos solo ven los datos, no la red.
Es en este tipo de escenarios donde comienza mi trabajo. Los antropólogos, a diferencia de otros profesionales, no somos unos simples espectadores en la era de la IA. Formamos parte de la arquitectura que permitió construir esta tecnología, y parte activa en el futuro que le ayudará a la humanidad a digerirla a través de la cultura. Mi trabajo es ayudar a traducir las narrativas entre los diferentes bandos; somos constructores de puentes.
Cuando miramos hacia las civilizaciones antiguas, los antropólogos trabajamos analizando lo que heredamos, pero cuando miramos hacia el futuro, especialmente hacia una nueva humanidad que fusiona el conocimiento heredado con el conocimiento sintético producido por máquinas, nuestra labor es ayudar a construir las interfases que comuniquen ambos paradigmas, para ayudarle a los sistemas inteligentes a leer la humanidad no como data, sino para entenderla como cultura, para que la gente diseñe AIAs que no solo sean productivos, sino que les permitan construir significado y contenido simbólico. No es un asunto exclusivo de alcanzar eficiencias, sino de alinearnos con los rituales y los valores que formatean nuestra vida cotidiana. No se trata solo de que la IA piense “bien”, sino de que piense de forma “localizada”. No se trata simplemente de hacerlo de forma inteligente, sino de estar vivos desde el contexto en el que operarán los agentes.
Estamos entrando en una era en la que cada persona tendrá la posibilidad de construir muchos agentes, docenas, tal vez cientos, trabajando para nosotros y en nuestro beneficio. Y si de verdad queremos que estos agentes nos sirvan para aumentar nuestro potencial, antes que abrumarnos, debemos construirlos con bases más profundas que simplemente descripciones vanales y código fuente.
Por eso decimos que los agentes deben ser construidos con bases antrópicas (antropológicas, si se prefiere). Donella Meadows diría que el verdadero poder no está en cambiar las partes del sistema, sino en cambiar los modelos mentales que lo gobiernan; los agentes son una encarnación de esos modelos mentales. Este FUTOPIX es la carta de navegación para emprender dicho viaje. Una guía rápida para aquellos que deseen entender qué son en realidad los AIAs, cómo puedes construirlos y cómo el futuro de la IA dependerá no solamente del surgimiento de mejores modelos, sino de desarrollar mejores relaciones de significado a partir de ellos.
Sean bienvenidos, pues, a la frontera donde las máquinas aprenden a comportarse, los humanos aprendemos a diseñar inteligencias y la antropología se torna la guía para enfrentar una nueva era tecnológica.
Dos Familias de AIAs
Cualquier agente que construyas gravitará en estas dos áreas:
Agentes Conversacionales
Los AIA conversacionales son sistemas diseñados para entender y responder de forma natural, y en forma de diálogo, típicamente en forma de voz o texto. Estos toman el texto o las instrucciones de voz y los convierten en formas leíbles para las máquinas. Usan NLP (Procesamiento Natural de Lenguaje) para identificar las intenciones y el contexto de conversación establecido por el usuario, a menudo accediendo a bases de datos de conocimiento o herramientas externas. Las acciones o respuestas apropiadas son lo que llamamos “Agentes”, asistentes, copilotos, guías, tutores, consultores, estrategas y hasta compañeros de trabajo.Muchas agentes tienen la capacidad de hablar, ayudarte a razonar, aconsejarte, explicarte cosas que no entiendes. También analizan, debaten, reflexionan, simulan; y sin ninguna duda podrán ser tus mentores o tus instructores.
Los agentes conversacionales operan principalmente a través de una tecnología conocida como LLMs (Large Language Models) de extrema utilidad para la generación de diálogos y razonamientos. Algunos ejemplos de estos son ChatGPT, Claude, Gemini, Perplexity, Grok. Son algo así como tener un cerebro paralelo con voz propia, un interlocutor que nunca se cansa y que siempre tiene tiempo para pensar contigo.Agentes Automatizados
Si los primeros eran tus consejeros, estos estarán en capacidad de ejecutar; son máquinas de acción. Los agentes automatizados son programas de software capaces de percibir su ambiente, para razonar y ejecutar objetivos con intervención mínima de los humanos e inclusive totalmente independientes de nosotros. Igual que los anteriores están construidos con LLMs y otras técnicas de IA, lo que les permite entender NLPs para planear y ejecutar secuencias. Gracias a estos últimos podrías programar listas de mailing, actualizar tablas de cálculo, correr flujos, consultar APIs, ejecutar código, administrar calendarios, activar automatizaciones, monitorear sistemas, recoger y analizar data, administrar logística, etc. Los agentes automatizados se mueven de la intención a la acción.Estos agentes se pueden integrar con herramientas de automatización como Zapier, Make, LangChain, ReAct, AutoGPT frameworks, TaskWeaver, OpenAI’s Actions. Es como tener un cerebro con manos. Los agentes automatizados son extensiones de nuestras manos, de nuestro tiempo y de nuestra capacidad de ejecutar. Si logras maestrizar estos componentes, podrás construir prácticamente cualquier cosa.
La Arquitectura
El Cerebro
Elegir el cerebro para un agente de IA comienza por entender qué es realmente un LLM. Un LLM o Large Language Model no es solo un software sofisticado: es una arquitectura entrenada con enormes cuerpos de texto para aprender patrones de lenguaje, inferencias, relaciones conceptuales y estilos culturales. En términos simples, un LLM es una mente estadística capaz de predecir la próxima palabra, sí, pero también de interpretar intenciones, conectar ideas y simular razonamiento humano. Por eso funciona como el “cerebro” de un agente: infiere, decide, responde, pregunta, sugiere y mantiene la coherencia narrativa que da vida a la interacción.
Hoy convivimos con varias familias de estas mentes digitales: GPT, Claude, Llama, Gemini, Mistral, Grok o Phi. Elegir entre estos no es solo comparar métricas; es definir qué tipo de inteligencia queremos que actúe en nombre nuestro. Como un antropólogo elige a su informante clave por la calidad de sus insights, el diseñador de agentes elige el LLM que mejor interpreta el mundo donde ese agente va a operar.
Antes de escoger un modelo, hazte la pregunta fundamental: ¿qué tipo de inteligencia necesito que piense por mí? La claridad de esa respuesta será tu brújula.
Lógica
La lógica, más comúnmente llamada el prompt o la ingeniería del contexto (no estoy muy de acuerdo con este nombre porque los prompts son más antropología que ingeniería). La lógica detrás de un AIA es factor crítico de éxito. Al contrario de lo que muchos piensan, los prompts no son instrucciones, son arquitecturas de significado. En este orden de ideas, cualquiera que sea la naturaleza de tus agentes, esta lógica consta de cinco partes fundamentales:
Razonamiento
Es importante conocer el modelo de pensamiento de un agente para identificar cómo está recabando información. Esto no solo revela las fortalezas del agente, sino que también expone vulnerabilidades inherentes, como sesgos en la selección de datos o dependencias en fuentes no verificadas. Por ejemplo, un agente de IA diseñado para análisis financiero podría priorizar datos en tiempo real de APIs públicas, pero si su modelo de razonamiento no incluye validación cruzada, podría “alucinar” tendencias basadas en ruido temporal, como un pico aislado en el mercado.
Esta visibilidad del “modelo de pensamiento” nos da luces para programar agentes que no alucinen ni especulen a la hora de realizar sus tareas. Al visibilizar el flujo de razonamiento, podemos insertar reglas para consultar fuentes y generar umbrales de confianza antes de inferir, o mecanismos de retroalimentación. En la práctica, esto reduce errores catastróficos; imagina un agente médico que, en lugar de especular sobre síntomas raros, siempre priorice evidencia empírica de bases de datos, mejorando así la precisión y la confianza en sus protocolos médicos.
Mapas de la Experiencia (Journey Blueprint)
Es difícil encontrar las palabras en español para describir journey blueprint, tal vez decir que en esta parte definimos el “mapa de la experiencia”, o si se me permite, los “planos de la experiencia”. En Futopix 10 hablamos de la importancia de retornar al pensamiento en fundamentales, este ejercicio es el perfecto ejemplo de ello, porque durante esta fase de construcción buscamos hallar las unidades mínimas de significado para acotar nuestro agente. Déjenme explicarles esto para una mejor comprensión: aquí definimos la identidad, la personalidad, el tono, la cosmogonía ideal (su visión del mundo), el propósito, los roles, el estilo emocional, los valores, los constreñimientos y los comportamientos deseados; en pocas palabras, representamos el ADN cultural de tu agente. Siempre piensa en tu agente como si fuera una persona de carne y hueso. Toffler hablaba de prosumidores, aquí podríamos hablar de pro-diseñadores de inteligencias: no solo diseñamos agentes, los configuramos desde nuestra esencia.Estado Actual (Current Blueprint)
Todo agente necesita un punto de partida, necesita que lo ubiquen en un momento histórico, en un lugar geográfico o en una circunstancia específica; mientras más concreto seas en esta parte, mejor. Hay quienes llaman a esta fase el Job To Be Done / JTBD, el trabajo para el que estás diseñando tu agente.Es importantísimo que antes de comenzar a diseñar un agente te realices preguntas tales como: ¿cuál es el estado actual del proyecto o la idea en la que estoy trabajando? (algunos lo llaman el estado del arte), ¿qué tanto sabes del tema o la situación en cuestión? ¿Qué aspectos importantes necesita entender tu agente acerca de tu mundo o del espacio en el que participará? ¿Cuáles son tus metas actuales, qué pretendes lograr? ¿Qué herramientas necesitas usar o necesitas incorporar? ¿Qué tipo de data posees? ¿Cómo fluye la información en tu proyecto? Es algo así como cuando interactúas con la foto en el mapa de un centro comercial o de un parque de diversiones donde la imagen te está diciendo: ¡usted está aquí!
En la descripción del estado actual es fundamental la claridad, por eso recomiendo que primero documentes todo en un papel o en un documento digital antes de pasar a ingresar la data al cerebro de tu agente. Lo bueno de prácticamente todos los LLMs, cerebros de IA, es que siempre puedes volver a editar las instrucciones para mantener versiones actualizadas y/o realizar mejoras continuas.
Estado Futuro (Future Blueprint)
En esta parte definirás qué esperas que tu agente arroje como resultados, qué tipo de reporte consideras exitoso, cuáles son las metas finales, cuál es la dirección preferida que debe dar a la información entregada, en qué tipo de humano quieres transformarte con su ayuda, en qué tipo de profesional deseas convertirte. Si la fase anterior era el punto de partida, en esta parte describirás la ruta hacia donde debe navegar tu agente.Preguntas
Después de que hayas terminado de generar la lógica con la que operará tu agente, es importante dejar escrito de forma especifica cierta forma de disclaimer, en el que le sugieres a tu nuevo agente realizarte preguntas cuando la información que posee en su base de datos de conocimiento no sea exacta o suficiente para resolver la tarea econmendada
Al unir 1 + 2 + 3 + 4 + 5 obtendrás las dimensiones del contexto. De esta manera, convertirás tu agente en un guía y no en un chatbot genérico. La mayoría de la gente no presta atención a estos pasos, a veces parece mucho trabajo. Pero es por esto que sus agentes hacen reportes vanales y débiles. Imagina el siguiente escenario: has contratado a dos arquitectos para hacer dos casas en un terreno, una al lado de la otra; el arquitecto 1 ha realizado un set completo de planos para la construcción de su obra, tiene planos de fundaciones, alcantarillado, electricidad, estructura, fachadas, aire acondicionado, etc. El arquitecto 2 confía en su larga trayectoria y experiencia para construir la casa, él sabe de memoria dónde va todo, ¿en cuál arquitecto depositarías tu confianza?
El camino del arquitecto 1 parece un poco más largo, pero las posibilidades de que olvide algo son mínimas, de la misma forma funciona para los AIA.
Memoria
En el caso de los AIAs memoria no significa solo recordar cosas. Memoria significa mantener la continuidad y el sentido de existencia; es la ilusión de estar siempre presente. Al comienzo un AIA comenzará a construir una memoria de corto plazo, pero en la medida que se va entrenándolo con nuevas instrucciones y tareas, irá activando la memoria de largo plazo; es aquí donde es preponderante elegir un cerebro que garantice acceso a memoria de largo plazo, de lo contrario tu agente sufrirá de amnesia y a veces será frustrante tener que estarle recordando cosas.
La memoria de largo plazo podrá incluir consultas previas realizadas a una base de datos, acceso a documentos almacenados en la memoria del agente, generación de bitácoras, conexiones a APIs, acceso a consultas frecuentes y preferidas, reportes periódicos, etc.
Ahora bien, algunos LLMs poseen lo que se conoce como memoria situacional. Este tipo de memoria recuerda rutinas, proyectos, contextos, líneas de tiempo, entre otras cosas. Un buen agente recordará tu estilo para escribir, preferencias, hábitos de trabajo, alergias, tono, flujos de información y hasta tus metas de largo plazo. Un buen agente recordará en qué deseas convertirte.
En términos antropológicos, no solo recordará “datos sobre ti”, sino la narrativa de quién eres y hacia dónde estás dirigiendo tu futuro. Ahora bien, en términos prácticos, la memoria es una condición preinstalada presente en los servicios de casi todos los LLMs, pero créeme que a medida que vas usando la plataforma que elegiste para trabajar, irás descubriendo qué tan bueno para recordar es tu agente.
Data
En el ecosistema de la inteligencia artificial, los agentes no flotan en un vacío abstracto; operan en un terreno fértil y multifacético: la data. Lo que en el pasado denominábamos simplemente “base de datos de conocimiento” ha evolucionado en un vasto paisaje dinámico que nutre, contextualiza y empodera dichos sistemas. Esta data no es un mero depósito estático, sino un recurso vivo compuesto por una diversidad de fuentes, desde PDFs densos de investigación hasta imágenes de productos o perfiles detallados de consumidores, que se integra para potenciar el rendimiento del agente. Si el motor-cerebro del agente representa la inteligencia cruda y el razonamiento lógico, la data encarna su sabiduría: la acumulación de experiencias, patrones y conocimientos que transforman decisiones impulsivas en estrategias informadas. A continuación, amplío esta descripción, explorando su composición, rol transformador y prácticas recomendadas para maximizar su impacto.
La data actúa como el sustrato sobre el que se despliega el agente, proporcionando un mosaico de información que va más allá de los límites inherentes del modelo base (LLM genérico). En lugar de depender solo de conocimiento preentrenado, que puede ser obsoleto o sesgado, esta data se extrae y enriquece de múltiples canales, asegurando que el agente responda con precisión contextualizada.
Aquí les dejo detalles de las principales fuentes, con ejemplos prácticos de cómo se integran:
Documentos de Texto (PDFs, Libros, Manuales): Proporciona profundidad factual; evita alucinaciones, ancla las respuestas a evidencia verificable.
Información Web Extraída: Actualizaciones en tiempo real; un agente de ventas podría extraer tendencias de e-commerce para personalizar ofertas.
Imágenes y Multimedia: Enriquecimiento multimodal; permite razonamientos basados en patrones visuales, como identificar defectos en inspecciones de calidad.
Documentos Propios y Bases de Conocimiento Internas: Personalización a escala; reduce latencia al priorizar conocimiento propietario sobre consultas externas.
Código y Scripts: Facilitan el razonamiento procedimental; transforman abstracciones en acciones concretas, como generar código dinámico.
Perfiles de Consumidor y Hojas de Cálculo: Contextualización humana; habilita predicciones personalizadas, como recomendaciones basadas en historiales de compra.
Herramientas
Representan las manos y los pies de tu agente. Recuerda: si tu agente solo puede hablar, es conversacional; si puede actuar, se convertirá en un agente autónomo. Algunas herramientas incluyen APIs, ejecutadores de tareas, generadores de documentos, envíos de mail, administradores de calendarios, automatizadores de navegadores, generadores de ciclos de seguimiento, generadores de flujos, ejecutadores de microprogramas, generadores de consultas, generadores de embudos de conversión, etc. Las herramientas son el músculo de tus agentes.
En conclusión, para construir un agente sigue los siguientes pasos:
Paso 1: Elige el Tipo de Agente
Conversacional, Automatizado o Híbrido.
Paso 2: Elige el Motor (Cerebro)
Selecciona la herramienta de LLM que más se adapte a tus necesidades, mi consejo es que no te cases con una sola, programa el mismo agente en dos o tres LLMs y mira cuál se adapta mejor a tus necesidades.
Paso 3: Describe la Lógica
Mapea en palabras la experiencia o el proceso que deberá ejecutar tu agente, describe detalladamente la experiencia, el estado actual y el estado futuro (Journey Blueprint, Current State Blueprint, Future State Blueprint).
Paso 4: Memoria
Identifica cuál es la capacidad de recordación que posee el LLM que has elegido; con la práctica fácilmente identificarás si sufre de amnesia o si, por el contrario, aprende al pie de la letra las instrucciones que le has encomendado.
Paso 5: Carga la Data
Adjunta toda la data necesaria para construir una buena base de conocimiento. Algunos LLMs poseen limitaciones de espacio para almacenar data, esto ocurre sobre todo en las aplicaciones gratuitas; en ese caso inserta los documentos para que el LLM los ingiera, hazlo por tandas para que no te los rechace.
Paso 6: Conecta las Herramientas
Elige qué es lo que el agente puede hacer por ti, sin que tú tengas que darle instrucciones adicionales.
Paso 7: Pruébalo, Adáptalo e Itera
Los agentes son como los aprendices, necesitan probarse, adaptarse y crecer mediante iteraciones. Como cualquier aprendiz humano, necesitan contexto, feedback y tiempo en el campo.
El Secreto
Todos somos antropólogos en esencia; el secreto de un buen agente radica en el perfecto entendimiento del contexto en el que actuará. En este orden de ideas, ponte el sombrero de antropólogo antes de construir tus agentes, trata de identificar los elementos que recrean el contexto para que tus agentes sean ganadores; es algo así como recrear la escenografía para filmar una película, mientras más cercana a la realidad, mejor, de lo contrario tu escenario de filmación lucirá barato y falto de profesionalismo. Todos los AIA operan al interior de sistemas de construcción de significado; es por eso que vale la pena agregar que el contexto no es técnico, sino cultural. Los humanos construimos relaciones de identidad a través de alinear nuestros valores éticos, lo cual requiere de un perfecto entendimiento de lo simbólico, derivando en interpretaciones personales de la sociedad, lo que a la vez genera narrativas. Bostrom hablaría de alineación; los antropólogos hablamos de sentido compartido.
Si no te pones el sombrero de antropólogo, tus agentes serán competentes, pero carecerán de sentido. Si usas el sombrero de antropólogo, tus agentes se tornarán en tus colaboradores e inclusive en compañeros de trabajo.
Recuerda que no estás cableando un chatbot, sino diseñando la arquitectura de una mente, un compañero de trabajo para tu futuro. Estás diseñando un puente entre el significado y la cognición artificial; con estas instrucciones ya tienes la brújula.










Gracias Gabriel por recordarnos que sin cultura, nuestros agentes son simples máquinas muy rápidas haciendo estupideces con estilo.
Me encantó la estructura de creación del agente. Curiosamente esta semana escribi una fórmula para crear un proyecto Cyborg que es la inclusión de un agente en el proceso. Cyborg = pregunta + flujo + herramienta + prompt . Tu entrada me ayuda mucho para estructurar cada bloque dentro de la fórmula.