¿Qué pasa cuando una agencia no tiene seis empleados sino veinte agentes de IA especializados? No es una pregunta teórica -- es nuestra realidad diaria en StudioMeyer. Desde principios de 2026, operamos una Agent Fleet que escribe textos de marketing, analiza código, realiza investigaciones, incorpora clientes y se mejora a sí misma.
Este artículo muestra cómo construimos el sistema, la arquitectura detrás de él y lo que hemos aprendido en el camino.
¿Qué es una Agent Fleet?
Una Agent Fleet es un sistema de múltiples agentes de IA que trabajan como equipo. Cada agente tiene un rol claramente definido, sus propias herramientas y su propia memoria. En lugar de un chatbot genérico que hace todo de manera mediocre, hay especialistas -- exactamente como en un equipo real.
La diferencia crítica respecto a un solo asistente de IA: los agentes se comunican entre sí, delegan tareas y verifican mutuamente sus resultados.
Nuestras tres Fleets
Operamos tres Agent Fleets especializadas con más de 20 agentes en total:
StudioMeyer Fleet (16 Agentes)
La columna vertebral operativa. Estos agentes manejan el negocio diario:
- CEO Agent -- Orquesta a todos los demás agentes. Recibe tareas y delega al especialista correcto. No toma decisiones propias -- coordina.
- DevOps Agent -- Monitorea servidores, verifica la salud de contenedores, ejecuta despliegues.
- Marketing Agent -- Crea contenido para redes sociales, planifica campañas, gestiona pipelines de contenido.
- Sales Agent -- Califica leads, crea propuestas, mantiene datos del CRM.
- Onboarding Agent -- Guía a nuevos clientes a través del proceso de configuración.
- Support Agent -- Gestiona consultas de clientes y escala cuando es necesario.
- CRM Agent -- Administra contactos, rastrea interacciones, mantiene el pipeline.
- Analytics Agent -- Evalúa estadísticas web y genera informes.
- SEO Agent -- Monitorea rankings, verifica SEO técnico, rastrea visibilidad en IA.
Cada agente tiene herramientas exclusivas. El agente CRM accede al sistema CRM, el agente DevOps accede al monitoreo de servidores -- pero nunca al revés. Esto previene la dispersión de herramientas y mantiene las responsabilidades claras.
Nex Fleet (Investigación y Control de Calidad)
Nuestro laboratorio de innovación. Estos agentes piensan, analizan y cuestionan:
- Research Agent -- Investiga tecnologías, mercados y competidores. Verifica afirmaciones contra código real.
- Critic Agent -- Abogado del diablo. Cuestiona cada idea, cada informe, cada plan. Busca activamente debilidades.
- Analyst Agent -- Analiza calidad de código, arquitectura y salud del sistema en todos los proyectos.
La Nex Fleet tiene una propiedad especial: cada agente filtra su memoria por relevancia. El Research Agent recupera conocimiento semántico (hechos, arquitectura), mientras que el Critic solo recupera conocimiento episódico (errores, incidentes). Esto previene el sesgo de confirmación -- el Critic no se ve influenciado por memorias confirmatorias.
Social Fleet (Engagement en LinkedIn)
Cuatro agentes trabajando como pipeline:
- Research Agent -- Investiga personas y empresas, verifica afirmaciones contra nuestra base de código.
- Analyst Agent -- Escribe borradores con afirmaciones etiquetadas.
- Critic Agent -- Verificación de hechos, guardia de secretos (sin IPs internas, nombres de bases de datos o datos de clientes), poder de veto.
El pipeline funciona en dos fases: Research y Analyst trabajan en paralelo, luego el Critic revisa con autoridad de veto. Máximo dos revisiones, después se escala.
La arquitectura detrás
Agent SDK en lugar de CLI Spawning
Todos nuestros agentes corren sobre el Anthropic Agent SDK. Esto significa que cada agente es un proceso independiente con acceso completo a sus servidores MCP (Model Context Protocol), sus propias herramientas de memoria y límites configurables.
La ventaja sobre el simple spawning de procesos CLI: los agentes obtienen acceso MCP en proceso. Un sub-agente spawneado estaría ciego -- sin acceso a análisis de código, sin memoria, sin investigación web.
Memoria dedicada por agente
Cada agente tiene tablas de base de datos aisladas para su memoria. Nueve tablas por agente: Sessions, Decisions, Learnings, Patterns, Learning Links, Contradictions, Decision Links, Síntesis, Reflections.
Eso son más de 50 tablas solo para la Agent Fleet. Suena excesivo, pero tiene una ventaja crucial: ningún agente puede corromper la memoria de otro. Si el agente de Marketing almacena una conclusión falsa, no afecta al agente DevOps.
Cada agente tiene 22 herramientas de memoria disponibles:
- Núcleo: Aprender, recordar, cargar contexto
- Decisiones: Registrar, rastrear resultados, seguir cadenas de decisión
- Inteligencia: Detectar contradicciones, vincular aprendizajes, asignar recompensas
- Síntesis: Resumir insights, reconocer patrones
- Cross-Agent: Consultar conocimiento de otros agentes (con límites)
Neutrality Guard
Un problema común con agentes que tienen memoria: sesgo de confirmación. Cuando un agente Critic recupera confirmaciones pasadas ("esto funcionó la última vez"), se vuelve acrítico.
Nuestra solución: los Critics reciben solo errores y advertencias de la memoria, nunca confirmaciones. El Critic debe juzgar independientemente, no confiar en éxitos pasados.
Límites estrictos contra Memory Drift
La recuperación ilimitada de memoria suena genial pero lleva al memory drift: el agente pierde el enfoque en la tarea actual y se pierde en recuerdos antiguos.
Nuestros límites: máximo tres resultados de la propia memoria, máximo dos por agente para consultas cross-agent. La tarea actual siempre tiene prioridad sobre el contexto de memoria.
Darwin: Auto-mejora
Quizás la característica más interesante: nuestros agentes se mejoran a sí mismos. El sistema se llama Darwin y funciona así:
- Cada ejecución de agente se evalúa automáticamente (longitud, marcadores de alucinación, verificación de fuentes, estructura).
- Tres instancias paralelas de Sonnet puntúan el output (multi-critic).
- Basándose en las puntuaciones, los prompts se evolucionan automáticamente.
Esto corre invisible en segundo plano. Mismo workflow, mismos comandos -- pero la calidad mejora continuamente. Actualmente hemos ejecutado más de 280 experimentos a través de múltiples versiones de prompts.
Lo que hemos aprendido
La especialización vence al generalismo
Un agente que puede hacer todo no puede hacer nada bien. Nuestros mejores resultados vienen de agentes altamente especializados con pocas herramientas claramente definidas. El punto óptimo está entre 10 y 20 herramientas por agente.
La orquestación es clave
El CEO agent tiene cero herramientas propias. Su única habilidad: encargar tareas a otros agentes. Suena contraintuitivo, pero un orquestador sin agenda propia toma mejores decisiones de delegación.
La memoria necesita higiene
Almacenar más no significa recordar mejor. Tuvimos que aprender que un sistema de control de admisión (como en una base de datos) es más importante que la capacidad de almacenamiento. Cinco factores determinan si un aprendizaje se almacena: novedad, especificidad, fiabilidad de la fuente, consistencia y relevancia.
Máximo tres agentes en paralelo
Ejecutar más de tres agentes simultáneamente lleva a pérdida de contexto y problemas de coordinación. Tres en paralelo, expandir secuencialmente -- ese es nuestro patrón probado.
Resultados
Después de tres meses con la Agent Fleet:
- Más de 275 aprendizajes almacenados de ejecuciones de agentes
- 88 sesiones completadas
- 29 decisiones documentadas
- Más de 40 informes de investigación
- Mejora continua a través de Darwin
La Agent Fleet ya no es un experimento. Es un sistema productivo que acelera y mejora nuestro trabajo cada día.
Conclusión
Construir una Agent Fleet no es un proyecto de fin de semana. Requiere decisiones arquitectónicas claras: memorias aisladas, herramientas exclusivas, límites estrictos contra el drift y un patrón de orquestación que separa la delegación de la ejecución.
Pero una vez que el sistema está en su lugar, transforma la forma en que opera una agencia. No porque la IA reemplace a los humanos -- sino porque agentes especializados manejan el trabajo rutinario, liberando a las personas para enfocarse en lo que realmente importa: creatividad, estrategia y relaciones con clientes.
