McKinsey dice que el 73% de las empresas grandes está "implementando IA". La realidad es que casi nadie tiene un agente funcionando con SLA en producción. Estos son los 7 antipatterns que vemos repetirse en cada proyecto zombi.
1. Empezar por la tecnología, no por el proceso
El comité de dirección decide "necesitamos agentes IA" antes de identificar qué proceso concreto va a mejorar. Resultado: 6 meses de POC con LangChain sin saber qué métrica debería moverse.
2. Construir el primer agente como un monolito
Equipos que diseñan "un agente" que hace 14 cosas distintas. Imposible de mantener, imposible de debuggear, imposible de evaluar. Cada cambio rompe algo distinto.
El fix: cada agente hace UNA cosa bien. Los orquestas con una capa fina por encima.
3. No tener evals desde el día 1
Sin un dataset de evaluación con criterios claros, no sabes si un cambio de prompt mejora o empeora. Estás navegando a ojo.
El fix: 30-50 ejemplos reales con respuesta esperada, automatizados en CI. Cualquier cambio se mide contra ese baseline.
4. Usar el modelo más caro porque "es mejor"
GPT-4o para tareas que Claude Haiku resuelve igual de bien a 1/10 del precio. La factura crece, el margen se evapora.
El fix: routing entre modelos por tipo de tarea. El 80% de queries van al modelo barato; el 20% complejo al caro.
5. Sin observability = sin futuro
No saber qué porcentaje de respuestas el agente "rechaza", qué pasa con los timeouts, qué cuesta cada interacción. Si no lo mides, no lo puedes gobernar.
El fix: Langfuse, Helicone o equivalente desde el primer commit. Coste, latencia, error rate, calidad — todo en un dashboard.
6. Confiar el output sin guardrails
El agente puede decir cualquier cosa al cliente. Cualquier cosa. Sin validación estructurada, alucinaciones llegan a producción y se descubren cuando el cliente reclama.
El fix: structured outputs siempre que se pueda + validación con esquema + fallback a humano cuando hay incertidumbre alta.
7. Lanzarlo y olvidarlo
La organización celebra el "go live" y desmonta el equipo. A los 3 meses el agente da respuestas obsoletas, el coste por token subió un 40%, y nadie sabe ni cómo desplegar una mejora.
El fix: operación continua con review trimestral. Es un sistema vivo, no un proyecto que se cierra.