A McKinsey diz que 73% das grandes empresas está "a implementar IA". A realidade é que quase ninguém tem um agente a funcionar com SLA em produção. Estes são os 7 antipatterns que vemos repetir-se em cada projeto zombie.
1. Começar pela tecnologia, não pelo processo
A comissão executiva decide "precisamos de agentes IA" antes de identificar que processo concreto vai melhorar. Resultado: 6 meses de POC com LangChain sem saber que métrica devia mexer-se.
2. Construir o primeiro agente como um monolito
Equipas que desenham "um agente" que faz 14 coisas diferentes. Impossível de manter, impossível de debugar, impossível de avaliar. Cada alteração parte algo diferente.
O fix: cada agente faz UMA coisa bem. Orquestras-os com uma camada fina por cima.
3. Não ter evals desde o dia 1
Sem um dataset de avaliação com critérios claros, não sabes se uma alteração de prompt melhora ou piora. Estás a navegar a olho.
O fix: 30-50 exemplos reais com resposta esperada, automatizados em CI. Qualquer alteração mede-se contra esse baseline.
4. Usar o modelo mais caro porque "é melhor"
GPT-4o para tarefas que o Claude Haiku resolve igualmente bem a 1/10 do preço. A fatura cresce, a margem evapora-se.
O fix: routing entre modelos por tipo de tarefa. 80% das queries vão para o modelo barato; os 20% complexos para o caro.
5. Sem observability = sem futuro
Não saber que percentagem de respostas o agente "rejeita", o que acontece com os timeouts, quanto custa cada interação. Se não o medes, não o governas.
O fix: Langfuse, Helicone ou equivalente desde o primeiro commit. Custo, latência, error rate, qualidade — tudo num dashboard.
6. Confiar no output sem guardrails
O agente pode dizer qualquer coisa ao cliente. Qualquer coisa. Sem validação estruturada, as alucinações chegam à produção e descobrem-se quando o cliente reclama.
O fix: structured outputs sempre que possível + validação com schema + fallback para humano quando há incerteza alta.
7. Lançar e esquecer
A organização celebra o "go live" e desmonta a equipa. Ao fim de 3 meses, o agente dá respostas obsoletas, o custo por token subiu 40% e ninguém sabe sequer como fazer deploy de uma melhoria.
O fix: operação contínua com review trimestral. É um sistema vivo, não um projeto que se fecha.