O que é mesmo um agente IA (e o que é um "chatbot com chapéu")
Um agente IA, em sentido técnico estrito, é um sistema que combina um modelo de linguagem com três capacidades extra: capacidade de decidir que ferramenta usar consoante o contexto, memória persistente entre interações e mecanismos de medição do próprio trabalho (evals). Qualquer sistema a que falte uma destas três não é um agente — é um chatbot. A distinção não é semântica, é operativa: os chatbots respondem, os agentes executam.
A razão pela qual o mercado está cheio de "agentes" que são chatbots com chapéu é comercial: a palavra "agente" vende melhor. Mas a diferença nota-se de imediato em produção — um chatbot bem construído é útil; um agente mal construído é uma bomba. Conhecer a diferença antes de pagar é o melhor investimento que podes fazer agora.
Os três tipos de agentes que importam em empresa
Nem todos os agentes são iguais — três categorias cobrem 95% dos casos úteis em empresa. Confundi-las leva a contratar o que não devias.
Agente comercial (AI SDR, lead routing)
Desenhado para tarefas comerciais: prospeção automatizada, qualificação de leads, routing de oportunidades. O mais mensurável (ROI em reuniões geradas), o mais adotado por empresas com ciclos de venda longos. Stack típico: domínios + warmup + scoring + sequências + integração CRM.
Agente operativo (workforce, assistente interno)
Desenhado para tarefas internas repetitivas: classificação de incoming, geração de rascunhos, processamento documental. Mede o sucesso em horas poupadas/mês. Exige integração profunda com os sistemas internos (ERP, ITSM, etc.).
Agente virado para o cliente (apoio, comercial light)
Desenhado para interação direta com o cliente: apoio, FAQs, agendar reuniões. O mais visível e, por isso, o de maior risco reputacional. Exige supervisão rigorosa, escalado humano sólido e métricas de CSAT desde o dia um.
A arquitetura mínima: LLM, memória, ferramentas, evals
Um agente a sério compõe-se de quatro camadas. Se o teu fornecedor não as consegue desenhar num guardanapo, não está a construir um agente — está a vender-te uma etiqueta.
- LLM base — GPT-4 / Claude / Llama, conforme privacidade, latência e custo.
- Memória — base vetorial (Pinecone, Weaviate, pgvector) para manter contexto entre interações + memória de curto prazo na conversa atual.
- Ferramentas (tools) — APIs, funções, pesquisa web, ligação aos teus sistemas. O agente decide qual usar.
- Evals — conjunto de inputs representativos com outputs esperados que correm automaticamente após cada alteração.
Como se "treina" um agente (não, não é carregar um PDF)
O termo "treino" ficou confuso. Em 2026, "treinar um agente" raramente significa fazer fine-tuning ao modelo — significa construir um bom sistema de RAG (retrieval-augmented generation), escrever um system prompt sólido e configurar as ferramentas em condições.
- Prompt engineering a sério. O system prompt define quem é o agente, o que pode fazer, o que não pode, que tom usa e quando escala. É a peça mais subvalorizada e com melhor rácio impacto/custo.
- RAG sobre a tua base de conhecimento. Estruturar a KB em blocos curtos, gerar embeddings, configurar retrieval com re-ranking.
- Configurar ferramentas. Para cada tool, definir quando usá-la, que parâmetros aceita, como tratar erros.
- Fine-tuning (só se for mesmo preciso). Quase nunca é. Só quando precisas de um tom ou estilo muito específico que o prompt não atinge, ou quando há restrições de custo/latência que justificam um modelo mais pequeno especializado.
Human-in-the-loop: porque não é opcional
Human-in-the-loop (HITL) significa que um humano intervém em checkpoints concretos do ciclo do agente. NÃO é "humano a supervisionar tudo o tempo todo" — é humano nos pontos em que o custo do erro supera o custo da pausa. Sem HITL nesses pontos, o agente é uma experiência; com HITL, é um sistema.
- Decisões de alto impacto (ações irreversíveis, vinculativas, com consequências económicas ou legais).
- Casos de baixa confiança do modelo (quando a probabilidade da resposta cai abaixo do limiar).
- Exceções detetadas (input fora dos padrões esperados).
- Revisão amostrada periódica do trabalho "de rotina" para detetar drift sistémico.
Quanto custa mesmo construir e operar um agente
| Custo | PME | Mid-market | Enterprise |
|---|---|---|---|
| Setup técnico | 3.000-15.000 € | 15.000-75.000 € | 75.000-250.000 €+ |
| Operação mensal (LLM + infra) | 50-500 € | 500-2.500 € | 2.500-15.000 € |
| Supervisão humana (tempo pessoa) | 5-15 h/mês | 20-50 h/mês | 50-200 h/mês |
| Iteração mensal | Incluído em retainer 200-500 €/mês | 1.500-5.000 €/mês | 5.000-25.000 €/mês |
Quando SIM e quando NÃO criar um agente
| SIM, cria agente | NÃO, não criar agente |
|---|---|
| Volume alto e repetitivo | Volume baixo ou errático |
| Input variável, decisão simples | Input simples, decisão complexa |
| Custo de erro baixo ou reversível | Custo de erro alto e irreversível |
| Há humano disponível para supervisionar | Ninguém é dono do sistema |
| Processo estável a 12+ meses | Processo a mudar |
Material gratuito · PDF
Checklist de governance para agentes IA em produção
As 4 camadas obrigatórias (HITL, logs, rollback, evals) explicadas passo a passo. Sem isto, um agente não é um sistema — é uma bomba.
O que recebes
- Checklist das 4 peças críticas
- Modelo de política de uso por tipo de agente
- Métricas de qualidade por tarefa (com limiares)