Saltar para o conteúdo
Implementa.

Guia pillar · Criar um agente IA

Criar um agente IA: o guia que devias ter lido antes do primeiro protótipo

A maioria do que se vende como "agente IA" é um chatbot de chapéu. Um agente a sério faz três coisas que um chatbot não faz: decide que ferramenta usar, mantém memória entre interações e mede o próprio trabalho. Este guia existe para que saibas a diferença antes de pagar o primeiro protótipo.

O que é mesmo um agente IA (e o que é um "chatbot com chapéu")

Um agente IA, em sentido técnico estrito, é um sistema que combina um modelo de linguagem com três capacidades extra: capacidade de decidir que ferramenta usar consoante o contexto, memória persistente entre interações e mecanismos de medição do próprio trabalho (evals). Qualquer sistema a que falte uma destas três não é um agente — é um chatbot. A distinção não é semântica, é operativa: os chatbots respondem, os agentes executam.

A razão pela qual o mercado está cheio de "agentes" que são chatbots com chapéu é comercial: a palavra "agente" vende melhor. Mas a diferença nota-se de imediato em produção — um chatbot bem construído é útil; um agente mal construído é uma bomba. Conhecer a diferença antes de pagar é o melhor investimento que podes fazer agora.

Os três tipos de agentes que importam em empresa

Nem todos os agentes são iguais — três categorias cobrem 95% dos casos úteis em empresa. Confundi-las leva a contratar o que não devias.

Agente comercial (AI SDR, lead routing)

Desenhado para tarefas comerciais: prospeção automatizada, qualificação de leads, routing de oportunidades. O mais mensurável (ROI em reuniões geradas), o mais adotado por empresas com ciclos de venda longos. Stack típico: domínios + warmup + scoring + sequências + integração CRM.

Agente operativo (workforce, assistente interno)

Desenhado para tarefas internas repetitivas: classificação de incoming, geração de rascunhos, processamento documental. Mede o sucesso em horas poupadas/mês. Exige integração profunda com os sistemas internos (ERP, ITSM, etc.).

Agente virado para o cliente (apoio, comercial light)

Desenhado para interação direta com o cliente: apoio, FAQs, agendar reuniões. O mais visível e, por isso, o de maior risco reputacional. Exige supervisão rigorosa, escalado humano sólido e métricas de CSAT desde o dia um.

A arquitetura mínima: LLM, memória, ferramentas, evals

Um agente a sério compõe-se de quatro camadas. Se o teu fornecedor não as consegue desenhar num guardanapo, não está a construir um agente — está a vender-te uma etiqueta.

  1. LLM base — GPT-4 / Claude / Llama, conforme privacidade, latência e custo.
  2. Memória — base vetorial (Pinecone, Weaviate, pgvector) para manter contexto entre interações + memória de curto prazo na conversa atual.
  3. Ferramentas (tools) — APIs, funções, pesquisa web, ligação aos teus sistemas. O agente decide qual usar.
  4. Evals — conjunto de inputs representativos com outputs esperados que correm automaticamente após cada alteração.

Como se "treina" um agente (não, não é carregar um PDF)

O termo "treino" ficou confuso. Em 2026, "treinar um agente" raramente significa fazer fine-tuning ao modelo — significa construir um bom sistema de RAG (retrieval-augmented generation), escrever um system prompt sólido e configurar as ferramentas em condições.

  1. Prompt engineering a sério. O system prompt define quem é o agente, o que pode fazer, o que não pode, que tom usa e quando escala. É a peça mais subvalorizada e com melhor rácio impacto/custo.
  2. RAG sobre a tua base de conhecimento. Estruturar a KB em blocos curtos, gerar embeddings, configurar retrieval com re-ranking.
  3. Configurar ferramentas. Para cada tool, definir quando usá-la, que parâmetros aceita, como tratar erros.
  4. Fine-tuning (só se for mesmo preciso). Quase nunca é. Só quando precisas de um tom ou estilo muito específico que o prompt não atinge, ou quando há restrições de custo/latência que justificam um modelo mais pequeno especializado.

Human-in-the-loop: porque não é opcional

Human-in-the-loop (HITL) significa que um humano intervém em checkpoints concretos do ciclo do agente. NÃO é "humano a supervisionar tudo o tempo todo" — é humano nos pontos em que o custo do erro supera o custo da pausa. Sem HITL nesses pontos, o agente é uma experiência; com HITL, é um sistema.

  • Decisões de alto impacto (ações irreversíveis, vinculativas, com consequências económicas ou legais).
  • Casos de baixa confiança do modelo (quando a probabilidade da resposta cai abaixo do limiar).
  • Exceções detetadas (input fora dos padrões esperados).
  • Revisão amostrada periódica do trabalho "de rotina" para detetar drift sistémico.

Quanto custa mesmo construir e operar um agente

CustoPMEMid-marketEnterprise
Setup técnico3.000-15.000 €15.000-75.000 €75.000-250.000 €+
Operação mensal (LLM + infra)50-500 €500-2.500 €2.500-15.000 €
Supervisão humana (tempo pessoa)5-15 h/mês20-50 h/mês50-200 h/mês
Iteração mensalIncluído em retainer 200-500 €/mês1.500-5.000 €/mês5.000-25.000 €/mês

Quando SIM e quando NÃO criar um agente

SIM, cria agenteNÃO, não criar agente
Volume alto e repetitivoVolume baixo ou errático
Input variável, decisão simplesInput simples, decisão complexa
Custo de erro baixo ou reversívelCusto de erro alto e irreversível
Há humano disponível para supervisionarNinguém é dono do sistema
Processo estável a 12+ mesesProcesso a mudar

Material gratuito · PDF

Checklist de governance para agentes IA em produção

As 4 camadas obrigatórias (HITL, logs, rollback, evals) explicadas passo a passo. Sem isto, um agente não é um sistema — é uma bomba.

O que recebes

  • Checklist das 4 peças críticas
  • Modelo de política de uso por tipo de agente
  • Métricas de qualidade por tarefa (com limiares)

Perguntas frequentes

Para um básico não. Plataformas como n8n, Make AI, Voiceflow ou os Assistants da OpenAI permitem-te montar agentes funcionais sem código. Para agentes a sério — os que se integram com os teus sistemas reais, lidam com erros e são monitorizados — sim, precisas de alguém com perfil técnico, mesmo que não sejas tu. A linha entre "agente bonito de demo" e "agente que trabalha" atravessa-se com código.

Um agente básico (um assistente sobre a tua KB, um chatbot de suporte simples) pode estar numa semana. Um agente a sério — com integrações ao CRM, ferramentas, escalada humana e evals — entre 6 e 12 semanas. Qualquer fornecedor que te prometa "agente enterprise em 3 dias" está a vender-te demo de gravata.

Para prototipar: OpenAI Assistants (rápido, simples). Para produção no-code/low-code: n8n ou Make AI. Para sistemas complexos com orquestração a sério: LangChain ou LangGraph (precisas de dev). A escolha depende menos da plataforma e mais de quem vai operar o agente no dia-a-dia. Começa pelo mais simples que cubra o teu caso — podes sempre subir de camada.

Quatro peças: (1) política de uso clara — o que pode e o que não pode fazer; (2) logs auditáveis de cada decisão e ação; (3) human-in-the-loop para decisões críticas; (4) revisão periódica de comportamento (evals automáticas + revisão humana). Sem essas quatro, o agente é experiência, não sistema em produção.

Depende do sistema à volta. Bem desenhado: o agente deteta a incerteza, escala a humano e a situação resolve-se com pouco atrito. Mal desenhado: o agente executa a ação errada com toda a confiança e dás por isso quando um cliente se queixa. A qualidade de um agente não se mede quando acerta — mede-se quando duvida.

Lê-lo, ou pomo-lo a funcionar?

Este guia cobre a parte de pensar. A parte de implementar — e deixá-lo medido — é o que cobramos.

Criar um agente IA: o guia que devias ter lido antes do primeiro protótipo · Implementa