Como automatizar o suporte com IA: deflexão real, não demo

Automatizar o suporte com IA não é montar um chatbot e rezar. É decidir quantos tickets podes razoavelmente refletir, montar o sistema que os reflete e construir a ponte humana para o resto. O sucesso mede-se em deflexão real, não em cliques.

Deflexão real vs. deflexão inflacionada (como te enganam os números)

Quando alguém te diz "deflectimos 70% dos tickets", a pergunta certa não é "que bom", é "como o medem". A deflexão inflacionada é a armadilha mais comum do sector — e é trivial de detetar se sabes o que procurar:

Deflexão inflacionada	Deflexão real
Conversas que o bot iniciou	Tickets que se teriam escalado e não escalaram
Clientes que fecharam por silêncio	Clientes que confirmaram a resolução
% sobre todas as interações	% sobre tickets que exigiam resposta substantiva
Sem CSAT pós-interação	Com CSAT pós-interação (>4/5)

Os 4 componentes: KB, agente, routing, supervisão

Base de conhecimento (KB). Estruturada, versionada, com metadados. Sem KB sólida, todo o resto falha.
Agente. O LLM que responde, com system prompt claro sobre âmbito, tom e limites.
Routing. O sistema que decide quando escalar a humano e lhe entrega o contexto resumido.
Supervisão. Revisão humana semanal de casos limite + iteração contínua da KB e do agente.

Como se treina o agente (não é "carregas um PDF")

Treinar o agente não é carregar um PDF — é construir um bom sistema de RAG (Retrieval-Augmented Generation) que recupere a informação relevante da tua KB e a passe ao modelo para a usar. O "treino" no sentido clássico (fine-tuning) quase nunca acrescenta mais do que um bom prompt + bom RAG.

Estrutura a tua KB em blocos curtos e autocontidos com metadados (tema, data, fonte).
Cria embeddings desses blocos com um modelo apropriado (OpenAI ada ou equivalente open-source).
Configura o retrieval: quantos blocos recuperar por consulta, limiar de similaridade, re-ranking.
Escreve o system prompt com instruções claras sobre como usar o contexto recuperado.
Configura a escalada: em que casos NÃO deve responder e deve passar a humano.

O ciclo de melhoria contínua

O suporte IA não é "deixas montado e logo se vê". É um ciclo semanal de melhoria com quatro passos:

Revisão semanal de casos limite. O humano supervisor analisa 30-50 conversas aleatórias e marca acertos/erros.
Atualização da KB. As perguntas novas ou mal respondidas documentam-se corretamente.
Ajuste do agente. Os erros sistémicos corrigem-se mexendo no prompt ou no routing.
Evals automáticas. Um conjunto de inputs representativos corre depois de cada alteração para detetar regressões.

Custos, SLAs e quando não compensa

Tamanho	Custo setup	Custo mensal	Volume mínimo razoável
PME self-serve	Incluído	79-149 €/mês	200+ tickets/mês repetitivos
PME custom	3.000-8.000 €	200-500 €/mês	500+ tickets/mês
Mid-market	8.000-25.000 €	1.500-5.000 €/mês	2.000+ tickets/mês
Enterprise	Desde 25.000 €	5.000+ €/mês	10.000+ tickets/mês

Perguntas frequentes

Self-serve, com a tua FAQ e KB: 24-48h para teres algo a responder. Versão séria, integrada com Zendesk/Intercom e treinada sobre histórico de tickets: 3-6 semanas até produção. Qualquer fornecedor que te prometa "agente treinado para o teu negócio numa hora" está a vender demo, não produto.

O agente IA NÃO negoceia. Ponto. Qualquer tentativa de pedir desconto, condições especiais ou reclamação escala automaticamente a humano com todo o contexto resumido. É a regra principal: o agente gere o previsível; o que precisa de critério comercial passa a uma pessoa. Sem essa regra, metes-te em problemas legais e comerciais reais.

Sim, melhor do que parece. Os LLM modernos lidam com multi-idioma nativamente: o agente deteta o idioma do cliente e responde no mesmo, sem teres de manter duas KBs separadas. A exceção são idiomas com pouca presença nos dados de treino — aí a qualidade desce.