Deflexão real vs. deflexão inflacionada (como te enganam os números)
Quando alguém te diz "deflectimos 70% dos tickets", a pergunta certa não é "que bom", é "como o medem". A deflexão inflacionada é a armadilha mais comum do sector — e é trivial de detetar se sabes o que procurar:
| Deflexão inflacionada | Deflexão real |
|---|---|
| Conversas que o bot iniciou | Tickets que se teriam escalado e não escalaram |
| Clientes que fecharam por silêncio | Clientes que confirmaram a resolução |
| % sobre todas as interações | % sobre tickets que exigiam resposta substantiva |
| Sem CSAT pós-interação | Com CSAT pós-interação (>4/5) |
Os 4 componentes: KB, agente, routing, supervisão
- Base de conhecimento (KB). Estruturada, versionada, com metadados. Sem KB sólida, todo o resto falha.
- Agente. O LLM que responde, com system prompt claro sobre âmbito, tom e limites.
- Routing. O sistema que decide quando escalar a humano e lhe entrega o contexto resumido.
- Supervisão. Revisão humana semanal de casos limite + iteração contínua da KB e do agente.
Como se treina o agente (não é "carregas um PDF")
Treinar o agente não é carregar um PDF — é construir um bom sistema de RAG (Retrieval-Augmented Generation) que recupere a informação relevante da tua KB e a passe ao modelo para a usar. O "treino" no sentido clássico (fine-tuning) quase nunca acrescenta mais do que um bom prompt + bom RAG.
- Estrutura a tua KB em blocos curtos e autocontidos com metadados (tema, data, fonte).
- Cria embeddings desses blocos com um modelo apropriado (OpenAI ada ou equivalente open-source).
- Configura o retrieval: quantos blocos recuperar por consulta, limiar de similaridade, re-ranking.
- Escreve o system prompt com instruções claras sobre como usar o contexto recuperado.
- Configura a escalada: em que casos NÃO deve responder e deve passar a humano.
O ciclo de melhoria contínua
O suporte IA não é "deixas montado e logo se vê". É um ciclo semanal de melhoria com quatro passos:
- Revisão semanal de casos limite. O humano supervisor analisa 30-50 conversas aleatórias e marca acertos/erros.
- Atualização da KB. As perguntas novas ou mal respondidas documentam-se corretamente.
- Ajuste do agente. Os erros sistémicos corrigem-se mexendo no prompt ou no routing.
- Evals automáticas. Um conjunto de inputs representativos corre depois de cada alteração para detetar regressões.
Custos, SLAs e quando não compensa
| Tamanho | Custo setup | Custo mensal | Volume mínimo razoável |
|---|---|---|---|
| PME self-serve | Incluído | 79-149 €/mês | 200+ tickets/mês repetitivos |
| PME custom | 3.000-8.000 € | 200-500 €/mês | 500+ tickets/mês |
| Mid-market | 8.000-25.000 € | 1.500-5.000 €/mês | 2.000+ tickets/mês |
| Enterprise | Desde 25.000 € | 5.000+ €/mês | 10.000+ tickets/mês |