O que se pode deflectir realmente (% por categoria de consulta)
A deflexão honesta não é "60% dos tickets desaparecem magicamente". É a combinação de três taxas distintas, cada uma com o seu tecto realista:
| Categoria de consulta | % deflectível bem desenhado | Comentário |
|---|---|---|
| FAQs operacionais (horários, políticas, envios) | 70-90% | O terreno mais fácil |
| Consultas de produto (info, comparativos) | 50-70% | Depende da qualidade da tua KB |
| Resolução de incidências técnicas | 30-50% | Só se o sistema escalar bem |
| Queixas e reclamações | <15% | Melhor escalar sempre a humano |
| Devoluções e reembolsos | 20-40% | Risco legal — supervisão chave |
Os 3 erros que afundam o ROI
- Base de conhecimento fraca. Se a tua KB é pequena, desatualizada ou incoerente, o agente responde mal e a confiança do cliente cai depressa. A KB tem de ser o primeiro trabalho, não o último.
- Escalada humana mal desenhada. Quando o agente não sabe, deve passar a humano COM contexto completo. Se passa "o cliente quer alguma coisa" sem mais, a equipa de suporte odeia o sistema numa semana.
- Sem medição de CSAT. Sem medir satisfação antes e depois, não sabes se poupaste horas ou destruíste a experiência. E um cliente perdido custa mais do que dez tickets poupados.
Arquitetura: base de conhecimento + RAG + agente + routing humano
Um sistema de suporte IA a sério compõe-se de quatro camadas, não de uma. O erro é vender "o agente" como se fosse uma só peça.
- Base de conhecimento (KB) estruturada. Não é "carregar o PDF das FAQ"; é conteúdo limpo, versionado, com metadados.
- RAG (Retrieval-Augmented Generation). O sistema que procura na tua KB o que é relevante para cada consulta e o passa ao agente como contexto.
- Agente conversacional. O LLM que responde, com instruções (system prompt) claras sobre tom, limites e quando escalar.
- Camada de routing humano. O sistema que decide quando passar a pessoa e lhe entrega o contexto resumido para que possa continuar sem o cliente repetir.
Stack recomendado por tamanho de empresa
| Tamanho | Stack | Custo mensal aprox. |
|---|---|---|
| PME / startup | Suporte IA Implementa (79-149 €/mês) ou Intercom Fin | 80-300 €/mês |
| Mid-market | Zendesk + agente IA + RAG sobre a tua KB | 1.500-5.000 €/mês |
| Enterprise | Plataforma própria ou Salesforce + RAG sobre histórico | 8.000-25.000 €/mês |
Como medir CSAT e deflexão sem te enganares
Quatro métricas críticas que têm de estar no dashboard desde o dia um:
- Taxa de deflexão real — % de tickets resolvidos sem intervenção humana. Armadilha: não contes como "deflectido" um ticket que fechou por silêncio do cliente.
- CSAT pré e pós — Net Promoter Score ou equivalente, idealmente por categoria de consulta.
- Tempo médio de resolução — antes vs. depois do agente, separando por canal.
- Taxa de escalada limpa — % de tickets passados a humano COM contexto vs. sem contexto. Se a segunda não é zero, há desenho para arranjar.
Timeline realista e custo
| Fase | Duração | Custo |
|---|---|---|
| Self-serve PME | 24-48h setup | 79-149 €/mês |
| PME com custom (KB grande) | 2-4 semanas | 3.000-8.000 € setup + 200-500 €/mês |
| Mid-market integrado (Zendesk/Intercom) | 4-8 semanas | 8.000-25.000 € setup + 1.500-5.000 €/mês |
| Enterprise com histórico | 8-16 semanas | Desde 25.000 € |