Ce qu'on peut vraiment défléchir (% par catégorie de demande)
La déflexion honnête, ce n'est pas « 60% de tickets disparaissent par magie ». C'est la combinaison de trois taux distincts, chacun avec son plafond réaliste :
| Catégorie de demande | % défléchissable bien conçu | Commentaire |
|---|---|---|
| FAQ opérationnelles (horaires, politiques, livraisons) | 70-90% | Le terrain le plus facile |
| Demandes produit (info, comparatifs) | 50-70% | Dépend de la qualité de ta KB |
| Résolution d'incidents techniques | 30-50% | Seulement si le système escalade bien |
| Plaintes et réclamations | <15% | Mieux vaut toujours escalader à humain |
| Retours et remboursements | 20-40% | Risque légal — supervision clé |
Les 3 erreurs qui plombent le ROI
- Base de connaissance faible. Si ta KB est petite, dépassée ou incohérente, l'agent répond mal et la confiance du client tombe vite. La KB doit être le premier chantier, pas le dernier.
- Escalade humaine mal conçue. Quand l'agent ne sait pas, il doit passer la main à un humain AVEC contexte complet. S'il passe « le client veut un truc » sans plus, l'équipe support déteste le système en une semaine.
- Sans mesure du CSAT. Sans mesurer la satisfaction avant et après, tu ne sais pas si tu as économisé des heures ou cassé l'expérience. Et un client perdu coûte plus cher que dix tickets économisés.
Architecture : base de connaissance + RAG + agent + routing humain
Un système de support IA sérieux se compose de quatre couches, pas d'une. L'erreur, c'est de vendre « l'agent » comme si c'était une seule pièce.
- Base de connaissance (KB) structurée. Ce n'est pas « uploader le PDF de FAQ » ; c'est du contenu propre, versionné, avec des métadonnées.
- RAG (Retrieval-Augmented Generation). Le système qui cherche dans ta KB ce qui est pertinent pour chaque demande et le passe à l'agent comme contexte.
- Agent conversationnel. Le LLM qui répond, avec des instructions (system prompt) claires sur le ton, les limites et le moment où escalader.
- Couche de routing humain. Le système qui décide quand passer à une personne et lui transmet le contexte résumé pour qu'elle puisse continuer sans que le client répète.
Stack recommandé par taille d'entreprise
| Taille | Stack | Coût mensuel approx. |
|---|---|---|
| PME / startup | Support IA Implementa (79-149 €/mois) ou Intercom Fin | 80-300 €/mois |
| Mid-market | Zendesk + agent IA + RAG sur ta KB | 1.500-5.000 €/mois |
| Enterprise | Plateforme propre ou Salesforce + RAG sur historique | 8.000-25.000 €/mois |
Comment mesurer CSAT et déflexion sans te mentir
Quatre métriques critiques qui doivent être dans le dashboard dès le jour un :
- Taux de déflexion réel — % de tickets résolus sans intervention humaine. Piège : ne compte pas comme « défléchi » un ticket fermé par silence du client.
- CSAT pré et post — Net Promoter Score ou équivalent, idéalement par catégorie de demande.
- Temps moyen de résolution — avant vs. après l'agent, en séparant par canal.
- Taux d'escalade propre — % de tickets passés à humain AVEC contexte vs. sans contexte. Si la seconde n'est pas à zéro, il y a du design à corriger.
Timeline réaliste et coût
| Phase | Durée | Coût |
|---|---|---|
| Self-serve PME | 24-48h setup | 79-149 €/mois |
| PME avec custom (KB importante) | 2-4 semaines | 3.000-8.000 € setup + 200-500 €/mois |
| Mid-market intégré (Zendesk/Intercom) | 4-8 semaines | 8.000-25.000 € setup + 1.500-5.000 €/mois |
| Enterprise avec historique | 8-16 semaines | À partir de 25.000 € |