Comment créer un chatbot IA qui ne soit pas un « chatbot avec un chapeau »
Créer un chatbot IA en 2026 ce n'est plus monter une boîte de questions-réponses. C'est décider si tu veux un chatbot « marketing » (répond ce que tu as écrit), un « support » (RAG sur ta base de connaissance) ou un « agent » (décide et exécute des actions). Les trois options ont architecture et prix différents.
Répond avec des réponses que tu as écrites en amont
Petit site, FAQs stables, budget faible
Support (RAG)
Récupère l'info de ta KB et répond avec contexte
Support avec KB solide, >500 tickets/mois répétitifs
Agent
Décide et exécute des actions (pas juste répondre)
Process complexes, intégration avec les systèmes
Architecture RAG pas à pas
Structure ta KB. Blocs courts (200-400 mots), autonomes, avec metadata.
Génère les embeddings. Convertis chaque bloc en vecteur avec un modèle (ada d'OpenAI ou équivalent).
Stocke en base vectorielle. Pinecone, Weaviate, pgvector selon l'échelle et le budget.
Configure la récupération. Pour chaque requête : récupérer les k blocs les plus similaires, re-ranker, filtrer par metadata si pertinent.
Passe le contexte au LLM. Le LLM reçoit le contexte récupéré + le prompt de l'utilisateur + le system prompt.
Rends la réponse avec citation de la source (optionnel mais recommandé).
Quand le chatbot doit passer la main à un humain (critères)
Faible confiance du modèle (probabilité de la réponse sous le seuil).
Cas détectés comme sensibles (réclamations, plaintes, demandes de remise).
Demande explicite de l'utilisateur (« je veux parler à une personne »).
Nombre de tours sans résolution — après 5-6 messages sans avancer, escalade.
Détection de frustration — keywords comme « ça marche pas », « j'en ai marre ».
Mesurer CSAT et déflexion sans te mentir à toi-même
Pareil qu'en support : la déflexion gonflée, c'est le piège. Mesure :
Tickets résolus sans escalade avec confirmation de résolution.
CSAT post-interaction (>4/5 sain).
Taux d'escalade propre (toute escalade doit emporter le contexte).
Comparatif CSAT avant vs. après le chatbot.
Stacks recommandés (self-serve, mid, enterprise)
Taille
Stack
Coût mensuel
Self-serve
Implementa Support IA, Intercom Fin, Chatbase
79-300 €/mois
Mid-market
Zendesk + RAG custom + intégration
1.500-5.000 €/mois
Enterprise
Plateforme maison ou Salesforce + agent custom
5.000-25.000 €/mois
Questions fréquentes
Si tu reçois moins de 100 visites/jour, ça ne rentabilise probablement pas l'effort de setup (tu mets plus de temps à le configurer que tu n'en gagnes). À partir de 500-1.000 visites/jour avec un trafic qualifié, oui — et beaucoup. La métrique honnête ce n'est pas « trafic » mais « requêtes répétitives/mois » : plus de 50, ça vaut le coup.
Self-serve : 0€ en plus de l'abonnement (79-149€/mois chez Implementa). Self-hosted avec ta KB : 0€ de licence, ~20-50€/mois en tokens LLM pour un volume raisonnable. Le vrai boulot c'est la mise à jour du contenu — ça prend 2-4 heures/mois à un humain pour que ça ne se périme pas. C'est un coût caché.
Oui, les LLM modernes gèrent le multi-langue sans effort supplémentaire. Considération : ta KB doit être dans au moins une langue bien écrite (mieux en anglais ou espagnol/français neutre). Si ton contenu source est de basse qualité, les problèmes se répliquent dans toutes les langues — il les amplifie, ne les résout pas.
Tu le lis, ou on le met en prod ?
Le guide couvre le quoi et le pourquoi. Le mettre en production — c'est ce qu'on facture.