Ce qu'est vraiment un agent IA (et ce qu'est un « chatbot avec un chapeau »)
Un agent IA, au sens technique strict, c'est un système qui combine un modèle de langage avec trois capacités supplémentaires : la capacité de décider quel outil utiliser selon le contexte, une mémoire persistante entre interactions et des mécanismes de mesure de son propre travail (evals). Tout système qui manque des trois n'est pas un agent — c'est un chatbot. La distinction n'est pas sémantique, elle est opérationnelle : les chatbots répondent, les agents exécutent.
Si le marché est rempli d'« agents » qui sont des chatbots avec un chapeau, c'est pour une raison commerciale : le mot « agent » vend mieux. Mais la différence se voit immédiatement en prod — un chatbot bien construit est utile ; un agent mal construit est une bombe. Connaître la différence avant de payer, c'est le meilleur investissement que tu peux faire en ce moment.
Les trois types d'agents qui comptent en entreprise
Tous les agents ne se valent pas — trois catégories couvrent 95% des cas utiles en entreprise. Les confondre te fait embaucher ce qu'il ne faut pas.
Agent commercial (AI SDR, lead routing)
Conçu pour des tâches commerciales : prospection automatisée, qualification de leads, routing d'opportunités. Le plus mesurable (ROI en réunions générées), le plus adopté par les boîtes à cycles de vente longs. Stack typique : domaines + warmup + scoring + séquences + intégration CRM.
Agent opérationnel (workforce, assistant interne)
Conçu pour des tâches internes répétitives : classement d'incoming, génération de brouillons, traitement documentaire. Mesure son succès en heures économisées/mois. Demande une intégration profonde avec les systèmes internes (ERP, ITSM, etc.).
Agent face client (support, commercial light)
Conçu pour l'interaction directe avec le client : support, FAQs, prise de rendez-vous. Le plus visible et, du coup, celui avec le plus gros risque réputationnel. Demande une supervision rigoureuse, une escalade humaine solide et des métriques de CSAT dès le premier jour.
L'architecture minimum : LLM, mémoire, outils, evals
Un agent sérieux se compose de quatre couches. Si ton prestataire ne sait pas les dessiner sur une serviette, il ne construit pas un agent — il te vend une étiquette.
- LLM de base — GPT-4 / Claude / Llama, selon la confidentialité, la latence et le coût.
- Mémoire — base vectorielle (Pinecone, Weaviate, pgvector) pour garder le contexte entre interactions + mémoire à court terme dans la conversation en cours.
- Outils (tools) — APIs, fonctions, recherche web, connexion à tes systèmes. L'agent décide lequel utiliser.
- Evals — set d'inputs représentatifs avec outputs attendus qui s'exécutent automatiquement après chaque changement.
Comment on « entraîne » un agent (non, ce n'est pas uploader un PDF)
Le mot « entraînement » est devenu flou. En 2026, « entraîner un agent » veut rarement dire fine-tuner le modèle — ça veut dire construire un bon système de RAG (retrieval-augmented generation), écrire un system prompt solide et configurer correctement les outils.
- Prompt engineering sérieux. Le system prompt définit qui est l'agent, ce qu'il peut faire, ce qu'il ne peut pas, quel ton il utilise et quand il escalade. C'est la pièce la plus sous-estimée et avec le meilleur ratio impact/coût.
- RAG sur ta base de connaissance. Structurer ta KB en blocs courts, générer des embeddings, configurer la récupération avec re-ranking.
- Configurer les outils. Pour chaque tool, définir quand l'utiliser, quels paramètres accepter, comment gérer les erreurs.
- Fine-tuning (uniquement si nécessaire). Quasi jamais. Seulement quand tu as besoin d'un ton ou d'un style très spécifique inaccessible par prompt, ou quand des contraintes de coût/latence justifient un modèle plus petit spécialisé.
Human-in-the-loop : pourquoi ce n'est pas optionnel
Human-in-the-loop (HITL) veut dire qu'un humain intervient à des checkpoints concrets du cycle de l'agent. Ce n'est PAS « un humain qui supervise tout, tout le temps » — c'est un humain aux points où le coût d'erreur dépasse celui de la pause. Sans HITL à ces endroits, l'agent est une expérience ; avec HITL, c'est un système.
- Décisions à fort impact (actions irréversibles, engageantes, à conséquences économiques ou légales).
- Cas de faible confiance du modèle (quand la probabilité de la réponse passe sous le seuil).
- Exceptions détectées (input hors des patterns attendus).
- Revue échantillonnée périodique du travail « routinier » pour détecter du drift systémique.
Combien ça coûte vraiment de construire et d'opérer un agent
| Coût | PME | Mid-market | Enterprise |
|---|---|---|---|
| Setup technique | 3.000-15.000 € | 15.000-75.000 € | 75.000-250.000 €+ |
| Opération mensuelle (LLM + infra) | 50-500 € | 500-2.500 € | 2.500-15.000 € |
| Supervision humaine (temps personne) | 5-15 h/mois | 20-50 h/mois | 50-200 h/mois |
| Itération mensuelle | Incluse en retainer 200-500 €/mois | 1.500-5.000 €/mois | 5.000-25.000 €/mois |
Quand OUI et quand NON créer un agent
| OUI créer un agent | NON créer un agent |
|---|---|
| Volume élevé et répétitif | Volume faible ou erratique |
| Input variable, décision simple | Input simple, décision complexe |
| Coût d'erreur faible ou réversible | Coût d'erreur élevé et irréversible |
| Un humain dispo pour superviser | Personne pour porter le système |
| Process stable à 12+ mois | Process en train de changer |
Document gratuit · PDF
Checklist de gouvernance pour agents IA en production
Les 4 couches obligatoires (HITL, logs, rollback, evals) expliquées pas à pas. Sans ça, un agent n'est pas un système — c'est une bombe.
Ce que tu reçois
- Checklist des 4 pièces critiques
- Template de politique d'usage par type d'agent
- Métriques de qualité par tâche (avec seuils)