Aller au contenu
Implementa.

Guide pilier · Créer un agent IA

Créer un agent IA : le guide que tu aurais dû lire avant le premier prototype

La majorité de ce qui se vend comme « agent IA » c'est un chatbot avec un chapeau. Un vrai agent fait trois choses qu'un chatbot ne fait pas : décide quel outil utiliser, garde de la mémoire entre interactions et mesure son propre travail. Ce guide est là pour que tu connaisses la différence avant de payer le premier prototype.

Ce qu'est vraiment un agent IA (et ce qu'est un « chatbot avec un chapeau »)

Un agent IA, au sens technique strict, c'est un système qui combine un modèle de langage avec trois capacités supplémentaires : la capacité de décider quel outil utiliser selon le contexte, une mémoire persistante entre interactions et des mécanismes de mesure de son propre travail (evals). Tout système qui manque des trois n'est pas un agent — c'est un chatbot. La distinction n'est pas sémantique, elle est opérationnelle : les chatbots répondent, les agents exécutent.

Si le marché est rempli d'« agents » qui sont des chatbots avec un chapeau, c'est pour une raison commerciale : le mot « agent » vend mieux. Mais la différence se voit immédiatement en prod — un chatbot bien construit est utile ; un agent mal construit est une bombe. Connaître la différence avant de payer, c'est le meilleur investissement que tu peux faire en ce moment.

Les trois types d'agents qui comptent en entreprise

Tous les agents ne se valent pas — trois catégories couvrent 95% des cas utiles en entreprise. Les confondre te fait embaucher ce qu'il ne faut pas.

Agent commercial (AI SDR, lead routing)

Conçu pour des tâches commerciales : prospection automatisée, qualification de leads, routing d'opportunités. Le plus mesurable (ROI en réunions générées), le plus adopté par les boîtes à cycles de vente longs. Stack typique : domaines + warmup + scoring + séquences + intégration CRM.

Agent opérationnel (workforce, assistant interne)

Conçu pour des tâches internes répétitives : classement d'incoming, génération de brouillons, traitement documentaire. Mesure son succès en heures économisées/mois. Demande une intégration profonde avec les systèmes internes (ERP, ITSM, etc.).

Agent face client (support, commercial light)

Conçu pour l'interaction directe avec le client : support, FAQs, prise de rendez-vous. Le plus visible et, du coup, celui avec le plus gros risque réputationnel. Demande une supervision rigoureuse, une escalade humaine solide et des métriques de CSAT dès le premier jour.

L'architecture minimum : LLM, mémoire, outils, evals

Un agent sérieux se compose de quatre couches. Si ton prestataire ne sait pas les dessiner sur une serviette, il ne construit pas un agent — il te vend une étiquette.

  1. LLM de base — GPT-4 / Claude / Llama, selon la confidentialité, la latence et le coût.
  2. Mémoire — base vectorielle (Pinecone, Weaviate, pgvector) pour garder le contexte entre interactions + mémoire à court terme dans la conversation en cours.
  3. Outils (tools) — APIs, fonctions, recherche web, connexion à tes systèmes. L'agent décide lequel utiliser.
  4. Evals — set d'inputs représentatifs avec outputs attendus qui s'exécutent automatiquement après chaque changement.

Comment on « entraîne » un agent (non, ce n'est pas uploader un PDF)

Le mot « entraînement » est devenu flou. En 2026, « entraîner un agent » veut rarement dire fine-tuner le modèle — ça veut dire construire un bon système de RAG (retrieval-augmented generation), écrire un system prompt solide et configurer correctement les outils.

  1. Prompt engineering sérieux. Le system prompt définit qui est l'agent, ce qu'il peut faire, ce qu'il ne peut pas, quel ton il utilise et quand il escalade. C'est la pièce la plus sous-estimée et avec le meilleur ratio impact/coût.
  2. RAG sur ta base de connaissance. Structurer ta KB en blocs courts, générer des embeddings, configurer la récupération avec re-ranking.
  3. Configurer les outils. Pour chaque tool, définir quand l'utiliser, quels paramètres accepter, comment gérer les erreurs.
  4. Fine-tuning (uniquement si nécessaire). Quasi jamais. Seulement quand tu as besoin d'un ton ou d'un style très spécifique inaccessible par prompt, ou quand des contraintes de coût/latence justifient un modèle plus petit spécialisé.

Human-in-the-loop : pourquoi ce n'est pas optionnel

Human-in-the-loop (HITL) veut dire qu'un humain intervient à des checkpoints concrets du cycle de l'agent. Ce n'est PAS « un humain qui supervise tout, tout le temps » — c'est un humain aux points où le coût d'erreur dépasse celui de la pause. Sans HITL à ces endroits, l'agent est une expérience ; avec HITL, c'est un système.

  • Décisions à fort impact (actions irréversibles, engageantes, à conséquences économiques ou légales).
  • Cas de faible confiance du modèle (quand la probabilité de la réponse passe sous le seuil).
  • Exceptions détectées (input hors des patterns attendus).
  • Revue échantillonnée périodique du travail « routinier » pour détecter du drift systémique.

Combien ça coûte vraiment de construire et d'opérer un agent

CoûtPMEMid-marketEnterprise
Setup technique3.000-15.000 €15.000-75.000 €75.000-250.000 €+
Opération mensuelle (LLM + infra)50-500 €500-2.500 €2.500-15.000 €
Supervision humaine (temps personne)5-15 h/mois20-50 h/mois50-200 h/mois
Itération mensuelleIncluse en retainer 200-500 €/mois1.500-5.000 €/mois5.000-25.000 €/mois

Quand OUI et quand NON créer un agent

OUI créer un agentNON créer un agent
Volume élevé et répétitifVolume faible ou erratique
Input variable, décision simpleInput simple, décision complexe
Coût d'erreur faible ou réversibleCoût d'erreur élevé et irréversible
Un humain dispo pour superviserPersonne pour porter le système
Process stable à 12+ moisProcess en train de changer

Document gratuit · PDF

Checklist de gouvernance pour agents IA en production

Les 4 couches obligatoires (HITL, logs, rollback, evals) expliquées pas à pas. Sans ça, un agent n'est pas un système — c'est une bombe.

Ce que tu reçois

  • Checklist des 4 pièces critiques
  • Template de politique d'usage par type d'agent
  • Métriques de qualité par tâche (avec seuils)

Questions fréquentes

Pour un basique non. Des plateformes comme n8n, Make AI, Voiceflow ou les Assistants OpenAI te permettent de monter des agents fonctionnels sans code. Pour des agents sérieux — ceux qui s'intègrent à tes systèmes réels, gèrent les erreurs et se monitorent — oui il faut quelqu'un de technique, pas forcément toi. La ligne entre « agent joli en démo » et « agent qui bosse » se franchit avec du code.

Un agent basique (un assistant sur ta KB, un chatbot de support simple) peut être en ligne en une semaine. Un agent sérieux — avec intégrations CRM, outils, escalade humaine et evals — entre 6 et 12 semaines. Tout fournisseur qui te promet « agent enterprise en 3 jours » te vend une démo en cravate.

Pour prototyper : OpenAI Assistants (rapide, simple). Pour de la prod no-code/low-code : n8n ou Make AI. Pour des systèmes complexes avec orchestration sérieuse : LangChain ou LangGraph (il te faut un dev). Le choix dépend moins de la plateforme et plus de qui va opérer l'agent au quotidien. Commence par le plus simple qui couvre ton cas — tu peux toujours monter en gamme.

Quatre pièces : (1) politique d'usage claire — ce qu'il peut et ne peut pas faire ; (2) logs auditables de chaque décision et chaque action ; (3) human-in-the-loop pour les décisions critiques ; (4) revue périodique du comportement (evals automatiques + revue humaine). Sans ces quatre, l'agent est une expérience, pas un système en prod.

Ça dépend du système autour. Bien conçu : l'agent détecte l'incertitude, escalade à un humain et la situation se résout avec peu de friction. Mal conçu : l'agent exécute la mauvaise action avec confiance totale et tu l'apprends quand un client se plaint. La qualité d'un agent ne se mesure pas quand il réussit — elle se mesure quand il doute.

Tu le lis, ou on le met en prod ?

Ce guide couvre la partie qui pense. L'implémenter — et le mesurer — c'est ce qu'on facture.

Créer un agent IA : le guide que tu aurais dû lire avant le premier prototype · Implementa