llms.txt sonne comme « robots.txt pour l'ère de l'IA », et c'est pour ça que la moitié d'internet l'a déployé en un week-end de 2024. La réalité est plus intéressante : utile pour certaines choses, inutile pour d'autres, et Google a déjà dit publiquement qu'il ne s'en servira pas. Voici ce que c'est vraiment, comment bien l'écrire et qui le lit aujourd'hui — pour décider sur des données, pas sur la FOMO.
Ce qu'est llms.txt (et ce qu'il n'est pas)
llms.txt est un fichier texte en Markdown que tu places à la racine de ton domaine (tondomaine.com/llms.txt) pour dire à un modèle de langage quelles pages de ton site comptent et de quoi parle chacune. Jeremy Howard — cofondateur d'Answer.AI et de fast.ai — l'a proposé en septembre 2024, et la spécification vit sur llmstxt.org.
L'idée est simple. Le web est pensé pour les humains et les navigateurs : menus, bannières et JavaScript qu'un LLM doit digérer à la peine. llms.txt lui donne une carte propre en Markdown — le format que tous les modèles lisent déjà sans traduire — avec tes pages clés et une phrase de contexte pour chacune.
Comment l'écrire : le format exact
La spécification est volontairement minimaliste. Un llms.txt valide contient, dans cet ordre :
- Un H1 avec le nom du projet ou du site. C'est la seule section obligatoire.
- Un blockquote (une ligne commençant par
>) avec un résumé court de ce qu'est le site. - Du texte optionnel en prose avec du contexte supplémentaire, sans titres.
- Des sections H2 avec des listes de liens, où chaque lien porte une courte description après deux-points.
- Une section H2 spéciale appelée « Optional » : ce qui s'y trouve peut être ignoré quand un contexte plus court suffit.
Il existe un compagnon optionnel, /llms-full.txt, qui met tout le contenu du site dans un seul document Markdown pour les modèles qui veulent tout avaler. Règle pratique : vise 10-20 pages évergreen à forte valeur, pas ton sitemap entier. Un llms.txt avec 400 liens n'est pas une carte, c'est un autre labyrinthe.
llms.txt vs robots.txt vs schema : pas la même chose
| Fichier | À quoi ça sert | Qui commande |
|---|---|---|
| robots.txt | Autoriser ou bloquer l'accès de chaque crawler | Contrôle d'accès |
| llms.txt | Dire quelles pages comptent et de quoi elles parlent | Contexte et priorité |
| Schema (JSON-LD) | Déclarer quelle entité tu es et comment tes données se relient | Identité d'entité |
Les trois se complètent, ils ne rivalisent pas. robots.txt laisse entrer le crawler — sans ça tu n'existes pas ; le schema lui dit qui tu es ; et llms.txt lui donne l'index par où commencer. Déployer llms.txt avec un robots.txt fermé, c'est accrocher un panneau « lis ça » sur une porte verrouillée.
Qui l'utilise vraiment aujourd'hui
Ici il faut être honnête, parce que la moitié des guides te vendent llms.txt comme de l'or et l'autre moitié comme de la fumée. La photo réelle mi-2026 :
- Perplexity : le récupère et l'utilise pour prioriser les pages qu'il regarde. Celui qui y prête le plus attention parmi les moteurs de recherche IA.
- Anthropic (Claude), Cursor, Mintlify et plusieurs outils de dev le prennent en charge officiellement depuis janvier 2026.
- OpenAI / ChatGPT : pas de confirmation officielle, mais on observe que les équipes qui publient un llms.txt voient des changements corrélés dans leurs schémas de citation sur SearchGPT.
- Google : NON. En juillet 2025, Gary Illyes a confirmé qu'il ne le prend pas en charge et ne le fera pas, et John Mueller l'a comparé à la vieille balise meta keywords — celle qu'on a ignorée jusqu'à sa mort.
Et une statistique qui refroidit l'enthousiasme : dans une étude de SE Ranking sur 300 000 domaines, l'adoption tournait autour de 10 % — un site sur dix — après un an et demi de discussion. Dans un autre comptage de plus de 500 millions de visites de bots IA sur 90 jours, seulement 408 sont allées chercher le llms.txt directement. Aujourd'hui, ce sont surtout les outils de dev et les agents qui le lisent (Cursor, Claude Code, Copilot, serveurs MCP), pas tant la recherche IA grand public.
Quand ça vaut le coup (et quand c'est une perte de temps)
Ce n'est pas une question de mode, c'est du coût-bénéfice. Déployer un llms.txt correct coûte peu — une après-midi, pas un projet — et ça ne te nuit pas. La question, c'est la priorité.
- Oui, tout de suite : si tu as une doc technique, une bibliothèque, une API ou un produit que consultent devs et agents. Là, llms.txt rapporte aujourd'hui, pas demain.
- Oui, mais sans urgence : si tu vends Perplexity-first ou veux couvrir le flanc pas cher de la visibilité IA. Faible coût, bénéfice réel mais modeste.
- Pas ta priorité : si ton trafic dépend de Google. Avant de toucher à llms.txt, laisse entrer le crawler, range ton schema et place tes réponses en haut. C'est ça qui bouge l'aiguille ; llms.txt, c'est la cerise.
Comment le mettre en place sans te tromper
- Choisis 10-20 URL évergreen qui représentent vraiment ce que tu fais. La qualité plutôt que l'inventaire.
- Écris le H1 avec ton nom, le blockquote avec une phrase sur ce que tu résous, et regroupe les liens sous des H2 thématiques avec une description honnête par lien.
- Mets-le à la racine :
tondomaine.com/llms.txt. Vérifie-le en l'ouvrant dans le navigateur. - Vérifie d'abord que ton robots.txt laisse passer les crawlers IA. Sans ça, personne ne lit la carte.
- Maintiens-le : quand tes pages clés changent, mets-le à jour. Une carte périmée est pire que pas de carte.
Et mesure-le comme tout en GEO : si tu publies un llms.txt, surveille si tes citations sur Perplexity et ChatGPT bougent les semaines suivantes. Si tu ne mesures pas, tu ne sauras pas si ça a servi — et en GEO il n'y a pas de tableau de bord officiel, tu te le construis.