SEO pour ChatGPT (GEO) · Guide 13 sur 22

llms.txt, c'est quoi (et est-ce que ça aide vraiment l'IA à te lire)

llms.txt sonne comme « robots.txt pour l'ère de l'IA », et c'est pour ça que la moitié d'internet l'a déployé en un week-end. La réalité est plus intéressante : utile pour certaines choses, inutile pour d'autres, et Google a déjà dit publiquement qu'il ne s'en servira pas. Voici ce que c'est vraiment, comment bien l'écrire et qui le lit aujourd'hui — pour décider sur des données, pas sur la FOMO.

Le voir en production → SEO pour l'IA Retour au pilier

llms.txt sonne comme « robots.txt pour l'ère de l'IA », et c'est pour ça que la moitié d'internet l'a déployé en un week-end de 2024. La réalité est plus intéressante : utile pour certaines choses, inutile pour d'autres, et Google a déjà dit publiquement qu'il ne s'en servira pas. Voici ce que c'est vraiment, comment bien l'écrire et qui le lit aujourd'hui — pour décider sur des données, pas sur la FOMO.

Ce qu'est llms.txt (et ce qu'il n'est pas)

llms.txt est un fichier texte en Markdown que tu places à la racine de ton domaine (tondomaine.com/llms.txt) pour dire à un modèle de langage quelles pages de ton site comptent et de quoi parle chacune. Jeremy Howard — cofondateur d'Answer.AI et de fast.ai — l'a proposé en septembre 2024, et la spécification vit sur llmstxt.org.

L'idée est simple. Le web est pensé pour les humains et les navigateurs : menus, bannières et JavaScript qu'un LLM doit digérer à la peine. llms.txt lui donne une carte propre en Markdown — le format que tous les modèles lisent déjà sans traduire — avec tes pages clés et une phrase de contexte pour chacune.

Comment l'écrire : le format exact

La spécification est volontairement minimaliste. Un llms.txt valide contient, dans cet ordre :

Un H1 avec le nom du projet ou du site. C'est la seule section obligatoire.
Un blockquote (une ligne commençant par >) avec un résumé court de ce qu'est le site.
Du texte optionnel en prose avec du contexte supplémentaire, sans titres.
Des sections H2 avec des listes de liens, où chaque lien porte une courte description après deux-points.
Une section H2 spéciale appelée « Optional » : ce qui s'y trouve peut être ignoré quand un contexte plus court suffit.

Il existe un compagnon optionnel, /llms-full.txt, qui met tout le contenu du site dans un seul document Markdown pour les modèles qui veulent tout avaler. Règle pratique : vise 10-20 pages évergreen à forte valeur, pas ton sitemap entier. Un llms.txt avec 400 liens n'est pas une carte, c'est un autre labyrinthe.

llms.txt vs robots.txt vs schema : pas la même chose

Fichier	À quoi ça sert	Qui commande
robots.txt	Autoriser ou bloquer l'accès de chaque crawler	Contrôle d'accès
llms.txt	Dire quelles pages comptent et de quoi elles parlent	Contexte et priorité
Schema (JSON-LD)	Déclarer quelle entité tu es et comment tes données se relient	Identité d'entité

Les trois se complètent, ils ne rivalisent pas. robots.txt laisse entrer le crawler — sans ça tu n'existes pas ; le schema lui dit qui tu es ; et llms.txt lui donne l'index par où commencer. Déployer llms.txt avec un robots.txt fermé, c'est accrocher un panneau « lis ça » sur une porte verrouillée.

Qui l'utilise vraiment aujourd'hui

Ici il faut être honnête, parce que la moitié des guides te vendent llms.txt comme de l'or et l'autre moitié comme de la fumée. La photo réelle mi-2026 :

Perplexity : le récupère et l'utilise pour prioriser les pages qu'il regarde. Celui qui y prête le plus attention parmi les moteurs de recherche IA.
Anthropic (Claude), Cursor, Mintlify et plusieurs outils de dev le prennent en charge officiellement depuis janvier 2026.
OpenAI / ChatGPT : pas de confirmation officielle, mais on observe que les équipes qui publient un llms.txt voient des changements corrélés dans leurs schémas de citation sur SearchGPT.
Google : NON. En juillet 2025, Gary Illyes a confirmé qu'il ne le prend pas en charge et ne le fera pas, et John Mueller l'a comparé à la vieille balise meta keywords — celle qu'on a ignorée jusqu'à sa mort.

Et une statistique qui refroidit l'enthousiasme : dans une étude de SE Ranking sur 300 000 domaines, l'adoption tournait autour de 10 % — un site sur dix — après un an et demi de discussion. Dans un autre comptage de plus de 500 millions de visites de bots IA sur 90 jours, seulement 408 sont allées chercher le llms.txt directement. Aujourd'hui, ce sont surtout les outils de dev et les agents qui le lisent (Cursor, Claude Code, Copilot, serveurs MCP), pas tant la recherche IA grand public.

Quand ça vaut le coup (et quand c'est une perte de temps)

Ce n'est pas une question de mode, c'est du coût-bénéfice. Déployer un llms.txt correct coûte peu — une après-midi, pas un projet — et ça ne te nuit pas. La question, c'est la priorité.

Oui, tout de suite : si tu as une doc technique, une bibliothèque, une API ou un produit que consultent devs et agents. Là, llms.txt rapporte aujourd'hui, pas demain.
Oui, mais sans urgence : si tu vends Perplexity-first ou veux couvrir le flanc pas cher de la visibilité IA. Faible coût, bénéfice réel mais modeste.
Pas ta priorité : si ton trafic dépend de Google. Avant de toucher à llms.txt, laisse entrer le crawler, range ton schema et place tes réponses en haut. C'est ça qui bouge l'aiguille ; llms.txt, c'est la cerise.

Comment le mettre en place sans te tromper

Choisis 10-20 URL évergreen qui représentent vraiment ce que tu fais. La qualité plutôt que l'inventaire.
Écris le H1 avec ton nom, le blockquote avec une phrase sur ce que tu résous, et regroupe les liens sous des H2 thématiques avec une description honnête par lien.
Mets-le à la racine : tondomaine.com/llms.txt. Vérifie-le en l'ouvrant dans le navigateur.
Vérifie d'abord que ton robots.txt laisse passer les crawlers IA. Sans ça, personne ne lit la carte.
Maintiens-le : quand tes pages clés changent, mets-le à jour. Une carte périmée est pire que pas de carte.

Et mesure-le comme tout en GEO : si tu publies un llms.txt, surveille si tes citations sur Perplexity et ChatGPT bougent les semaines suivantes. Si tu ne mesures pas, tu ne sauras pas si ça a servi — et en GEO il n'y a pas de tableau de bord officiel, tu te le construis.

Questions fréquentes

Un fichier texte en Markdown que tu places à la racine de ton domaine (tondomaine.com/llms.txt) pour dire à un modèle de langage quelles sont tes pages importantes et de quoi parle chacune. Jeremy Howard (Answer.AI) l'a proposé en septembre 2024 et la spécification vit sur llmstxt.org. Il ne contrôle pas l'accès : il donne juste du contexte et des priorités.

Non. En juillet 2025, Gary Illyes a confirmé que Google ne le prend pas en charge et ne compte pas le faire, et John Mueller l'a comparé à la vieille balise meta keywords. Si ton trafic dépend de Google, llms.txt n'est pas ta priorité. Celui qui s'en sert aujourd'hui, c'est Perplexity, plus Claude et des outils de dev comme Cursor ou Mintlify.

Non, et les confondre est l'erreur classique. robots.txt autorise ou bloque l'accès de chaque crawler ; c'est du contrôle d'accès. llms.txt ne bloque rien : il offre une carte de quelles pages comptent et de quoi elles parlent. Déployer llms.txt avec un robots.txt fermé, c'est accrocher un panneau « lis ça » sur une porte verrouillée.

Ça coûte peu et ça ne fait pas de mal, donc comme flanc pas cher de la visibilité IA, oui. Ça rapporte déjà si tu as une doc technique, une API ou un produit que consultent devs et agents. Mais ne le mets pas avant les bases : laisse entrer le crawler, range ton schema et place tes réponses en haut. C'est ça qui bouge l'aiguille ; llms.txt, c'est la cerise, pas le gâteau.

Plan d'Impact IA · gratuit

Le guide est générique. Ton plan, non.

Parle-nous de ton entreprise et on te renvoie un diagnostic avec priorités, chiffres et quoi implémenter en premier. Sans rendez-vous commercial, sans payer un euro.

Continue avec celles-ci

SEO pour ChatGPT : comment apparaître quand c'est une IA qui recommande Comment apparaître dans ChatGPT : guide pas-à-pas pour que l'IA te cite Comment positionner ta marque dans ChatGPT (sans que ce soit ton propre chatbot)