llms.txt suona come «robots.txt per l'era dell'IA», ed è per questo che mezza internet l'ha messo online in un weekend del 2024. La realtà è più interessante: utile per certe cose, irrilevante per altre, e Google ha già detto pubblicamente che non lo userà. Ecco cos'è davvero, come si scrive bene e chi lo legge oggi — per decidere sui dati, non sulla FOMO.
Cos'è llms.txt (e cosa non è)
llms.txt è un file di testo in Markdown che metti nella radice del tuo dominio (tuodominio.com/llms.txt) per dire a un modello linguistico quali pagine del tuo sito contano e di cosa parla ciascuna. Lo ha proposto Jeremy Howard — cofondatore di Answer.AI e di fast.ai — a settembre 2024, e la specifica vive su llmstxt.org.
L'idea è semplice. Il web è pensato per umani e browser: menù, banner e JavaScript che un LLM deve digerire a fatica. llms.txt gli dà una mappa pulita in Markdown — il formato che tutti i modelli leggono già senza tradurre — con le tue pagine chiave e una frase di contesto per ognuna.
Come si scrive: il formato esatto
La specifica è volutamente minimale. Un llms.txt valido contiene, in quest'ordine:
- Un H1 con il nome del progetto o del sito. È l'unica sezione obbligatoria.
- Un blockquote (una riga che inizia con
>) con un riassunto breve di cos'è il sito. - Testo opzionale in prosa con contesto aggiuntivo, senza titoli.
- Sezioni H2 con liste di link, dove ogni link porta una breve descrizione dopo i due punti.
- Una sezione H2 speciale chiamata «Optional»: ciò che ci sta sotto si può saltare quando serve un contesto più corto.
C'è un companion opzionale, /llms-full.txt, che mette tutto il contenuto del sito in un unico documento Markdown per i modelli che vogliono ingoiarlo intero. Regola pratica: punta a 10-20 pagine evergreen ad alto valore, non al tuo sitemap intero. Un llms.txt con 400 link non è una mappa, è un altro labirinto.
llms.txt vs robots.txt vs schema: non sono la stessa cosa
| File | A cosa serve | Chi comanda |
|---|---|---|
| robots.txt | Consentire o bloccare l'accesso di ogni crawler | Controllo d'accesso |
| llms.txt | Dire quali pagine contano e di cosa parlano | Contesto e priorità |
| Schema (JSON-LD) | Dichiarare che entità sei e come si collegano i tuoi dati | Identità di entità |
I tre si completano, non competono. robots.txt fa entrare il crawler — senza non esisti; lo schema gli dice chi sei; e llms.txt gli dà l'indice da dove partire. Mettere online llms.txt con il robots.txt chiuso è come appendere un cartello «leggi questo» su una porta chiusa a chiave.
Chi lo usa davvero oggi
Qui bisogna essere onesti, perché metà delle guide ti vendono llms.txt come oro e l'altra metà come fumo. La foto reale a metà 2026:
- Perplexity: lo recupera e lo usa per dare priorità alle pagine che guarda. Quello che ci bada di più tra i motori di ricerca con IA.
- Anthropic (Claude), Cursor, Mintlify e diversi strumenti per sviluppatori lo supportano ufficialmente da gennaio 2026.
- OpenAI / ChatGPT: nessuna conferma ufficiale, ma si osserva che i team che pubblicano un llms.txt vedono cambiamenti correlati nei loro schemi di citazione su SearchGPT.
- Google: NO. A luglio 2025 Gary Illyes ha confermato che non lo supporta e non lo farà, e John Mueller l'ha paragonato al vecchio meta keywords — quello ignorato fino a morire.
E un dato che raffredda l'entusiasmo: in uno studio di SE Ranking su 300.000 domini, l'adozione era intorno al 10% — un sito su dieci — dopo un anno e mezzo di discussione. In un altro conteggio di oltre 500 milioni di visite di bot IA in 90 giorni, solo 408 sono andate a cercare il llms.txt direttamente. Oggi lo leggono soprattutto strumenti per sviluppatori e agenti (Cursor, Claude Code, Copilot, server MCP), non tanto la ricerca IA di consumo.
Quando vale la pena (e quando è perdita di tempo)
Non è una questione di moda, è di costi-benefici. Mettere online un llms.txt decente costa poco — un pomeriggio, non un progetto — e non ti danneggia. La questione è la priorità.
- Sì, subito: se hai documentazione tecnica, una libreria, un'API o un prodotto che dev e agenti consultano. Lì llms.txt rende oggi, non in futuro.
- Sì, ma senza fretta: se vendi Perplexity-first o vuoi coprire il fianco economico della visibilità IA. Costo basso, vantaggio reale ma modesto.
- Non è la tua priorità: se il tuo traffico dipende da Google. Prima di toccare llms.txt, fai entrare il crawler, sistema lo schema e metti le risposte in alto. È quello che sposta l'ago; llms.txt è la ciliegina.
Come configurarlo senza sbagliare
- Scegli 10-20 URL evergreen che rappresentino davvero ciò che fai. Qualità sull'inventario.
- Scrivi l'H1 con il tuo nome, il blockquote con una frase su cosa risolvi, e raggruppa i link sotto H2 tematici con una descrizione onesta per link.
- Caricalo nella radice:
tuodominio.com/llms.txt. Verificalo aprendolo nel browser. - Verifica prima che il tuo robots.txt lasci passare i crawler IA. Senza, la mappa non la legge nessuno.
- Mantienilo: quando cambiano le tue pagine chiave, aggiornalo. Una mappa obsoleta è peggio di nessuna mappa.
E misuralo come tutto in GEO: se pubblichi un llms.txt, controlla se le tue citazioni su Perplexity e ChatGPT cambiano nelle settimane successive. Se non misuri, non saprai se è servito — e in GEO non c'è un pannello ufficiale, te lo costruisci tu.