llms.txt suena a «robots.txt para la era de la IA», y por eso medio internet lo montó en un fin de semana de 2024. La realidad es más interesante: es un archivo útil para unas cosas, irrelevante para otras, y el propio Google ya dijo en público que no piensa usarlo. Aquí va qué es de verdad, cómo se escribe bien y quién lo lee hoy — para que decidas con datos y no con FOMO.
Qué es llms.txt (y qué no es)
llms.txt es un archivo de texto en Markdown que colocas en la raíz de tu dominio (tudominio.com/llms.txt) para decirle a un modelo de lenguaje cuáles son las páginas que importan de tu web y de qué va cada una. Lo propuso Jeremy Howard —cofundador de Answer.AI y de fast.ai— en septiembre de 2024, y la especificación vive en llmstxt.org.
La idea es sencilla. La web está pensada para humanos y navegadores: menús, banners y JavaScript que un LLM tiene que digerir con esfuerzo. llms.txt le da un mapa limpio en Markdown —el formato que todos los modelos ya leen sin traducir— con tus páginas clave y una frase de contexto por cada una.
Cómo se escribe: el formato exacto
La especificación es deliberadamente minimalista. Un llms.txt válido lleva, en este orden:
- Un H1 con el nombre del proyecto o sitio. Es la única sección obligatoria.
- Un blockquote (línea que empieza por
>) con un resumen corto de qué es el sitio. - Texto opcional en prosa con contexto adicional, sin encabezados.
- Secciones H2 con listas de enlaces, donde cada enlace lleva una descripción corta después de dos puntos.
- Una sección H2 especial llamada «Optional»: lo que cuelga de ahí se puede saltar cuando hace falta un contexto más corto.
Hay un companion opcional, /llms-full.txt, que mete el contenido completo del sitio en un único documento Markdown para los modelos que quieran tragárselo entero. Regla práctica: apunta a 10-20 páginas evergreen de alto valor, no a tu sitemap entero. Un llms.txt con 400 enlaces no es un mapa, es otro laberinto.
llms.txt vs robots.txt vs schema: no son lo mismo
| Archivo | Para qué sirve | Quién manda |
|---|---|---|
| robots.txt | Permitir o bloquear el acceso de cada crawler | Control de acceso |
| llms.txt | Decir qué páginas importan y de qué van | Contexto y prioridad |
| Schema (JSON-LD) | Declarar qué entidad eres y cómo se relacionan tus datos | Identidad de entidad |
Los tres se complementan, no compiten. robots.txt deja entrar al crawler —sin eso no existes—; el schema le dice quién eres; y llms.txt le da el índice de por dónde empezar. Montar llms.txt con el robots.txt cerrado es poner un cartel de «lee esto» en una puerta con candado.
Quién lo usa de verdad hoy
Aquí hay que ser honesto, porque la mitad de las guías te venden llms.txt como si fuera oro y la otra mitad como si fuera humo. La foto real a mediados de 2026:
- Perplexity: lo recupera y lo usa para priorizar qué páginas mira. El que más caso le hace entre los buscadores con IA.
- Anthropic (Claude), Cursor, Mintlify y varias herramientas de desarrollo lo soportan oficialmente desde enero de 2026.
- OpenAI / ChatGPT: sin confirmación oficial, pero se observa que equipos que publican llms.txt ven cambios correlacionados en sus patrones de cita en SearchGPT.
- Google: NO. En julio de 2025 Gary Illyes confirmó que no lo soporta ni piensa hacerlo, y John Mueller lo comparó con la vieja meta keywords —la etiqueta que se ignoró hasta morir—.
Y un dato que enfría el entusiasmo: en un estudio de SE Ranking sobre 300.000 dominios, la adopción rondaba el 10% —uno de cada diez sitios— tras año y medio de conversación. En otro recuento de más de 500 millones de visitas de bots de IA en 90 días, solo 408 fueron a por el llms.txt directamente. Hoy lo leen sobre todo herramientas de desarrollo y agentes (Cursor, Claude Code, Copilot, servidores MCP), no tanto la búsqueda con IA de consumo.
Cuándo merece la pena (y cuándo es perder el tiempo)
No es una pregunta de moda, es de coste-beneficio. Montar un llms.txt decente cuesta poco —un rato, no un proyecto— y no te hace daño. La cuestión es la prioridad.
- Sí, ya: si tienes documentación técnica, una librería, una API o un producto que devs y agentes consultan. Ahí llms.txt rinde hoy, no en el futuro.
- Sí, pero sin prisa: si vendes a Perplexity-first o quieres cubrir el flanco barato de la visibilidad en IA. Bajo coste, upside real aunque modesto.
- No es tu prioridad: si tu tráfico depende de Google. Antes de tocar llms.txt, deja entrar al crawler, ordena tu schema y front-loadea respuestas. Eso mueve la aguja; llms.txt es la guinda.
Cómo montarlo sin equivocarte
- Elige 10-20 URLs evergreen que representen de verdad lo que haces. Calidad sobre inventario.
- Escribe el H1 con tu nombre, el blockquote con una frase de qué resuelves, y agrupa los enlaces en H2 temáticos con una descripción honesta por enlace.
- Súbelo a la raíz:
tudominio.com/llms.txt. Compruébalo abriéndolo en el navegador. - Verifica antes que tu robots.txt deja pasar a los crawlers de IA. Sin eso, el mapa no lo lee nadie.
- Mantenlo: cuando cambien tus páginas clave, actualízalo. Un mapa desactualizado es peor que no tener mapa.
Y mídelo como todo en GEO: si publicas llms.txt, vigila si cambian tus citas en Perplexity y ChatGPT las semanas siguientes. Si no mides, no sabrás si sirvió —y en GEO no hay panel oficial, te lo montas tú—.