SEO para ChatGPT (GEO) · Guía 13 de 22

Qué es llms.txt (y si de verdad sirve para que la IA te lea)

llms.txt suena a «robots.txt para la era de la IA», y por eso medio internet lo montó en un fin de semana. La realidad es más interesante: es un archivo útil para unas cosas, irrelevante para otras, y el propio Google ya dijo en público que no piensa usarlo. Aquí va qué es de verdad, cómo se escribe bien y quién lo lee hoy — para que decidas con datos y no con FOMO.

Verlo en producción → SEO para IA Volver al pillar

llms.txt suena a «robots.txt para la era de la IA», y por eso medio internet lo montó en un fin de semana de 2024. La realidad es más interesante: es un archivo útil para unas cosas, irrelevante para otras, y el propio Google ya dijo en público que no piensa usarlo. Aquí va qué es de verdad, cómo se escribe bien y quién lo lee hoy — para que decidas con datos y no con FOMO.

Qué es llms.txt (y qué no es)

llms.txt es un archivo de texto en Markdown que colocas en la raíz de tu dominio (tudominio.com/llms.txt) para decirle a un modelo de lenguaje cuáles son las páginas que importan de tu web y de qué va cada una. Lo propuso Jeremy Howard —cofundador de Answer.AI y de fast.ai— en septiembre de 2024, y la especificación vive en llmstxt.org.

La idea es sencilla. La web está pensada para humanos y navegadores: menús, banners y JavaScript que un LLM tiene que digerir con esfuerzo. llms.txt le da un mapa limpio en Markdown —el formato que todos los modelos ya leen sin traducir— con tus páginas clave y una frase de contexto por cada una.

Cómo se escribe: el formato exacto

La especificación es deliberadamente minimalista. Un llms.txt válido lleva, en este orden:

Un H1 con el nombre del proyecto o sitio. Es la única sección obligatoria.
Un blockquote (línea que empieza por >) con un resumen corto de qué es el sitio.
Texto opcional en prosa con contexto adicional, sin encabezados.
Secciones H2 con listas de enlaces, donde cada enlace lleva una descripción corta después de dos puntos.
Una sección H2 especial llamada «Optional»: lo que cuelga de ahí se puede saltar cuando hace falta un contexto más corto.

Hay un companion opcional, /llms-full.txt, que mete el contenido completo del sitio en un único documento Markdown para los modelos que quieran tragárselo entero. Regla práctica: apunta a 10-20 páginas evergreen de alto valor, no a tu sitemap entero. Un llms.txt con 400 enlaces no es un mapa, es otro laberinto.

llms.txt vs robots.txt vs schema: no son lo mismo

Archivo	Para qué sirve	Quién manda
robots.txt	Permitir o bloquear el acceso de cada crawler	Control de acceso
llms.txt	Decir qué páginas importan y de qué van	Contexto y prioridad
Schema (JSON-LD)	Declarar qué entidad eres y cómo se relacionan tus datos	Identidad de entidad

Los tres se complementan, no compiten. robots.txt deja entrar al crawler —sin eso no existes—; el schema le dice quién eres; y llms.txt le da el índice de por dónde empezar. Montar llms.txt con el robots.txt cerrado es poner un cartel de «lee esto» en una puerta con candado.

Quién lo usa de verdad hoy

Aquí hay que ser honesto, porque la mitad de las guías te venden llms.txt como si fuera oro y la otra mitad como si fuera humo. La foto real a mediados de 2026:

Perplexity: lo recupera y lo usa para priorizar qué páginas mira. El que más caso le hace entre los buscadores con IA.
Anthropic (Claude), Cursor, Mintlify y varias herramientas de desarrollo lo soportan oficialmente desde enero de 2026.
OpenAI / ChatGPT: sin confirmación oficial, pero se observa que equipos que publican llms.txt ven cambios correlacionados en sus patrones de cita en SearchGPT.
Google: NO. En julio de 2025 Gary Illyes confirmó que no lo soporta ni piensa hacerlo, y John Mueller lo comparó con la vieja meta keywords —la etiqueta que se ignoró hasta morir—.

Y un dato que enfría el entusiasmo: en un estudio de SE Ranking sobre 300.000 dominios, la adopción rondaba el 10% —uno de cada diez sitios— tras año y medio de conversación. En otro recuento de más de 500 millones de visitas de bots de IA en 90 días, solo 408 fueron a por el llms.txt directamente. Hoy lo leen sobre todo herramientas de desarrollo y agentes (Cursor, Claude Code, Copilot, servidores MCP), no tanto la búsqueda con IA de consumo.

Cuándo merece la pena (y cuándo es perder el tiempo)

No es una pregunta de moda, es de coste-beneficio. Montar un llms.txt decente cuesta poco —un rato, no un proyecto— y no te hace daño. La cuestión es la prioridad.

Sí, ya: si tienes documentación técnica, una librería, una API o un producto que devs y agentes consultan. Ahí llms.txt rinde hoy, no en el futuro.
Sí, pero sin prisa: si vendes a Perplexity-first o quieres cubrir el flanco barato de la visibilidad en IA. Bajo coste, upside real aunque modesto.
No es tu prioridad: si tu tráfico depende de Google. Antes de tocar llms.txt, deja entrar al crawler, ordena tu schema y front-loadea respuestas. Eso mueve la aguja; llms.txt es la guinda.

Cómo montarlo sin equivocarte

Elige 10-20 URLs evergreen que representen de verdad lo que haces. Calidad sobre inventario.
Escribe el H1 con tu nombre, el blockquote con una frase de qué resuelves, y agrupa los enlaces en H2 temáticos con una descripción honesta por enlace.
Súbelo a la raíz: tudominio.com/llms.txt. Compruébalo abriéndolo en el navegador.
Verifica antes que tu robots.txt deja pasar a los crawlers de IA. Sin eso, el mapa no lo lee nadie.
Mantenlo: cuando cambien tus páginas clave, actualízalo. Un mapa desactualizado es peor que no tener mapa.

Y mídelo como todo en GEO: si publicas llms.txt, vigila si cambian tus citas en Perplexity y ChatGPT las semanas siguientes. Si no mides, no sabrás si sirvió —y en GEO no hay panel oficial, te lo montas tú—.

Preguntas frecuentes

Es un archivo de texto en Markdown que colocas en la raíz de tu dominio (tudominio.com/llms.txt) para decirle a un modelo de lenguaje cuáles son tus páginas importantes y de qué va cada una. Lo propuso Jeremy Howard (Answer.AI) en septiembre de 2024 y la especificación vive en llmstxt.org. No controla el acceso: solo da contexto y prioridad.

No. En julio de 2025 Gary Illyes confirmó que Google no lo soporta ni piensa hacerlo, y John Mueller lo comparó con la vieja meta keywords. Si tu tráfico depende de Google, llms.txt no es tu prioridad. Quien sí lo usa hoy es Perplexity, además de Claude y herramientas de desarrollo como Cursor o Mintlify.

No, y confundirlos es el error típico. robots.txt permite o bloquea el acceso de cada crawler; es control de acceso. llms.txt no bloquea nada: ofrece un mapa de qué páginas importan y de qué van. Montar llms.txt con el robots.txt cerrado es poner un cartel de «lee esto» en una puerta con candado.

Cuesta poco y no hace daño, así que como flanco barato de la visibilidad en IA, sí. Rinde ya si tienes documentación técnica, una API o un producto que consultan devs y agentes. Pero no lo pongas por delante de lo básico: deja entrar al crawler, ordena tu schema y front-loadea respuestas. Eso mueve la aguja; llms.txt es la guinda, no la tarta.

Plan de Impacto IA · gratis

La guía es genérica. Tu plan, no.

Cuéntanos tu empresa y te devolvemos un diagnóstico con prioridades, números y qué implementar primero. Sin reunión de venta y sin pagar un euro.

Sigue con estas

SEO para ChatGPT: cómo aparecer cuando una IA recomienda Cómo aparecer en ChatGPT: guía paso a paso para que la IA te cite Cómo posicionar tu marca en ChatGPT (sin que sea un chatbot tuyo)