llms.txt soa a «robots.txt para a era da IA», e por isso meia internet o montou num fim de semana de 2024. A realidade é mais interessante: útil para umas coisas, irrelevante para outras, e a própria Google já disse publicamente que não o vai usar. Aqui vai o que é mesmo, como se escreve bem e quem o lê hoje — para decidires com dados e não com FOMO.
O que é o llms.txt (e o que não é)
llms.txt é um ficheiro de texto em Markdown que colocas na raiz do teu domínio (oteudominio.com/llms.txt) para dizer a um modelo de linguagem quais as páginas do teu site que contam e de que trata cada uma. Foi proposto por Jeremy Howard — cofundador da Answer.AI e da fast.ai — em setembro de 2024, e a especificação vive em llmstxt.org.
A ideia é simples. A web é pensada para humanos e browsers: menus, banners e JavaScript que um LLM tem de digerir a custo. llms.txt dá-lhe um mapa limpo em Markdown — o formato que todos os modelos já leem sem traduzir — com as tuas páginas-chave e uma frase de contexto para cada uma.
Como se escreve: o formato exato
A especificação é deliberadamente minimalista. Um llms.txt válido leva, por esta ordem:
- Um H1 com o nome do projeto ou site. É a única secção obrigatória.
- Um blockquote (linha que começa por
>) com um resumo curto do que é o site. - Texto opcional em prosa com contexto adicional, sem cabeçalhos.
- Secções H2 com listas de links, onde cada link leva uma descrição curta depois de dois pontos.
- Uma secção H2 especial chamada «Optional»: o que estiver lá pode ser saltado quando é preciso um contexto mais curto.
Há um companion opcional, /llms-full.txt, que mete todo o conteúdo do site num único documento Markdown para os modelos que queiram engoli-lo inteiro. Regra prática: aponta para 10-20 páginas evergreen de alto valor, não para o teu sitemap inteiro. Um llms.txt com 400 links não é um mapa, é outro labirinto.
llms.txt vs robots.txt vs schema: não são a mesma coisa
| Ficheiro | Para que serve | Quem manda |
|---|---|---|
| robots.txt | Permitir ou bloquear o acesso de cada crawler | Controlo de acesso |
| llms.txt | Dizer que páginas contam e de que tratam | Contexto e prioridade |
| Schema (JSON-LD) | Declarar que entidade és e como os teus dados se ligam | Identidade de entidade |
Os três completam-se, não competem. robots.txt deixa entrar o crawler — sem isso não existes; o schema diz-lhe quem és; e llms.txt dá-lhe o índice de por onde começar. Montar o llms.txt com o robots.txt fechado é pendurar um cartaz «lê isto» numa porta trancada.
Quem o usa mesmo hoje
Aqui é preciso ser honesto, porque metade dos guias vendem-te o llms.txt como ouro e a outra metade como fumo. A foto real a meio de 2026:
- Perplexity: recupera-o e usa-o para priorizar que páginas olha. O que mais lhe liga entre os motores de busca com IA.
- Anthropic (Claude), Cursor, Mintlify e várias ferramentas de dev suportam-no oficialmente desde janeiro de 2026.
- OpenAI / ChatGPT: sem confirmação oficial, mas observa-se que equipas que publicam um llms.txt veem mudanças correlacionadas nos seus padrões de citação no SearchGPT.
- Google: NÃO. Em julho de 2025, Gary Illyes confirmou que não o suporta nem vai suportar, e John Mueller comparou-o à antiga meta keywords — a que foi ignorada até morrer.
E um dado que arrefece o entusiasmo: num estudo da SE Ranking sobre 300.000 domínios, a adoção rondava os 10% — um site em cada dez — após ano e meio de conversa. Noutra contagem de mais de 500 milhões de visitas de bots de IA em 90 dias, só 408 foram diretamente ao llms.txt. Hoje leem-no sobretudo ferramentas de dev e agentes (Cursor, Claude Code, Copilot, servidores MCP), não tanto a busca com IA de consumo.
Quando vale a pena (e quando é perder tempo)
Não é uma questão de moda, é de custo-benefício. Montar um llms.txt decente custa pouco — uma tarde, não um projeto — e não te prejudica. A questão é a prioridade.
- Sim, já: se tens documentação técnica, uma biblioteca, uma API ou um produto que devs e agentes consultam. Aí o llms.txt rende hoje, não no futuro.
- Sim, mas sem pressa: se vendes Perplexity-first ou queres cobrir o flanco barato da visibilidade em IA. Custo baixo, ganho real mas modesto.
- Não é a tua prioridade: se o teu tráfego depende da Google. Antes de tocar no llms.txt, deixa entrar o crawler, arruma o teu schema e põe as respostas no topo. É isso que move a agulha; o llms.txt é a cereja.
Como o montar sem te enganares
- Escolhe 10-20 URLs evergreen que representem mesmo o que fazes. Qualidade sobre inventário.
- Escreve o H1 com o teu nome, o blockquote com uma frase do que resolves, e agrupa os links em H2 temáticos com uma descrição honesta por link.
- Carrega-o na raiz:
oteudominio.com/llms.txt. Verifica-o abrindo-o no browser. - Verifica antes que o teu robots.txt deixa passar os crawlers de IA. Sem isso, ninguém lê o mapa.
- Mantém-no: quando as tuas páginas-chave mudarem, atualiza-o. Um mapa desatualizado é pior do que mapa nenhum.
E mede-o como tudo em GEO: se publicas um llms.txt, vigia se as tuas citações na Perplexity e no ChatGPT mudam nas semanas seguintes. Se não medes, não saberás se serviu — e em GEO não há painel oficial, montas o teu.