Google lee su sitio web a traves de robots.txt y sitemap.xml. Los sistemas de IA necesitan algo diferente: un archivo que les explique en texto plano quien es usted y que ofrece. Este archivo se llama llms.txt -- y se esta convirtiendo rapidamente en el nuevo estandar.
Que es llms.txt?
llms.txt es un archivo de texto en el directorio raiz de su sitio web. No esta escrito para humanos, sino para Large Language Models -- ChatGPT, Claude, Gemini, Perplexity y otros sistemas de IA que podrian leer y citar su sitio web.
La diferencia con robots.txt: robots.txt dice a los crawlers lo que no deben leer. llms.txt dice a los sistemas de IA lo que deben saber.
Por que llms.txt es mas importante que robots.txt
Cada vez mas personas ya no buscan en Google -- preguntan directamente a ChatGPT, Perplexity o Gemini. Estos sistemas de IA solo pueden citar su sitio web si entienden lo que ofrece. HTML con divs anidados, renderizado JavaScript y banners de cookies es dificil de procesar para los LLMs. llms.txt entrega la respuesta en un formato que cada modelo de lenguaje puede procesar inmediatamente.
La Discovery Chain
llms.txt funciona mejor como parte de una cadena:
- HTML Head → enlace a llms.txt
- robots.txt → Permite acceso a crawlers de IA
- sitemap.xml → Muestra todas las paginas indexables
- llms.txt → Explica el negocio en texto plano
- agents.json → Describe capacidades tecnicas para agentes de IA
Si falta un eslabon en esta cadena, los sistemas de IA no pueden encontrarlo -- o no pueden entender lo que ofrece.
La diferencia en la practica
Probamos en un benchmark con 13 modelos de IA que tan bien se reconocen las empresas -- con y sin llms.txt:
| Escenario | Tasa de reconocimiento |
|---|---|
| Solo sitio web HTML | ~30% |
| HTML + JSON-LD | ~55% |
| HTML + JSON-LD + llms.txt | ~78% |
| Discovery Chain completa | 95%+ |
llms.txt por si solo duplica la tasa de reconocimiento. Combinado con agents.json y JSON-LD, su empresa se vuelve visible para practicamente todos los sistemas de IA.
Conclusion
llms.txt es el robots.txt para la era de la IA. Un archivo de texto simple que se crea en 15 minutos y mejora drasticamente la visibilidad de su empresa en sistemas de IA.
