¿Qué tan bien reconocen los sistemas de IA a tu empresa? Lo probamos. 13 modelos de IA. 50 sitios web de empresas. Una respuesta clara: la mayoría de las empresas son prácticamente invisibles para la IA.
El experimento
Analizamos 50 sitios web de empresas, desde talleres artesanales hasta consultas médicas y startups tecnológicas. Cada sitio fue presentado a 13 modelos de IA diferentes, entre ellos:
- ChatGPT (GPT-4o, GPT-4.5)
- Claude (Sonnet 4, Opus 4)
- Gemini (2.0 Pro, 2.5 Flash)
- Perplexity (búsqueda online)
- Mistral Large
- DeepSeek V3
- Qwen 2.5
- Llama 3.3
- Grok 3
La pregunta para cada modelo fue: "¿Qué hace [nombre de empresa]? Describe la empresa, sus servicios y su ubicación."
Los resultados
Tasa de reconocimiento según configuración del sitio
| Configuración | Tasa de reconocimiento | Precisión |
|---|---|---|
| Solo HTML (sin schema) | 28 % | Baja, a menudo sector o ubicación incorrectos |
| HTML + JSON-LD | 54 % | Media, datos básicos correctos pero faltan detalles |
| HTML + JSON-LD + llms.txt | 78 % | Alta, servicios y USP reconocidos |
| Discovery Chain completa | 96 % | Muy alta, descripción precisa |
¿Qué es la "Discovery Chain"?
La Discovery Chain es el conjunto completo de archivos legibles por máquinas que un sistema de IA necesita para entender una empresa:
HTML Head (meta + link tags)
→ robots.txt (reglas para crawlers)
→ sitemap.xml (estructura del sitio)
→ llms.txt (descripción en texto plano)
→ agents.json (capacidades técnicas)
→ JSON-LD (datos estructurados por página)
Cada elemento cumple una función específica. Juntos forman una imagen completa que cualquier sistema de IA puede procesar.
Tasa de reconocimiento por modelo de IA
No todos los modelos reconocen empresas con la misma calidad:
| Modelo | Sin Discovery Chain | Con Discovery Chain | Mejora |
|---|---|---|---|
| GPT-4.5 | 35 % | 97 % | +177 % |
| Claude Opus 4 | 38 % | 98 % | +158 % |
| Gemini 2.5 | 32 % | 95 % | +197 % |
| Perplexity | 45 % | 99 % | +120 % |
| Mistral Large | 22 % | 92 % | +318 % |
| Llama 3.3 | 18 % | 88 % | +389 % |
Perplexity tiene la baseline más alta porque busca activamente en la web. Los modelos open-source como Llama son los que más se benefician de la Discovery Chain, porque sin señales adicionales apenas tienen contexto.
Los errores más comunes
1. Crawlers de IA bloqueados (38 % de los sitios analizados)
El error más frecuente: el sitio bloquea crawlers de IA vía robots.txt o Cloudflare. Muchos propietarios de webs no saben que Cloudflare bloquea bots de IA por defecto desde 2025.
2. Sin JSON-LD Schema (52 %)
Más de la mitad de los sitios analizados no tenía JSON-LD Schema, o solo uno muy rudimentario. Sin schema, los sistemas de IA tienen que adivinar qué hace la empresa.
3. Sin llms.txt (89 %)
Casi 9 de cada 10 sitios no tenían llms.txt. Es la victoria rápida más sencilla y eficaz: un archivo de texto que se crea en 30 minutos y que duplica la tasa de reconocimiento.
4. Sin agents.json (94 %)
agents.json es aún más reciente que llms.txt y lo usan menos del 10 % de los sitios. Pero los modelos que lo soportan entregan los resultados más precisos con él.
Caso de estudio: del 25 % al 96 %
Un agente inmobiliario en Valencia tenía una web bonita, pero solo un 25 % de reconocimiento. Los modelos ni siquiera sabían en qué sector operaba la empresa.
Medidas (esfuerzo total: 4 horas):
- Añadido JSON-LD Organization + RealEstateAgent Schema
- Creada llms.txt con perfil de empresa y servicios
- Configurado agents.json con endpoints de contacto
- robots.txt abierto para crawlers de IA
- Añadidos HTML Head Links hacia llms.txt y agents.json
Resultado después de 2 semanas:
- Tasa de reconocimiento: 25 % → 96 %
- ChatGPT describe correctamente la empresa con ubicación, servicios y USP
- Perplexity recomienda el sitio ante consultas sobre inmobiliarias en Valencia
Así puedes probar tu propia visibilidad
Puedes probar tú mismo la visibilidad IA de tu web. Abre ChatGPT, Claude o Perplexity y pregunta:
"¿Qué hace [tu nombre de empresa]? Describe la empresa, sus servicios, su ubicación y lo que la hace especial."
Compara la respuesta con la realidad. ¿Acierta el sector? ¿Acierta la ubicación? ¿Menciona tus servicios clave?
Si la respuesta es incorrecta o incompleta, tu web necesita una Discovery Chain.
Conclusión
Un 96 % de tasa de reconocimiento en nuestras propias pruebas no es suerte. Es el resultado de una implementación técnica limpia que cualquier empresa puede lograr. Los costes son mínimos. El esfuerzo se mide en unas pocas horas. Y la ventaja sobre competidores que siguen en el 25 % es enorme.
La pregunta no es si los sistemas de IA van a hablar sobre tu empresa. La pregunta es si van a decir lo correcto.
