Benchmark Discovery Chain: 13 modelos de IA, 96% de tasa de reconocimiento

Matthias Meyer

¿Qué tan bien reconocen los sistemas de IA a tu empresa? Lo probamos. 13 modelos de IA. 50 sitios web de empresas. Una respuesta clara: la mayoría de las empresas son prácticamente invisibles para la IA.

El experimento#

Analizamos 50 sitios web de empresas, desde talleres artesanales hasta consultas médicas y startups tecnológicas. Cada sitio fue presentado a 13 modelos de IA diferentes, entre ellos:

ChatGPT (GPT-4o, GPT-4.5)
Claude (Sonnet 4, Opus 4)
Gemini (2.0 Pro, 2.5 Flash)
Perplexity (búsqueda online)
Mistral Large
DeepSeek V3
Qwen 2.5
Llama 3.3
Grok 3

La pregunta para cada modelo fue: "¿Qué hace [nombre de empresa]? Describe la empresa, sus servicios y su ubicación."

Los resultados#

Tasa de reconocimiento según configuración del sitio#

Configuración	Tasa de reconocimiento	Precisión
Solo HTML (sin schema)	28 %	Baja, a menudo sector o ubicación incorrectos
HTML + JSON-LD	54 %	Media, datos básicos correctos pero faltan detalles
HTML + JSON-LD + llms.txt	78 %	Alta, servicios y USP reconocidos
Discovery Chain completa	96 %	Muy alta, descripción precisa

¿Qué es la "Discovery Chain"?#

La Discovery Chain es el conjunto completo de archivos legibles por máquinas que un sistema de IA necesita para entender una empresa:

HTML Head (meta + link tags)
  → robots.txt (reglas para crawlers)
    → sitemap.xml (estructura del sitio)
      → llms.txt (descripción en texto plano)
        → agents.json (capacidades técnicas)
          → JSON-LD (datos estructurados por página)

Cada elemento cumple una función específica. Juntos forman una imagen completa que cualquier sistema de IA puede procesar.

Tasa de reconocimiento por modelo de IA#

No todos los modelos reconocen empresas con la misma calidad:

Modelo	Sin Discovery Chain	Con Discovery Chain	Mejora
GPT-4.5	35 %	97 %	+177 %
Claude Opus 4	38 %	98 %	+158 %
Gemini 2.5	32 %	95 %	+197 %
Perplexity	45 %	99 %	+120 %
Mistral Large	22 %	92 %	+318 %
Llama 3.3	18 %	88 %	+389 %

Perplexity tiene la baseline más alta porque busca activamente en la web. Los modelos open-source como Llama son los que más se benefician de la Discovery Chain, porque sin señales adicionales apenas tienen contexto.

Los errores más comunes#

1. Crawlers de IA bloqueados (38 % de los sitios analizados)#

El error más frecuente: el sitio bloquea crawlers de IA vía robots.txt o Cloudflare. Muchos propietarios de webs no saben que Cloudflare bloquea bots de IA por defecto desde 2025.

2. Sin JSON-LD Schema (52 %)#

Más de la mitad de los sitios analizados no tenía JSON-LD Schema, o solo uno muy rudimentario. Sin schema, los sistemas de IA tienen que adivinar qué hace la empresa.

3. Sin llms.txt (89 %)#

Casi 9 de cada 10 sitios no tenían llms.txt. Es la victoria rápida más sencilla y eficaz: un archivo de texto que se crea en 30 minutos y que duplica la tasa de reconocimiento.

4. Sin agents.json (94 %)#

agents.json es aún más reciente que llms.txt y lo usan menos del 10 % de los sitios. Pero los modelos que lo soportan entregan los resultados más precisos con él.

Caso de estudio: del 25 % al 96 %#

Un agente inmobiliario en Valencia tenía una web bonita, pero solo un 25 % de reconocimiento. Los modelos ni siquiera sabían en qué sector operaba la empresa.

Medidas (esfuerzo total: 4 horas):

Añadido JSON-LD Organization + RealEstateAgent Schema
Creada llms.txt con perfil de empresa y servicios
Configurado agents.json con endpoints de contacto
robots.txt abierto para crawlers de IA
Añadidos HTML Head Links hacia llms.txt y agents.json

Resultado después de 2 semanas:

Tasa de reconocimiento: 25 % → 96 %
ChatGPT describe correctamente la empresa con ubicación, servicios y USP
Perplexity recomienda el sitio ante consultas sobre inmobiliarias en Valencia

Así puedes probar tu propia visibilidad#

Puedes probar tú mismo la visibilidad IA de tu web. Abre ChatGPT, Claude o Perplexity y pregunta:

"¿Qué hace [tu nombre de empresa]? Describe la empresa, sus servicios, su ubicación y lo que la hace especial."

Compara la respuesta con la realidad. ¿Acierta el sector? ¿Acierta la ubicación? ¿Menciona tus servicios clave?

Si la respuesta es incorrecta o incompleta, tu web necesita una Discovery Chain.

Conclusión#

Un 96 % de tasa de reconocimiento en nuestras propias pruebas no es suerte. Es el resultado de una implementación técnica limpia que cualquier empresa puede lograr. Los costes son mínimos. El esfuerzo se mide en unas pocas horas. Y la ventaja sobre competidores que siguen en el 25 % es enorme.

La pregunta no es si los sistemas de IA van a hablar sobre tu empresa. La pregunta es si van a decir lo correcto.