Cómo funcionan de verdad las citas de IA (AI Citations)

Matthias Meyer

Hazle a ChatGPT, Perplexity y Gemini la misma pregunta y en más de un tercio de las consultas obtienes tres listas distintas de fuentes. La misma web, la misma pregunta, tres veredictos separados sobre quién merece ser citado. Esa divergencia es la ventana más clara que tenemos para entender cómo funcionan de verdad las citas de IA, y casi todo lo escrito sobre el tema se salta el mecanismo y salta directo a consejos de optimización. Esto es el mecanismo.

Una cita de IA parece algo pequeño. Un número en superíndice, una pequeña tarjeta de fuente bajo un párrafo, un enlace con utm_source=chatgpt.com pegado al final. Detrás de esa cosa pequeña hay un pipeline que corre en el segundo entre tu pregunta y la respuesta, y casi no tiene nada en común con la forma en que Google clasificó páginas durante los últimos veinte años. Una vez que ves el pipeline, el tema deja de ser místico. Puedes predecir, bastante bien, por qué un modelo citó una página e ignoró otra que estaba objetivamente mejor escrita.

Una cita no es que el modelo te conozca#

Hay dos maneras completamente distintas en que un modelo de lenguaje puede producir una frase sobre tu negocio. La primera es la memoria paramétrica, el conocimiento horneado en sus pesos durante el entrenamiento. Si tu empresa estaba en los datos de entrenamiento, el modelo quizás te "conoce", pero no puede señalar una fuente, porque nunca guardó una URL, sólo una mancha estadística de texto que absorbió meses antes. La segunda manera es la recuperación en tiempo real. El sistema sale, busca documentos en vivo, y escribe la respuesta usando esos documentos como evidencia. Una cita siempre es lo segundo.

Esto es Retrieval-Augmented Generation, normalmente abreviado como RAG, y es la arquitectura debajo de casi toda respuesta de IA que muestra fuentes. El modelo recupera primero los documentos relevantes, y luego genera la respuesta anclada en ellos. La diferencia entre ambos caminos es la diferencia entre "el modelo tiene una impresión vaga de ti" y "el modelo puede citarte y enlazarte". Un análisis puso bajo el microscopio más de 680 millones de citas de IA en 2026, y el patrón se sostiene en todas partes: las respuestas citadas son las ancladas, no las recordadas.

Esa distinción replantea todo el problema. Entrar en los datos de entrenamiento es lento, difuso y casi fuera de tu control. Que te recuperen es un evento en vivo y mecánico que ocurre cada vez que alguien hace una pregunta relevante, y sigue reglas sobre las que de verdad puedes razonar.

El pipeline detrás de una sola respuesta#

Cuando le haces una pregunta a una herramienta de búsqueda con IA, pasan cinco cosas en rápida sucesión. Vale la pena recorrerlas, porque cada etapa filtra la mayor parte de la web antes de que la siguiente siquiera empiece.

Primero, interpretación de la consulta. Tu desordenada pregunta humana se reescribe en una o varias consultas de recuperación cortas. Se llaman Grounding Queries, y son los términos literales que el sistema buscará de verdad. "¿Quién es el mejor agente inmobiliario para fincas rurales cerca de Campos?" podría convertirse en tres consultas limpias sobre regiones, tipos de propiedad y agencias.

Segundo, recuperación. El sistema lanza esas consultas contra un índice usando búsqueda híbrida, combinando la coincidencia de palabras clave a la vieja usanza (BM25) con Vector Embeddings densos que capturan el significado en vez de las palabras exactas. De dónde viene el índice difiere según el motor. Perplexity rastrea la web abierta de forma continua. ChatGPT se apoya mucho en el índice de Bing. Cada uno está buscando en un mapa distinto de internet.

Tercero, re-ranking. La recuperación devuelve demasiados candidatos, así que un re-ranker los puntúa y se queda con un puñado. Perplexity está documentado corriendo un reranker de tres niveles para esto. Cientos de páginas se colapsan a quizás cinco u ocho.

Cuarto, extracción. Esta es la etapa que la mayoría de la gente pasa por alto. El sistema no lee tu página entera. Saca los pasajes específicos que responden a la sub-pregunta, los chunks, y descarta el resto. Quinto, síntesis y la decisión de citar: el modelo escribe la respuesta limitado por esos pasajes, y luego adjunta cada fuente a los tramos que su pasaje sustentó.

La consecuencia de la etapa cuatro es el hecho más importante sobre las citas de IA. Los motores citan pasajes, no páginas. No clasifican tu sitio ni juzgan su calidad general como hace Google. Levantan el párrafo que respondió limpiamente a una pregunta estrecha. Una página puede estar en la posición uno de Google y nunca ser citada, porque la respuesta estaba untada en cinco párrafos y ningún chunk se sostenía por sí solo. Los números lo confirman: solo alrededor del 44 por ciento de las páginas que rankean en el top diez de Google aparecen en citas de IA. Es un juego distinto con un marcador distinto.

El grounding es la parte que hace fiables las citas#

El grounding es el mecanismo que separa la opinión de un modelo de su evidencia. Después de generar el borrador de la respuesta, los buenos sistemas corren una verificación a nivel de tramo. Cada afirmación de la respuesta se contrasta de vuelta con los pasajes recuperados. El sistema o confirma que el pasaje respalda la afirmación, o marca la afirmación como no verificada, o detecta una contradicción entre la afirmación y la fuente. Es una capa de verificación de hechos sentada entre la generación del modelo y tu pantalla.

Encima de eso corre la corroboración. El motor cruza una afirmación contra otras fuentes autorizadas a lo largo de la web. Si varias fuentes de confianza enuncian el mismo hecho en un lenguaje parecido, el motor lo trata como verificado y se siente cómodo citándolo. Una página solitaria que hace una afirmación inusual que nada más repite es un candidato a cita débil y arriesgado, aunque la afirmación resulte ser cierta.

Por eso las citas reducen las alucinaciones en lugar de causarlas. La respuesta está amarrada a un texto que el sistema de verdad sacó y comprobó. También por eso la estructura de tu contenido importa más que el pulido de tu prosa. El pipeline no está admirando tu escritura. Está comprobando si un pasaje respalda una afirmación concreta, y si el resto de la web lo respalda también.

Cuatro motores, cuatro mentes distintas#

La razón por la que tres asistentes dan tres listas de fuentes distintas es que están corriendo estrategias de recuperación distintas sobre índices distintos con sesgos distintos. Las formas generales en 2026 se ven así.

Perplexity es retrieval-first. Busca en casi todas las consultas, rastrea la web de forma continua, y cita por defecto con fuentes numeradas en línea. Saca casi tres veces más fuentes por respuesta que ChatGPT, se apoya de forma inusualmente fuerte en Reddit (cerca del 47 por ciento de sus citas principales), y reacciona a cambios estructurales en una página en un plazo de dos a siete días, el más rápido del grupo. El marcado Schema apenas lo mueve.

ChatGPT es paramétrico por defecto. Responde desde el entrenamiento salvo que una consulta dispare su comportamiento de búsqueda, momento en que recupera a través del índice de Bing. Su entrenamiento lo dejó sesgado hacia el consenso y las fuentes enciclopédicas, razón por la que Wikipedia pesa tanto en sus citas. Cita una porción menor de lo que encuentra, y con 800 millones de usuarios semanales, ser invisible ahí es el tipo de invisibilidad más cara. Desde junio de 2025 etiqueta los enlaces de citas con utm_source=chatgpt.com, lo que al menos hace que el tráfico sea medible.

Claude es el conservador. Se apoya en su entrenamiento y en un corpus suministrado, y sólo navega cuando le dan herramientas. Cuando cita, premia la profundidad y la estructura clara, más o menos un 30 por ciento más probable de citar una página bien organizada y con viñetas, y es el motor más estricto con la frescura. En temas sensibles al tiempo descarta contenido cuya fecha de última modificación supera el año. Gemini y Google AI Overviews se asientan sobre el propio índice de búsqueda de Google, se inclinan hacia señales de marca y de entidad, y muestran sus fuentes debajo del resumen en vez de en línea.

La conclusión práctica es la divergencia. A través de los tres motores, en algún punto entre el 35 y el 40 por ciento de las consultas devuelven conjuntos de fuentes que apenas se solapan. Se ha medido que ChatGPT y Perplexity comparten sólo alrededor del 11 por ciento de sus dominios citados. Trata la visibilidad de IA como una sola cosa y estarás optimizando para un motor mientras otros tres te ignoran en silencio.

Por qué algunas páginas entran y la mayoría no#

Una vez que el pipeline está claro, las razones por las que ciertas páginas siguen siendo citadas dejan de parecer folklore de SEO y empiezan a parecer fontanería.

La recuperabilidad va primero, y es el fallo silencioso más común. Un motor no puede citar una página que su rastreador no alcanza. Cada uno corre su propio agente: OAI-SearchBot para la búsqueda de ChatGPT, ClaudeBot y Claude-User para Anthropic, PerplexityBot, Google-Extended para Gemini. Bloquea uno en tu robots.txt y ese motor sencillamente está ciego ante ti, por muy fuerte que sea el contenido. Un montón de páginas excelentes son incitables por esta única y aburrida razón.

La extraibilidad va después. Como el pipeline levanta pasajes, el contenido que responde a una sub-pregunta limpiamente en un solo sitio se extrae, y el contenido donde la respuesta está difuminada en media página no. Esa es la verdadera razón por la que la escritura answer-first, los encabezados claros, las tablas y las definiciones directas correlacionan con las citas. No son señales mágicas de ranking. Son mecánicamente más fáciles de trocear y levantar.

Luego la corroboración y los datos originales. Una afirmación repetida por la web en un lenguaje consistente es segura de citar, razón por la que la presencia de marca en Reddit, Wikipedia, sitios de noticias y de reseñas mueve las citas más que cualquier ajuste en la página, sobre todo en ChatGPT. La otra cara es igual de útil: publica un número que nadie más tiene y te conviertes en la única fuente posible para él. La investigación original se ha medido en torno a 3,7 veces más probable de ser citada, y el marcado de datos estructurados en torno a 2,1 veces. La frescura cierra el círculo, ya que algunos motores, Claude más que ninguno, descartan en silencio las marcas de tiempo rancias.

Nada de esto es un truco. Es la forma del pipeline asomando. La máquina premia el contenido que es alcanzable, levantable, corroborado y actual, porque esas son las cuatro cosas que el pipeline literalmente comprueba.

La siguiente capa: de leerte a actuar sobre ti#

Las citas tratan de si un modelo puede leerte y referenciarte. La frontera que avanza a lo largo de 2026 es si un agente puede hacer algo contigo, y unos cuantos estándares están construyendo ese puente en silencio.

El más ligero es llms.txt, un archivo markdown en la raíz de tu sitio que lista tus páginas importantes con descripciones cortas, una especie de sitemap escrito para modelos en vez de para rastreadores. Reduce el trabajo que un motor tiene que hacer para averiguar qué importa, y ya lo usan Cloudflare, Stripe y cientos de miles de otros sitios. Puedes leer la especificación llms.txt en un par de minutos. El marcado Schema.org hace un trabajo afín a nivel de datos, entregando al parser hechos estructurados en vez de prosa que tiene que interpretar.

El cambio más grande es el Model Context Protocol, un estándar abierto de Anthropic que permite a una app de IA conectarse directamente a una fuente de datos o herramienta en vivo en vez de raspar texto de una página. En lugar de adivinar tus precios desde un párrafo cacheado, un modelo puede consultarlos directamente. La abreviatura común es "USB-C para IA". Un paso más allá está la idea detrás de WebMCP y agents.json, donde un sitio publica herramientas invocables, reservar una cita, comprobar disponibilidad, pedir un presupuesto, que un agente puede invocar directamente. La página deja de ser algo que se lee y se convierte en algo que se opera.

La trayectoria es directa. Va desde "¿está mi contenido en el índice de recuperación?" hasta "¿puede un agente hacer una transacción con mi negocio sin que un humano abra nunca el sitio?". Las citas son el primer peldaño de esa escalera, que es exactamente por qué vale la pena entenderlas bien en vez de perseguirlas con listas de verificación.

Qué significa esto de verdad#

Quítale todo lo accesorio y una cita de IA es el extremo visible de un pipeline de recuperación, grounding y verificación. No es prueba de que el modelo te conozca, y tiene sorprendentemente poco que ver con cómo rankeas en Google. Las páginas que se citan son las que el pipeline puede alcanzar, levantar limpiamente, corroborar contra el resto de la web y considerar actuales.

Mi predicción es que la brecha entre "rankea bien en Google" y "lo cita la IA" sigue ensanchándose, porque las dos miden cosas genuinamente distintas, y muchos negocios están a punto de descubrir que su SEO ganado a pulso no se traslada como suponían. Los que traten la visibilidad de IA como su propia disciplina, con su propia mecánica y su propia medición, tomarán ventaja mientras los demás esperan a que las citas aparezcan solas. Esa disciplina tiene nombre, Generative Engine Optimization, y la primera mitad de hacerla bien es sencillamente entender el pipeline para el que estás optimizando.