Qué páginas cita la IA y por qué: lo que dice el análisis de 21.000 citaciones
Un análisis de más de 21.000 citaciones de ChatGPT revela qué tipo de contenido citan los modelos, dónde leen en la página y cómo varía por industria.
Data real sobre citaciones de IA
La mayoría de las conversaciones sobre visibilidad en IA giran en torno a consejos generales: escribe contenido de calidad, construye autoridad temática, estructura bien tus páginas. Todo correcto, pero vago. Lo que faltaba era data real sobre cómo se comportan las citaciones en la práctica.
Kevin Indig publicó en Search Engine Journal un análisis de más de 21.000 citaciones de ChatGPT que responde esa pregunta con números concretos. Los hallazgos cambian bastante cómo pensar en una estrategia de contenido orientada a visibilidad en IA.
El mercado de citaciones no es democrático
El primer hallazgo es el más importante para entender el terreno de juego.
Los 30 dominios principales concentran el 67% de todas las citaciones dentro de un tema. Los diez primeros solos capturan el 46%. Dicho de otra forma, en cualquier categoría hay aproximadamente 30 asientos disponibles en la mesa de citaciones. Todo lo demás es prácticamente invisible.
Eso no significa que sea imposible entrar. Significa que la estrategia tiene que ser distinta dependiendo de qué tan concentrada esté tu industria.
Educación y crypto son los sectores más concentrados. En educación, el 10% de los dominios captura el 59.5% de todas las citaciones, y un solo dominio responde el 18.75% del total. En crypto, la concentración llega al 43%. En esos sectores, si no estás ya entre los dominios dominantes, construir presencia amplia es excepcionalmente difícil.
Healthcare y SaaS son los menos concentrados, con el 10% de los dominios capturando apenas el 13% y el 16% respectivamente. En esas categorías, no hay un solo dominio que domine, y nuevos entrantes tienen un camino realista hacia las citaciones.
La conclusión práctica es que antes de diseñar cualquier estrategia de contenido para visibilidad en IA, vale la pena entender cuán concentrada está tu categoría. La táctica correcta en healthcare es completamente distinta a la correcta en educación.
La longitud importa, pero no de forma universal
La relación entre longitud del contenido y citaciones existe, pero tiene matices importantes según la industria.
El salto más grande ocurre entre las páginas de 5.000 y 10.000 palabras, donde las citaciones casi se duplican. Las páginas de más de 20.000 caracteres promedian 10 citaciones cada una, comparado con 2.39 para páginas de menos de 500 caracteres.
Pero la regla no aplica igual en todos los sectores.
En finanzas, la relación se invierte: las páginas con más citaciones promedian menos palabras que las de menor rendimiento. Las fuentes compactas y autoritativas, como tablas de tasas y resúmenes regulatorios, superan a las guías comprehensivas.
En educación, la longitud gana sin excepción. Las citaciones suben consistentemente desde 1.85 por página en contenido corto hasta 6.05 en páginas de más de 20.000 palabras, sin punto de quiebre.
En SaaS, la longitud tiene el efecto más débil de todos los sectores analizados. Incluso las páginas más largas promedian apenas 2.77 citaciones. En esa categoría, el formato y la estructura importan más que el volumen de palabras.
El takeaway no es escribir más. Es entender qué tipo de contenido funciona en tu industria específica y optimizar para eso.
El 58% de las páginas citadas aparece una sola vez
Este hallazgo es probablemente el más relevante para pensar en arquitectura de contenido.
El 67% de las URLs citadas aparece en un solo prompt. Solo el 4.8% de las URLs aparece en diez o más prompts distintos, y todas esas páginas son comparaciones a nivel de categoría o guías que responden "qué es", "quién lo usa", "cómo elegir" y "precios" en una sola URL.
Esa distinción entre volumen de citaciones y amplitud de citaciones es crucial. Una página que aparece 50 veces en respuestas al mismo prompt es menos estratégicamente valiosa que una que aparece 50 veces en respuestas a 50 preguntas distintas.
Las páginas evergreen con mayor alcance comparten una estructura consistente: formato de guía a nivel de categoría, cobertura amplia dentro de una sola página, y anclaje explícito al año en la URL o el título. Son páginas que responden una clase entera de preguntas, no una sola.
Eso tiene una implicación directa para cómo se planifica el contenido. Una sola página evergreen que cubre diez intenciones de búsqueda distintas vale más en términos de alcance de citaciones que diez páginas de una sola intención cada una.
El modelo tradicional de SEO de una keyword por página está estructuralmente mal adaptado para visibilidad en IA.
¿Quieres implementar esto con herramientas y soporte?
En My Rank Lab tienes 9 herramientas premium, trainings mensuales y acceso directo a Ana para resolver tus dudas de marketing e IA.
Dónde en la página lee la IA
El análisis también incluye datos sobre qué parte de una página genera más citaciones, y el patrón es consistente.
La banda del 10% al 30% de la página es donde la IA lee con más intensidad en todos los sectores analizados. El primer 10% típicamente contiene navegación, títulos e introducción que la IA tiende a saltarse. El 10% final, la conclusión, recibe entre el 2.4% y el 4.4% de las citaciones, independientemente del sector.
En finanzas, el 43.7% de las citaciones viene del primer 30% de la página. Ese sector front-loaded con datos, tasas y cifras clave, y la IA los captura antes de seguir leyendo.
La implicación práctica es que las afirmaciones más importantes, los datos más concretos y las respuestas más directas tienen que estar en la primera mitad de la página, no al final como conclusión.
Lo que cambia en la forma de construir contenido
El análisis no cambia los principios fundamentales del contenido de calidad, pero sí clarifica qué métricas importan y cómo priorizar el trabajo.
El primero es medir amplitud de citaciones, no solo volumen. Una página que aparece en respuestas a 30 preguntas distintas es más valiosa estratégicamente que una que aparece 30 veces para la misma pregunta. Al planificar contenido, la pregunta relevante es cuántas intenciones de búsqueda distintas puede responder una sola pieza bien construida.
El segundo es entender la concentración de tu categoría antes de definir objetivos. En sectores altamente concentrados como educación, la estrategia tiene que ser convertirse en la referencia definitiva de un subtema específico. En sectores fragmentados como healthcare o SaaS, hay espacio para construir presencia con una estrategia de cobertura más amplia.
El tercero es construir páginas que respondan clusters de preguntas, no preguntas individuales. Los dominios que dominan las citaciones no llegaron ahí escribiendo mejores oraciones. Construyeron páginas con autoridad temática real, que abordan múltiples consultas en un solo lugar, y repitieron esa autoridad a través de suficientes subtemas para ocupar varios asientos en la mesa.
El cuarto es poner el contenido más citable en la primera mitad de la página. Las conclusiones y los resúmenes al final casi no generan citaciones. Si hay un dato importante, una estadística relevante o una afirmación concreta que vale la pena que la IA capture, tiene que aparecer temprano.
Los números de este análisis hacen más concreto algo que muchos equipos de contenido intuyen pero no pueden cuantificar: la diferencia entre contenido que existe y contenido que la IA efectivamente usa. Y esa diferencia, en términos de arquitectura y estructura, es bastante más manejable de lo que parece.
Mantente al día con lo último en marketing e IA
Recibe recursos, frameworks y herramientas antes que nadie. Sin spam.