Cómo comprobar si ChatGPT ha indexado tu web (2026)
Para comprobar si ChatGPT puede usar tu web, deja de preguntar si estás "indexado" — pregunta si ChatGPT mostrará y citará tu URL cuando alguien haga una pregunta relevante. ChatGPT no construye un índice público y consultable de la web como Google. Recupera un pequeño conjunto de fuentes en el momento de responder a través de su capa de búsqueda, las lee y cita algunas. Así que la prueba práctica no es "¿está mi página en una base de datos?" — es "cuando hago una pregunta que esta página debería responder, ¿ChatGPT la encuentra, la lee y la enlaza?". Puedes revisarlo manualmente en unos minutos, y el resto de este post te muestra cómo, además de las razones técnicas por las que una página en vivo puede ser invisible para ChatGPT incluso mientras posiciona en Google.
Este es el complemento específico de ChatGPT al pilar más amplio sobre recuperabilidad y al radio de Perplexity. ChatGPT es el motor donde esta comprobación es más fiable hoy, porque sus citas son visibles en línea y el comportamiento de su crawler está documentado por OpenAI — así que es el lugar adecuado para empezar.
Cómo extrae ChatGPT las fuentes en realidad
Cuando ChatGPT responde una pregunta que necesita información actual o factual, lanza una búsqueda, recupera un puñado de páginas candidatas y sintetiza una respuesta que cita algunas de ellas en línea. Puedes ver las citas en la respuesta — pequeñas referencias enlazadas junto a las oraciones que respaldan. Esa es toda la superficie visible: unas pocas URLs citadas por respuesta, no una página posicionada de diez enlaces azules.
De ese diseño se siguen dos cosas. Primero, la competencia por respuesta es brutal — ser la 8ª mejor fuente para una consulta normalmente significa ser citado cero veces, no "página dos". Segundo, la selección de ChatGPT se inclina hacia fuentes de consenso y enciclopédicas: páginas que corroboran lo que dicen otras páginas reputadas, que son fáciles de parsear y que portan señales de entidad reconocibles. Una página que está técnicamente en vivo pero dice algo que solo dice tu sitio, en un formato difícil de extraer, es un candidato débil de recuperación aun cuando cargue bien en un navegador.
La propia documentación de OpenAI es el ancla aquí. La empresa publica los user-agents que opera y cómo respetan robots.txt — que es lo que hace a ChatGPT comprobable de un modo que otros motores no lo son.
La comprobación manual: ¿muestra ChatGPT tu URL?
No necesitas una herramienta para hacer una primera comprobación de una sola página. La técnica general es lograr que ChatGPT intente recuperar una página que controlas y observar si muestra y cita tu URL.
Hay dos variantes fiables:
- Comprobación de frase única. Copia una oración distintiva de la página que te importa — idealmente una frase que no aparece en ningún otro sitio de la web — y haz a ChatGPT (con la búsqueda activada) una pregunta cuya respuesta natural traería esa página. Si la página es recuperable, ChatGPT debería mostrarla y citar tu URL. Si una frase que solo existe en tu página en vivo nunca produce tu página, eso es una señal de que algo está bloqueando la recuperación.
- Comprobación de indicador de URL/sitio. Apunta ChatGPT directamente a la página o al dominio y pídele que lea y resuma lo que hay ahí. Si ChatGPT puede obtener y describir con precisión el contenido real de la página, la página es alcanzable por su bot de fetch en vivo. Si solo puede adivinar, titubea o describe texto genérico de relleno, la página puede estar bloqueada o tener el renderizado roto para el bot.
Unas notas de disciplina. Ejecuta cada comprobación más de una vez — las respuestas de ChatGPT no son deterministas, y un solo fallo no es prueba de un problema. E ignora los "trucos de operadores" de la era 2024: los hacks ingenuos estilo site: y los de copiar-pegar prompts que circularon hace dos años no son fiables en 2026 porque el comportamiento de búsqueda de ChatGPT ha cambiado y los resultados varían de un run a otro. Trata las comprobaciones de frase única y de URL como tus primitivas, repítelas y lee el patrón en vez de cualquier respuesta individual.
Para qué sirve esta comprobación manual: confirmar o descartar un problema en una página importante. Para qué no sirve: decirte cuáles de docenas de páginas de un sitio son recuperables, o detectar el día en que un cambio de robots.txt deja discretamente fuera a ChatGPT de tu blog.
Qué impide que ChatGPT recupere una página
Cuando una página en vivo no se muestra en ChatGPT, la causa casi siempre es una de cuatro cosas. Ejecuta esto como una checklist en cualquier página que debería aparecer y no lo hace.
| Factor | Qué comprobar | Por qué importa |
|---|---|---|
| Acceso de bots (robots.txt) | ¿Está permitido OAI-SearchBot? ¿GPTBot? ¿ChatGPT-User? | Son tres agentes separados de OpenAI. OAI-SearchBot alimenta la indexación de búsqueda de ChatGPT; ChatGPT-User hace fetches en vivo disparados por el usuario; GPTBot recopila datos de entrenamiento. Bloquea el equivocado y eres invisible para ese camino mientras sigues posicionando en Google. |
| Renderizado | ¿Existe el contenido de la página en el HTML renderizado en servidor, o solo tras ejecutarse el JavaScript en cliente? | Los crawlers que no ejecutan JavaScript ven una cáscara vacía. El contenido que depende de la hidratación en cliente puede ser ilegible para un bot de fetch. El renderizado en servidor o HTML estático es el valor por defecto seguro. |
| Descubribilidad | ¿Está la página en tu sitemap XML? ¿Está enlazada internamente desde páginas que a su vez son rastreables? | Las páginas huérfanas sin enlaces internos ni entrada en el sitemap son difíciles de descubrir. La inclusión en un sitemap más enlaces internos reales es la línea base. |
| Calidad del contenido | ¿La página es escasa, duplicada o texto de relleno que reformula otras fuentes sin añadir nada? | Incluso una página perfectamente accesible pierde la competencia por respuesta si es escasa o duplicativa. ChatGPT favorece fuentes que añaden sustancia corroborada y extraíble. |
El primer factor es el que las agencias se saltan con más frecuencia. Una regla de firewall o CDN, o un robots.txt escrito para Googlebot y nunca actualizado para crawlers de IA, puede dejar pasar a Google mientras bloquea discretamente a OAI-SearchBot. La página posiciona en Google, el cliente asume que todo está bien, y ChatGPT nunca ha podido leerla. Como OpenAI publica las cadenas exactas de user-agent, esto es verificable — pero solo si alguien comprueba de verdad el acceso a nivel de bot en vez de mirar la página en un navegador.
Dónde encaja OpenLens
La comprobación manual funciona para una página cada vez. El problema es que los sitios reales tienen cientos de páginas, las reglas de robots cambian y el comportamiento de ChatGPT se mueve — así que una revisión puntual queda obsoleta.
OpenLens automatiza la pregunta de la recuperabilidad a través de cada página en vez de una cada vez, y mantiene el método conforme ChatGPT cambia para que la comprobación no se rompa discretamente. Su auditoría de Preparación de Sitio y Agentes produce una puntuación de 0 a 100 que señala exactamente los modos de fallo de la checklist de arriba — bloqueos de acceso de bots y problemas de renderizado — y simula los crawlers relevantes (OAI-SearchBot, GPTBot, ChatGPT-User y otros) para reportar si cada uno está siendo bloqueado realmente en tu servidor o CDN, no solo si un navegador humano puede cargar la página. Ese último punto importa: los bloqueos a nivel de bot son invisibles para cualquiera que pruebe en un navegador normal.
ChatGPT es el motor que OpenLens comprueba con más fiabilidad hoy — las citas visibles y los crawlers documentados lo hacen la señal más limpia. OpenLens rastrea la visibilidad a través de 7 plataformas de IA, y el tier gratuito no necesita tarjeta de crédito, así que puedes ejecutar la auditoría de preparación en el sitio de un cliente antes de decidir si el tracking sistemático vale la pena. En el mercado español, donde el uso de ChatGPT entre los usuarios de internet supera ampliamente al del resto de motores, empezar por ChatGPT cubre la mayor parte del tráfico real de IA. Si estás comparando opciones, nuestro repaso de las mejores herramientas gratuitas de visibilidad en IA para agencias de marketing y la comparación detallada de OpenLens frente a Profound explican dónde encaja cada herramienta.
Esto no reemplazará el criterio — una puntuación baja de preparación te dice dónde mirar, no qué escribir — pero convierte "creo que podríamos estar bloqueados en ChatGPT" en un número que puedes entregar a un cliente y una lista de páginas que arreglar.
La versión corta
ChatGPT no indexa tu sitio como Google — recupera y cita unas pocas fuentes por respuesta. Así que la pregunta a responder es si ChatGPT mostrará tu URL, no si estás "en el índice". Revisa puntualmente una sola página importante con una comprobación de frase única o de URL, repetida unas cuantas veces. Si una página en vivo no se muestra, recorre la checklist de cuatro factores: acceso de bots, renderizado, descubribilidad, calidad del contenido. Y como tanto las reglas de robots como el comportamiento de ChatGPT derivan, trata cualquier comprobación — manual o automatizada — como una instantánea, no como una respuesta zanjada.
Última actualización: 18 de junio de 2026.
Fuentes: Documentación de bots de OpenAI, user-agents y comportamiento de robots.txt de GPTBot / OAI-SearchBot / ChatGPT-User (platform.openai.com/docs/bots); documentación de Google Search Central sobre rastreo, indexación y renderizado (developers.google.com/search); Semrush, estudio AI Overviews and the future of search (2024-2026); BrightLocal, Local AI Search Report 2026; Aggarwal et al., GEO: Generative Engine Optimization (Princeton/Georgia Tech/Allen Institute, 2024) sobre cómo los motores generativos seleccionan y citan el contenido de las fuentes.
Frequently Asked Questions
- ¿ChatGPT rastrea mi web?
- No del modo en que lo hace Google. OpenAI opera tres bots separados — GPTBot (datos de entrenamiento), OAI-SearchBot (indexación de búsqueda) y ChatGPT-User (fetches en vivo disparados por la pregunta de un usuario). El que importa para ser citado en las respuestas es OAI-SearchBot. Si tu robots.txt lo bloquea, tus páginas no pueden mostrarse en la búsqueda de ChatGPT, aunque tu sitio posicione bien en Google.
- ¿ChatGPT tiene un índice como Google?
- No uno público que puedas consultar. ChatGPT no mantiene un índice navegable de tu sitio como Google Search Console reporta las páginas indexadas. Recupera un puñado de fuentes en el momento de responder a través de su capa de búsqueda. Así que la pregunta real no es '¿estoy indexado?' — es '¿mostrará y citará ChatGPT mi URL cuando alguien haga una pregunta relevante?'.
- ¿Cómo compruebo si una página concreta es recuperable en ChatGPT?
- Revísala puntualmente. Toma una frase única de la página — una oración que no aparece en ningún otro sitio — y haz a ChatGPT (con la búsqueda activada) una pregunta que debería traerla, o referencia la URL directamente, y observa si ChatGPT muestra y cita esa página. Si de forma consistente no encuentra una página que está en vivo y desbloqueada, probablemente tienes un problema de recuperación que vale la pena diagnosticar.
- ¿Siguen funcionando los viejos trucos del operador 'site:' en ChatGPT?
- No de forma fiable. Los trucos ingenuos de operadores y prompts que circularon en 2024 producen resultados inconsistentes en 2026 porque el comportamiento de búsqueda de ChatGPT cambió y las respuestas no son deterministas. Un solo run dice poco. Necesitas una comprobación de frase única o de referencia de URL, repetida, en vez de una consulta de operador puntual.
- ¿Por qué mi página no aparece en ChatGPT aunque posiciona en Google?
- La causa más común es el acceso de bots — tu robots.txt o firewall permite a Googlebot pero bloquea a OAI-SearchBot o GPTBot. Otras causas: la página se renderiza solo vía JavaScript en cliente, no está en tu sitemap ni enlazada internamente, o el contenido es escaso o duplicado. Google y ChatGPT usan crawlers distintos y lógica de selección distinta, así que posicionar en uno no garantiza el otro.
- ¿Cada cuánto debería re-comprobar la recuperabilidad en ChatGPT?
- Trimestralmente para un sitio estable, y de nuevo 4-6 semanas después de cualquier cambio estructural — una edición de robots.txt, un rediseño, una migración a un framework JavaScript o una nueva regla de firewall. La capa de búsqueda de ChatGPT y el comportamiento de los crawlers de OpenAI cambian con el tiempo, así que una comprobación que pasó hace seis meses no es evidencia de que la página sea recuperable hoy.
Related reading
- Cómo comprobar si los motores de IA han indexado tu web (2026)
- Cómo comprobar si Perplexity ha indexado tu sitio (2026)
- Cómo comprobar si tu negocio aparece en ChatGPT, Perplexity y Google AI Overviews — método gratuito de 5 minutos
- Qué se cita vs se extrae en ChatGPT: 6 patrones de frase que ganan citas