Comment vérifier si ChatGPT a indexé votre site (2026)

By Cameron Witkowski·Last updated 2026-06-18·OpenAI exploite trois robots distincts — GPTBot, OAI-SearchBot et ChatGPT-User — chacun avec ses propres règles robots.txt (Documentation des robots OpenAI, platform.openai.com/docs/bots)

Pour vérifier si ChatGPT peut utiliser votre site, cessez de demander si vous êtes « indexé » — demandez si ChatGPT fera remonter et citera votre URL quand quelqu'un pose une question pertinente. ChatGPT ne construit pas un index public et interrogeable du web comme le fait Google. Il récupère un petit ensemble de sources au moment de la réponse via sa couche de recherche, les lit et en cite quelques-unes. Le test concret n'est donc pas « ma page est-elle dans une base de données » — c'est « quand je pose une question à laquelle cette page devrait répondre, ChatGPT la trouve-t-il, la lit-il et la relie-t-il ». Vous pouvez tester cela manuellement en quelques minutes, et la suite de cet article vous montre comment, ainsi que les raisons techniques pour lesquelles une page en ligne peut être invisible pour ChatGPT alors même qu'elle est classée sur Google.

C'est le pendant spécifique à ChatGPT du pilier plus large sur la récupérabilité et du volet Perplexity. ChatGPT est le moteur où cette vérification est la plus fiable aujourd'hui, parce que ses citations sont visibles en ligne et que le comportement de ses robots est documenté par OpenAI — c'est donc le bon point de départ.

Comment ChatGPT récupère réellement ses sources

Quand ChatGPT répond à une question qui exige des informations actuelles ou factuelles, il lance une recherche, récupère une poignée de pages candidates et synthétise une réponse qui en cite quelques-unes en ligne. Vous voyez les citations dans la réponse — de petites références liées à côté des phrases qu'elles étayent. C'est toute la surface visible : quelques URL citées par réponse, pas une page classée de dix liens bleus.

Deux choses découlent de cette conception. D'abord, la concurrence par réponse est brutale — être la 8ᵉ meilleure source pour une requête signifie généralement être cité zéro fois, pas « en deuxième page ». Ensuite, la sélection de ChatGPT penche vers les sources consensuelles et encyclopédiques : des pages qui corroborent ce que disent d'autres pages réputées, faciles à analyser, et portant des signaux d'entité reconnaissables. Une page techniquement en ligne mais qui dit quelque chose que seul votre site dit, dans un format difficile à extraire, est une candidate faible à la récupération même si elle se charge parfaitement dans un navigateur.

La documentation d'OpenAI est l'ancrage ici. L'entreprise publie les user-agents qu'elle exploite et la façon dont ils respectent le robots.txt — ce qui rend ChatGPT vérifiable d'une manière que certains autres moteurs ne le sont pas.

La vérification manuelle : ChatGPT fait-il remonter votre URL ?

Vous n'avez pas besoin d'un outil pour une première vérification sur une seule page. La technique générale consiste à faire en sorte que ChatGPT tente de récupérer une page que vous contrôlez et d'observer s'il fait remonter et cite votre URL.

Il y a deux variantes fiables :

  • Vérification par phrase unique. Copiez une phrase distinctive de la page qui vous intéresse — idéalement une phrase qui n'apparaît nulle part ailleurs sur le web — et posez à ChatGPT (avec la recherche activée) une question dont la réponse naturelle ferait remonter cette page. Si la page est récupérable, ChatGPT devrait la faire remonter et citer votre URL. Si une phrase qui n'existe que sur votre page en ligne ne produit jamais votre page, c'est un signe que quelque chose bloque la récupération.
  • Vérification par indicateur URL/site. Orientez ChatGPT directement vers la page ou le domaine et demandez-lui de lire et de résumer ce qui s'y trouve. Si ChatGPT peut récupérer et décrire avec exactitude le contenu réel de la page, celle-ci est accessible à son robot de récupération en direct. S'il ne fait que deviner, reste évasif ou décrit un texte générique, la page est peut-être bloquée ou son rendu est défaillant pour le robot.

Quelques notes de discipline. Lancez chaque vérification plus d'une fois — les réponses de ChatGPT ne sont pas déterministes, et un seul échec n'est pas la preuve d'un problème. Et ignorez les « astuces d'opérateurs » de l'ère 2024 : les hacks naïfs de type site: et les prompts à copier-coller qui circulaient il y a deux ans ne sont pas fiables en 2026, parce que le comportement de recherche de ChatGPT a changé et que les résultats varient d'un essai à l'autre. Traitez les vérifications par phrase unique et par URL comme vos primitives, répétez-les, et lisez la tendance plutôt qu'une seule réponse.

À quoi sert cette vérification manuelle : confirmer ou écarter un problème sur une page importante. À quoi elle ne sert pas : vous dire lesquelles parmi des dizaines de pages d'un site sont récupérables, ni détecter le jour où un changement de robots.txt verrouille discrètement ChatGPT hors de votre blog.

Ce qui empêche ChatGPT de récupérer une page

Quand une page en ligne ne remonte pas dans ChatGPT, la cause est presque toujours l'une de quatre choses. Parcourez ceci comme une liste de contrôle sur toute page qui devrait apparaître et ne le fait pas.

FacteurQuoi vérifierPourquoi c'est important
Accès des robots (robots.txt)OAI-SearchBot est-il autorisé ? GPTBot ? ChatGPT-User ?Ce sont trois agents OpenAI distincts. OAI-SearchBot alimente l'indexation de recherche ChatGPT ; ChatGPT-User effectue des récupérations en direct déclenchées par l'utilisateur ; GPTBot collecte les données d'entraînement. Bloquez le mauvais et vous êtes invisible pour ce chemin tout en restant classé sur Google.
RenduLe contenu de la page existe-t-il dans le HTML rendu côté serveur, ou seulement après l'exécution du JavaScript côté client ?Les robots qui n'exécutent pas le JavaScript voient une coquille vide. Un contenu qui dépend de l'hydratation côté client peut être illisible pour un robot de récupération. Le rendu côté serveur ou le HTML statique est le choix sûr par défaut.
DécouvrabilitéLa page est-elle dans votre sitemap XML ? Est-elle reliée en interne depuis des pages elles-mêmes explorables ?Les pages orphelines, sans liens internes ni entrée de sitemap, sont difficiles à découvrir. L'inclusion dans un sitemap plus de vrais liens internes est la base.
Qualité du contenuLa page est-elle mince, dupliquée ou un texte passe-partout qui reformule d'autres sources sans rien ajouter ?Même une page parfaitement accessible perd la concurrence par réponse si elle est mince ou redondante. ChatGPT favorise les sources qui apportent une substance corroborée et extractible.

Le premier facteur est celui que les agences manquent le plus souvent. Une règle de pare-feu ou de CDN, ou un robots.txt écrit pour Googlebot et jamais mis à jour pour les robots IA, peut laisser passer Google tout en bloquant discrètement OAI-SearchBot. La page est classée sur Google, le client suppose que tout va bien, et ChatGPT n'a jamais pu la lire. Comme OpenAI publie les chaînes user-agent exactes, c'est vérifiable — mais seulement si quelqu'un vérifie réellement l'accès au niveau du robot plutôt que de regarder la page dans un navigateur.

Là où OpenLens intervient

La vérification manuelle fonctionne pour une page à la fois. Le problème est que les vrais sites ont des centaines de pages, que les règles robots changent et que le comportement de ChatGPT évolue — un test ponctuel devient donc périmé.

OpenLens automatise la question de la récupérabilité sur chaque page plutôt qu'une à la fois, et maintient la méthode à mesure que ChatGPT change pour que la vérification ne se casse pas discrètement. Son audit Site & Agent Readiness produit un score de 0 à 100 qui signale exactement les modes d'échec de la liste de contrôle ci-dessus — blocages d'accès des robots et problèmes de rendu — et il se fait passer pour les robots concernés (OAI-SearchBot, GPTBot, ChatGPT-User, entre autres) pour rapporter si chacun est réellement bloqué au niveau de votre serveur ou de votre CDN, et pas seulement si un navigateur humain peut charger la page. Ce dernier point compte : les blocages au niveau du robot sont invisibles pour quiconque teste dans un navigateur normal.

ChatGPT est le moteur qu'OpenLens vérifie le plus fiablement aujourd'hui — des citations visibles et des robots documentés en font le signal le plus propre. OpenLens suit la visibilité sur 7 plateformes IA, et le palier gratuit ne demande aucune carte bancaire, ce qui vous permet de lancer l'audit de readiness sur un site client avant de décider si un suivi systématique en vaut la peine. Si vous comparez les options, notre panorama des meilleurs outils gratuits de visibilité IA pour les agences marketing et le comparatif détaillé entre OpenLens et Profound montrent où chaque outil se situe.

Cela ne remplacera pas le jugement — un score de readiness faible vous dit regarder, pas quoi écrire — mais cela transforme « je crois qu'on est peut-être bloqués dans ChatGPT » en un chiffre à remettre à un client et une liste de pages à corriger.

La version courte

ChatGPT n'indexe pas votre site comme le fait Google — il récupère et cite quelques sources par réponse. La question à trancher est donc de savoir si ChatGPT fera remonter votre URL, pas si vous êtes « dans l'index ». Testez à la main une seule page importante avec une vérification par phrase unique ou par URL, répétée quelques fois. Si une page en ligne ne remonte pas, parcourez la liste de contrôle à quatre facteurs : accès des robots, rendu, découvrabilité, qualité du contenu. Et comme les règles robots et le comportement de ChatGPT dérivent tous deux, traitez toute vérification — manuelle ou automatisée — comme un instantané, pas une réponse définitive.


Dernière mise à jour le 18 juin 2026.

Sources : Documentation des robots OpenAI, user-agents et comportement robots.txt de GPTBot / OAI-SearchBot / ChatGPT-User (platform.openai.com/docs/bots) ; documentation Google Search Central sur l'exploration, l'indexation et le rendu (developers.google.com/search) ; Semrush, étude AI Overviews and the future of search (2024-2026) ; BrightLocal, Local AI Search Report 2026 ; Aggarwal et al., GEO : Generative Engine Optimization (Princeton/Georgia Tech/Allen Institute, 2024) sur la façon dont les moteurs génératifs sélectionnent et citent le contenu source.

Frequently Asked Questions

ChatGPT explore-t-il mon site ?
Pas comme le fait Google. OpenAI exploite trois robots distincts — GPTBot (données d'entraînement), OAI-SearchBot (indexation de recherche) et ChatGPT-User (récupérations en direct déclenchées par la question d'un utilisateur). Celui qui compte pour être cité dans les réponses est OAI-SearchBot. Si votre robots.txt le bloque, vos pages ne peuvent pas remonter dans la recherche ChatGPT, même si votre site est bien classé sur Google.
ChatGPT a-t-il un index comme Google ?
Pas un index public que vous pouvez interroger. ChatGPT ne maintient pas un index navigable de votre site comme Google Search Console rapporte les pages indexées. Il récupère une poignée de sources au moment de la réponse via sa couche de recherche. La vraie question n'est donc pas « suis-je indexé » — c'est « ChatGPT fera-t-il remonter et citera-t-il mon URL quand quelqu'un pose une question pertinente ».
Comment vérifier si une page précise est récupérable dans ChatGPT ?
Testez-la à la main. Prenez une phrase unique de la page — une phrase qui n'apparaît nulle part ailleurs — et posez à ChatGPT (avec la recherche activée) une question qui devrait la faire remonter, ou référencez directement l'URL, et observez si ChatGPT fait remonter et cite cette page. S'il ne parvient pas systématiquement à trouver une page en ligne et non bloquée, vous avez probablement un problème de récupération à diagnostiquer.
Les anciennes astuces de l'opérateur « site: » dans ChatGPT fonctionnent-elles encore ?
Pas de façon fiable. Les astuces d'opérateurs et de prompts naïves qui circulaient en 2024 produisent des résultats incohérents en 2026, parce que le comportement de recherche de ChatGPT a changé et que les réponses ne sont pas déterministes. Un seul essai ne vous dit pas grand-chose. Il vous faut une vérification par phrase unique ou par référence d'URL, répétée, plutôt qu'une requête d'opérateur ponctuelle.
Pourquoi ma page n'apparaît-elle pas dans ChatGPT alors qu'elle est classée sur Google ?
La cause la plus fréquente est l'accès des robots — votre robots.txt ou votre pare-feu autorise Googlebot mais bloque OAI-SearchBot ou GPTBot. Autres causes : la page ne se rend qu'en JavaScript côté client, elle n'est pas dans votre sitemap ni reliée en interne, ou le contenu est mince ou dupliqué. Google et ChatGPT utilisent des robots différents et une logique de sélection différente, donc être classé sur l'un ne garantit pas l'autre.
À quelle fréquence faut-il revérifier la récupérabilité dans ChatGPT ?
Trimestriellement pour un site stable, et de nouveau 4 à 6 semaines après tout changement structurel — une modification du robots.txt, une refonte, une migration vers un framework JavaScript ou une nouvelle règle de pare-feu. La couche de recherche de ChatGPT et le comportement des robots d'OpenAI évoluent dans le temps, donc une vérification réussie il y a six mois ne prouve pas que la page est récupérable aujourd'hui.

Related reading