ChatGPTは自社サイトをクロールしますか？

Googleと同じ形ではありません。OpenAIは3つの別々のボット — GPTBot (学習データ)、OAI-SearchBot (検索インデックス)、ChatGPT-User (ユーザーの質問が引き起こすライブ取得) — を運用します。回答内で引用されるために重要なのはOAI-SearchBotです。robots.txtがこれをブロックしていると、Googleで上位にあってもChatGPTの検索で表示されません。

ChatGPTにはGoogleのようなインデックスがありますか？

照会できる公開インデックスはありません。ChatGPTはGoogle Search Consoleが報告するような、閲覧可能なサイトのインデックスを保持していません。回答時に検索レイヤーを通じて少数のソースを取得します。だから本当の問いは「インデックスされているか」ではなく「関連する質問が尋ねられたとき、ChatGPTが自社URLを提示・引用するか」です。

特定のページがChatGPTで取得可能か、どう確認すればよいですか？

スポットチェックします。そのページからしか出てこない固有のフレーズ — どこにも存在しない一文 — を取り、(検索を有効にした) ChatGPTにそれを引き出すはずの質問をするか、URLを直接参照させ、ChatGPTがそのページを提示・引用するか確認します。公開されておりブロックもされていないページを一貫して見つけられないなら、診断する価値のある取得問題がある可能性が高いです。

昔のChatGPTの「site:」演算子テクニックはまだ効きますか？

確実には効きません。2024年に出回った素朴な演算子やプロンプトのテクニックは、ChatGPTの検索挙動が変わり回答が非決定的なため、2026年には一貫しない結果を出します。1回の実行では何も分かりません。1回限りの演算子クエリではなく、固有フレーズまたはURL参照チェックを繰り返す必要があります。

Googleで上位なのに、なぜページがChatGPTに表示されないのですか？

最も多い原因はボットアクセスです — robots.txtやファイアウォールがGooglebotを許可しつつOAI-SearchBotやGPTBotをブロックしている。他の原因：ページがクライアントサイドJavaScriptでしかレンダリングされない、サイトマップにない/内部リンクがない、コンテンツが薄い/重複している、など。GoogleとChatGPTは別々のクローラーと選択ロジックを使うため、一方での順位は他方を保証しません。

ChatGPTの取得可能性はどのくらいの頻度で再確認すべきですか？

安定したサイトなら四半期ごと、そして構造変更 — robots.txtの編集、リデザイン、JavaScriptフレームワークへの移行、新しいファイアウォールルール — の4〜6週間後に再確認します。ChatGPTの検索レイヤーとOpenAIのクローラー挙動は時間とともに変わるため、半年前に通ったチェックは今ページが取得可能である証拠にはなりません。

ChatGPTが自社サイトを「インデックス」したか確認する方法 (2026年版)

By Cameron Witkowski·Last updated 2026-06-18·OpenAIは3つの異なるクローラー — GPTBot、OAI-SearchBot、ChatGPT-User — を運用し、それぞれrobots.txtのルールが別々 (OpenAI ボットドキュメント, platform.openai.com/docs/bots)

ChatGPTが自社サイトを使えるか確認するには、「インデックスされているか」を問うのをやめ、「関連する質問が尋ねられたとき、ChatGPTが自社URLを提示・引用するか」を問いましょう。 ChatGPTはGoogleのように、照会可能な公開ウェブインデックスを構築しません。回答時に検索レイヤーを通じて少数のソースを取得し、読み、いくつかを引用します。つまり実務的なテストは「自社ページがデータベースに入っているか」ではなく「このページが答えるべき質問をしたとき、ChatGPTがそれを見つけ、読み、リンクするか」です。これは数分で手動スポットチェックでき、本記事の残りでその方法と、Googleで上位でもライブページがChatGPTから見えなくなる技術的理由を示します。

これは、より広範な取得可能性のピラー記事とPerplexity編に対するChatGPT特化の補完記事です。ChatGPTは引用がインラインで見え、クローラー挙動がOpenAIによって文書化されているため、このチェックが現在最も信頼できるエンジンです — だから出発点として最適です。

ChatGPTが実際にソースを引く仕組み

ChatGPTが最新または事実情報を要する質問に答えるとき、検索を発行し、候補ページをいくつか取得し、その一部をインラインで引用する回答を合成します。回答内に引用が見えます — 支える文の隣に並ぶ小さなリンク付き参照です。見えるのはそれがすべて：回答ごとに数件の引用URLであって、10件の青いリンクが並ぶページではありません。

この設計から2点が導かれます。第一に、回答ごとの競争は熾烈です — あるクエリで8番目に良いソースであることは、たいてい「2ページ目」ではなく「引用ゼロ」を意味します。第二に、ChatGPTの選択はコンセンサス的で百科事典的なソースに偏ります：他の信頼できるページが言うことを裏付け、解析しやすく、認識可能なエンティティシグナルを持つページです。技術的には公開されていても、自社サイトだけが言うことを抽出しにくい形式で述べているページは、ブラウザで問題なく読み込めても弱い取得候補です。

OpenAI自身のドキュメントがここでの拠り所です。同社は運用するユーザーエージェントと、それらが robots.txt をどう尊重するかを公開しています — これこそが、他の一部エンジンと違いChatGPTが確認可能である理由です。

手動チェック：ChatGPTは自社URLを提示するか？

1ページの一次チェックにツールは不要です。一般的な手法は、自分が管理するページをChatGPTに取得させようとし、自社URLを提示・引用するか観察することです。

信頼できるバリエーションが2つあります。

固有フレーズチェック。 対象ページから特徴的な一文 — 理想的にはウェブ上のどこにも現れないフレーズ — をコピーし、(検索を有効にした) ChatGPTに、自然な答えがそのページを引き出すような質問をします。ページが取得可能なら、ChatGPTはそれを提示し自社URLを引用するはずです。ライブページにしか存在しないフレーズが一度も自社ページを出さないなら、取得を妨げる何かがある合図です。
URL/サイト指定チェック。 ChatGPTにページまたはドメインを直接指して、そこにある内容を読んで要約させます。ChatGPTがページの実際のコンテンツを取得して正確に説明できれば、ライブ取得ボットがそのページに到達できています。推測したり、はぐらかしたり、一般的な定型文を説明するだけなら、ボットにとってページがブロックされているかレンダリング不全かもしれません。

規律のメモをいくつか。各チェックは複数回実行してください — ChatGPTの回答は非決定的で、1回の外れは問題の証明ではありません。そして2024年期の「演算子テクニック」は無視してください：2年前に出回った素朴な site: 形式やコピペのプロンプトハックは、ChatGPTの検索挙動が変わり結果が実行ごとに変動するため、2026年には信頼できません。固有フレーズとURLチェックをプリミティブとして扱い、繰り返し、単一の回答ではなくパターンを読んでください。

この手動チェックが得意なこと：重要な1ページの問題を確認または除外すること。苦手なこと：サイト上の数十ページのうちどれが取得可能かを教えること、あるいはrobots.txtの変更が静かにChatGPTをブログから締め出した日を捉えること。

ChatGPTがページを取得するのを妨げる要因

ライブページがChatGPTに表示されないとき、原因はほぼ常に4つのうちの1つです。表示されるべきなのにされないページに対して、これをチェックリストとして実行してください。

要因	確認すること	なぜ重要か
ボットアクセス (robots.txt)	`OAI-SearchBot` は許可されているか？ `GPTBot` は？ `ChatGPT-User` は？	これらは3つの別々のOpenAIエージェント。`OAI-SearchBot` がChatGPT検索インデックスを担い、`ChatGPT-User` がユーザー起点のライブ取得を行い、`GPTBot` が学習データを集める。間違ったものをブロックすると、Googleで上位のままその経路からは見えなくなる。
レンダリング	コンテンツはサーバーレンダリングされたHTMLに存在するか、それともクライアントサイドJavaScript実行後にのみ現れるか？	JavaScriptを実行しないクローラーは空のシェルを見る。クライアントサイドのハイドレーションに依存するコンテンツは取得ボットに読めないことがある。サーバーサイドレンダリングまたは静的HTMLが安全な既定。
発見可能性	ページはXMLサイトマップにあるか？クロール可能なページから内部リンクされているか？	内部リンクもサイトマップエントリもない孤立ページは発見が困難。サイトマップへの掲載と実際の内部リンクが基準線。
コンテンツ品質	ページは薄いか、重複しているか、他ソースを言い換えただけの定型文か？	完全にアクセス可能なページでも、薄い/重複なら回答ごとの競争に負ける。ChatGPTは裏付けがあり抽出可能な実質を加えるソースを好む。

最初の要因はエージェンシーが最も見落とすものです。ファイアウォールやCDNのルール、あるいはGooglebot向けに書かれAIクローラー向けに更新されなかった robots.txt が、Googleを通しつつ静かに OAI-SearchBot をブロックすることがあります。ページはGoogleで上位、クライアントは万事順調と思い込み、ChatGPTは一度もそれを読めていない。OpenAIが正確なユーザーエージェント文字列を公開しているため、これは検証可能です — ただし、ブラウザでページを目視するのではなく、誰かが実際にボットレベルのアクセスを確認した場合に限ります。

OpenLensの位置づけ

手動チェックは一度に1ページなら有効です。問題は、実際のサイトには数百ページあり、robotsルールが変わり、ChatGPTの挙動も動くこと — だから一度きりのスポットチェックは陳腐化します。

OpenLensは一度に1つではなくすべてのページにわたって取得可能性の問いを自動化し、ChatGPTが変わってもチェックが静かに壊れないよう手法を維持します。サイト & エージェント準備度監査 は0〜100のスコアを出し、上記チェックリストの失敗モード — ボットアクセスのブロックとレンダリング問題 — をまさに洗い出します。そして関連するクローラー (OAI-SearchBot、GPTBot、ChatGPT-User など) になりすまし、それぞれが実際にサーバーやCDNでブロックされているか — 人間のブラウザがページを読み込めるかどうかではなく — を報告します。この最後の点が重要です：ボットレベルのブロックは、通常のブラウザでテストする誰にも見えません。

ChatGPTは、現在OpenLensが最も確実に確認するエンジンです — 見える引用と文書化されたクローラーが最もクリーンなシグナルにします。OpenLensは7つのAIプラットフォームで可視性を追跡し、無料プランはクレジットカード不要なので、体系的な追跡が見合うか決める前にクライアントサイトで準備度監査を実行できます。選択肢を比較中なら、マーケティングエージェンシー向けの無料AI可視性ツールまとめとOpenLensとProfoundの詳細比較が、各ツールの位置づけを示します。

これは判断を置き換えるものではありません — 低い準備度スコアはどこを見るべきかを教えますが何を書くかは教えません — が、「ChatGPTでブロックされているかも」を、クライアントに渡せる数字と修正すべきページのリストに変えます。

短くまとめると

ChatGPTはGoogleのようにサイトをインデックスしません — 回答ごとに数件のソースを取得・引用します。だから答えるべき問いは「インデックスに入っているか」ではなく「ChatGPTが自社URLを提示するか」です。重要な1ページを固有フレーズまたはURLチェックで、数回繰り返してスポットチェックしてください。ライブページが表示されないなら、4要因チェックリスト — ボットアクセス、レンダリング、発見可能性、コンテンツ品質 — をたどります。そしてrobotsルールもChatGPTの挙動も漂流するため、手動・自動を問わずどのチェックも、確定した答えではなくスナップショットとして扱ってください。

最終更新：2026年6月18日。

出典： OpenAI ボットドキュメント、GPTBot / OAI-SearchBot / ChatGPT-User のユーザーエージェントとrobots.txt挙動 (platform.openai.com/docs/bots)；Google Search Centralのクロール・インデックス・レンダリングに関するドキュメント (developers.google.com/search)；Semrush, AI Overviews and the future of search 調査 (2024-2026)；BrightLocal, Local AI Search Report 2026；Aggarwal et al., GEO: Generative Engine Optimization (Princeton/Georgia Tech/Allen Institute, 2024) — 生成エンジンがソースコンテンツをどう選択・引用するかについて。

Frequently Asked Questions

ChatGPTは自社サイトをクロールしますか？: Googleと同じ形ではありません。OpenAIは3つの別々のボット — GPTBot (学習データ)、OAI-SearchBot (検索インデックス)、ChatGPT-User (ユーザーの質問が引き起こすライブ取得) — を運用します。回答内で引用されるために重要なのはOAI-SearchBotです。robots.txtがこれをブロックしていると、Googleで上位にあってもChatGPTの検索で表示されません。
ChatGPTにはGoogleのようなインデックスがありますか？: 照会できる公開インデックスはありません。ChatGPTはGoogle Search Consoleが報告するような、閲覧可能なサイトのインデックスを保持していません。回答時に検索レイヤーを通じて少数のソースを取得します。だから本当の問いは「インデックスされているか」ではなく「関連する質問が尋ねられたとき、ChatGPTが自社URLを提示・引用するか」です。
特定のページがChatGPTで取得可能か、どう確認すればよいですか？: スポットチェックします。そのページからしか出てこない固有のフレーズ — どこにも存在しない一文 — を取り、(検索を有効にした) ChatGPTにそれを引き出すはずの質問をするか、URLを直接参照させ、ChatGPTがそのページを提示・引用するか確認します。公開されておりブロックもされていないページを一貫して見つけられないなら、診断する価値のある取得問題がある可能性が高いです。
昔のChatGPTの「site:」演算子テクニックはまだ効きますか？: 確実には効きません。2024年に出回った素朴な演算子やプロンプトのテクニックは、ChatGPTの検索挙動が変わり回答が非決定的なため、2026年には一貫しない結果を出します。1回の実行では何も分かりません。1回限りの演算子クエリではなく、固有フレーズまたはURL参照チェックを繰り返す必要があります。
Googleで上位なのに、なぜページがChatGPTに表示されないのですか？: 最も多い原因はボットアクセスです — robots.txtやファイアウォールがGooglebotを許可しつつOAI-SearchBotやGPTBotをブロックしている。他の原因：ページがクライアントサイドJavaScriptでしかレンダリングされない、サイトマップにない/内部リンクがない、コンテンツが薄い/重複している、など。GoogleとChatGPTは別々のクローラーと選択ロジックを使うため、一方での順位は他方を保証しません。
ChatGPTの取得可能性はどのくらいの頻度で再確認すべきですか？: 安定したサイトなら四半期ごと、そして構造変更 — robots.txtの編集、リデザイン、JavaScriptフレームワークへの移行、新しいファイアウォールルール — の4〜6週間後に再確認します。ChatGPTの検索レイヤーとOpenAIのクローラー挙動は時間とともに変わるため、半年前に通ったチェックは今ページが取得可能である証拠にはなりません。