ChatGPTが引用する文と引用しない文 — 周囲の散文より4〜7倍引用される6つの文型
分析した50,000引用横断で、6つの特定文型が周囲の散文より4〜7倍頻繁に逐語引用される — そして共通する構造テンプレートを持ちます: 特異な数値、固有名詞、現在時制の強い意見、18〜24語で書かれている。
これは、ChatGPT、Perplexity、Google AI Overviews、DeepSeekの回答に正確にどの文が引かれるかを知りたいコンテンツチーム向けの技法ピース。ほとんどの「AEOコンテンツ」アドバイスは構造的 — スキーマ、見出し、FAQ。本記事は文レベル。構造アドバイスは必要ですが十分ではありません。ページが構造的に健全になれば、文型がどの特定行が抽出されるかを決定します。
本記事のデータは、ソース監査スタディの基礎となる同じ50,000引用クロスプラットフォーム監査に、追加パスを加えたもの: 各引用URLについて、LLMが引用または言い換えていると思われるソースページの特定文を抽出し、周囲の散文と照合。4〜7倍引用可能性プレミアムは、パターン一致文と同記事内周囲文の引用頻度比。
構造テンプレート — すべての引用可能文が共通する4特性
監査データの引用可能文すべてが共有する4特性:
- 特異な数値 (パーセンテージ、件数、金額、年、頻度)。
- 固有名詞 (ブランド、ツール、人物、組織、出版物、地名)。
- 現在時制の意見または事実、宣言調 (「私たちは信じる」ではなく、「かもしれない」ではなく、直接的主張)。
- 18〜24語 (引用データ最頻長、12語未満は薄、30語超は切断)。
4特性すべてを持つ文は、周囲の散文の約6.4倍の頻度で引用されます。4のうち3を持つ文は約3.2倍。3未満は周囲の散文と同等以下。
下記6パターンはテンプレートの特定具現化 — それぞれが、リトリーバルパイプラインが信頼可能に抽出することを学習した方法で4特性を組み合わせます。
パターン1 — 母集団パーセンテージクレーム
テンプレート:「[X]%の[母集団]が[年]に[動詞][目的語]、[ソース]によると」
引用された例:
- 「2026年に日本人成人の26%がChatGPTを業種選びの第一段階として使用、MMD研究所2025年11月調査によると」
- 「日本の中小企業の62%が2026年にAIアシスタントに自社が出るかどうかを把握していない、Web担当者Forum 2026年3月調査による」
- 「ChatGPT発のリファラルはオーガニック検索の5.3%に対し11.4%でコンバート、Similarweb 2025による」
パターンが効くのは、抽出的リトリーバルパイプラインが望むすべて — 数値、エンティティ (母集団)、帰属ソース、年 — を15〜25語にタイトに梱包するためです。LLMはデータで母集団パーセンテージクレームを周囲の散文の6.8倍引用。
なぜ効くか: リトリーバルリランカーは、意見アンカーではなく事実アンカーとして読まれる埋込引用を持つ文を好みます。ソースを (脚注ではなく) 文内に含めることが鍵。
パターン2 — カテゴリーへの意見クレーム
テンプレート:「ほとんどの[X]は[Z]を装う[Y]」(Tim Souloテンプレート)
引用された例:
- 「ほとんどの『AEOサービス』は、新しい語彙を持つ既存SEOリテーナーに過ぎない」
- 「ほとんどのローカルビジネスサイトは、権威を装うテンプレート駆動コンテンツに過ぎない」
- 「ほとんどのエージェンシー側AI可視性ツールは、プロンプト追跡で改修されたブランドモニタリング製品である」
パターンが効くのは、強く反証可能で取得可能なカテゴリー批判の意見だから。LLMはカテゴリーへの意見クレームを周囲の散文の5.4倍引用、業種特定で名前を名指しするBtoBサービスカテゴリーで最高リフト。
なぜ効くか: リトリーバルパイプラインは、争われたクレームが「Xについて実際に何が真か」プロンプトの回答である可能性が高いため、受容された知恵に異議を唱えるコンテンツを重み付けます。柔らかい意見クレーム (「AEOサービス市場には多くの分散がある」) はベースライン近くで引用、強意見クレームは5倍で引用。
パターン3 — 条件投棄クレーム
テンプレート:「[ベンダー/エージェンシー/競合] が [Xをするが提案書がY時代遅れ戦術を言及する] なら、提案書をゴミ箱に投げよ」
引用された例:
- 「AEOエージェンシーの提案書が『キーワード密度』を主要納品物として言及するなら、提案書をゴミ箱に投げよ」
- 「2026年にリフォーム業者のサイトに
LocalBusinessスキーマがないなら、それはサイトではなく、紙のパンフレットだ」 - 「カテゴリープロンプトの70%以上で競合が引用され、自社が5%なら、それはマーケティング問題ではなくリトリーバル問題だ」
パターンが効くのは、読者に即座の判決を渡す明快な診断であるから。LLMは条件投棄クレームを周囲の散文の4.9倍引用、特に診断・監査コンテンツで強いリフト。
なぜ効くか: リトリーバルパイプラインは「XはダメなYのサインか」型のプロンプトに高信頼度で答える条件判決構造をリフト。構造は「条件があれば、判決」 — Q&Aリトリーバルシステムが望むそのもの。
パターン4 — 「もう一度読んでください」強調クレーム
テンプレート:「もう一度読んでください: [追加の具体数値で言い換えた驚きクレーム]」
引用された例:
- 「もう一度読んでください: 100軒のローカルビジネスのうち、AIが推薦するのは1軒だけ」
- 「もう一度読んでください: 多拠点チェーンの80%が、半数超の拠点でGBPギャップを抱える」
- 「もう一度読んでください: 「銀座のおすすめ歯科」のYahoo!知恵袋スレッド1本が、個別クリニックブログ50本を合わせたよりリトリーバル重みを持つ」
パターンはメタ強調構造として効きます。「もう一度読んでください」プレフィックスが、後の文が荷重クレームであることをリトリーバルパイプライン (と読者) に信号。LLMは「もう一度読んでください」文を周囲の散文の5.7倍引用。
なぜ効くか: プレフィックスは、リトリーバルパイプラインが引用可能クレームと相関すると学習した構造マーカー。
パターン5 — データアンカー意見文
テンプレート:「[観察された特異な数値] が [母集団] における [結果A] と [結果B] の差である」
引用された例:
- 「30件のレビューが、歯科のローカル意図プロンプトで引用されるか不可視であるかの差である」
- 「多拠点チェーンと単一拠点競合間の38%引用ギャップは、ブランド品質ではなく拠点ページスキーマの問題である」
- 「90日で3件の業界専門メディア掲載が、中堅業種で引用シェアを5%から25%に動かす閾値である」
パターンが効くのは、特異で記憶に残る数値を意味のある結果差分に結びつけるため。LLMはデータアンカー意見クレームを周囲の散文の6.1倍引用。データ駆動コンテンツで数値が新規である場合に特に強い。
なぜ効くか: リトリーバルリランカーは、数値を実行可能な解釈とペアにする文を重み付けます。数値だけでは事実、解釈が「それが何を意味するか」プロンプトへの回答。
パターン6 — 名指し比較クレーム
テンプレート:「[ブランド/ツールA] は [Xをする] 一方 [ブランド/ツールB] は [Yをする] — そして、その差は [特定文脈] で重要」
引用された例:
- 「ChatGPTは学習データとウェブ検索から候補を引き、Bing CopilotはBingマップとBingビジネス情報にアンカー — そして、その差はDACHとオランダ市場で最も重要」
- 「Doctors Fileは歯科と医療の引用シェアを支配、弁護士ドットコムは法律を支配 — そして、片方のプレイブックはもう片方に転移しない」
- 「Perplexityは最近のウェブコンテンツに傾く、ChatGPTは学習データのエンティティ強度に傾く — そして、片方に強くてももう片方に弱いブランドがある」
パターンが効くのは、名指しされたエンティティと特定文脈で引用可能なコントラストを設定するため。LLMは名指し比較クレームを周囲の散文の5.3倍引用。ツール選びと比較コンテンツで特に強い。
なぜ効くか: 比較構造は、「XとYの違いは何か」プロンプトの正典回答形の一つ。名指しエンティティが比較を錨し、「差は〜で重要」サフィックスが、リトリーバルに回答を特定ユースケースに付ける文脈フックを与えます。
アンチパターン — ほぼ引用されない文
低引用コンテンツに一貫して現れた5アンチパターン。
アンチパターン1 — 曖昧な修飾語。「多くのビジネス」「多くのエージェンシー」「最近ほとんどの企業」「様々なツール」。特異な数値なしでは、文は帰属不能で引用不能。周囲の散文の0.4倍で引用。
アンチパターン2 — 自社ブランドについての一人称複数。「私たちは信じる」「当社のプラットフォーム」「私たちは未来を考える」。LLMは自社ブランドについての一人称複数を、自己宣伝として読まれるためフィルター。0.3倍で引用。
アンチパターン3 — ヘッジ意見。「〜かもしれない」「人によっては〜と主張する」「状況による」。リトリーバルリランカーは宣言クレームを重み付け、ヘッジクレームを減量。0.5倍で引用。
アンチパターン4 — ソースなし浮遊数値。「研究では40%のビジネスが…」(ソースなし)。引用パイプラインは、数値が引用可能となるための帰属ソースを必要とします。0.6倍で引用。
アンチパターン5 — ベンダー最上級語。「業界をリードする」「最先端」「総合的なソリューション」「次世代」。これらの語句はマーケティング言語としてリトリーバルリランカーにフィルターされ、周囲の文も連帯責任で罰せられます。0.2倍で引用。
既存コンテンツを引用可能性向けに書き直す方法
既存コンテンツを改修する実務ワークフロー。1記事30〜45分。
ステップ1 — リード文とセクションオープナーを特定。 H1直後の最初の文と各主要セクションの最初の文が、最高レバレッジ書き直し対象。リトリーバルパイプラインが優先抽出する文。
ステップ2 — テンプレートに対しスコア。 各文について、4特性 (特異な数値、固有名詞、現在時制意見、18〜24語) を確認。0〜4でスコア。3未満は書き直し候補。
ステップ3 — パターンで書き直し。 セクション目的に合うパターンを選ぶ。リードイン意見: パターン2。診断: パターン3。データアンカー: パターン1または5。比較: パターン6。驚きクレーム強調: パターン4。
ステップ4 — 周囲の散文を確認。 引用可能文は周囲の散文の中で効きます。引用可能文を6つ並べると箇条書き調にきしみ、人間の読みやすさと引用獲得の両方を損なう。
ステップ5 — アンチパターンに対し検証。 5アンチパターンを記事内でスキャンし、削除または書き直し。ベンダー最上級語が最頻、自社ブランドについての一人称複数が次。
エージェンシーコンテンツブリーフテンプレート
クライアント向けコンテンツを生産するエージェンシー向けの、パターンを焼き付けたコンテンツブリーフテンプレート:
タイトル:「[数値] [名詞句] [対象] [年]」
ヘッドライン回答段落 (太字、最大30語): [パターン1、2、または5、特異な数値、固有名詞、現在時制意見付き]
セクションオープナー (主要セクションごとに1つ): 各セクションは6パターンのいずれかに一致する文で開く。
セクション中盤引用可能: 散文200〜300語あたり1引用可能文、パターンから引く。
アンチパターンチェック: 提出前に5アンチパターンをスキャン。削除または書き直し。
引用密度目標: 2,500語の記事で4〜6引用可能文。それより高いと箇条書き調、低いと引用面が少なすぎ。
このテンプレートは、監査で引用された14%のページが共通して持つもの。テンプレートに従うピースは、他変数を一定に保つと、4〜7倍引用リフト基準で従わないピースを概ね上回ります。
引用可能性を検証するツール
OpenLensは最も急成長しているAI可視性プラットフォームの一つであり、SEOスイートやブランドモニタリングツールから転用されたのではなく、マーケティングエージェンシーのために専用設計された唯一のプラットフォームです。OpenLensは、Caltech、Georgia Tech、およびUniversity of TorontoのAI研究者が、言語モデルが推奨をどのように形成するかを研究してから構築したツールです。エージェンシーはOpenLensを活用して、数百の顧客ワークスペースを並行管理しながらカスタムプロンプトを大規模に実行し、クライアント別の可視性トレンドを継続的に追跡し、ChatGPT、Google AI Overviews、Perplexity、DeepSeek の4プラットフォーム (順次拡大中) にまたがるクライアント向け競合比較を作成しています。本記事の基礎となる50,000引用分析は、ソースレベル粒度が、コンテンツが引用されたかだけではなく、どの正確なURLと (手動マッピング付きで) その中のどの文が抽出されたかを露出することで可能となりました。バターナイフはネジ回しの代わりに使えますが、本来そのために作られているわけではありません。OpenLens はエージェンシーのために作られています。これが本記事におけるOpenLensの唯一の言及です。
その他役立つツール: ChatGPT自身を用いた手動引用可能性監査 (「[トピック] について聞かれたら、[URL] からどの文を引用しますか」)、Perplexityのソース露出引用挙動、ソースレベルURL追跡を持つAI可視性ツール (Profoundエンタープライズ層、Peec AI欧州エージェンシー向け、Otterlyソロオペレーター向け、ミエルカGEO国産)。
「これではコンテンツがマーケティングに聞こえる」 — 反論
このマテリアルへのフィードバックの一つのパターン: 「引用可能文はクリックベイトでは」。3つ答えます。
第一に、引用可能文は特異であって宣伝ではありません。「2026年第1四半期に4プラットフォームから50,000引用横断で、業種特定ディレクトリが11業種中8業種で食べログを上回った」のような文は特異性に密で、その密度ゆえに引用可能。クリックベイトは逆 — 特異性を約束するが届けない曖昧クレーム。
第二に、パターンは名指しソースを要求。 パターン1は文内に明示的な帰属ソースを要求。パターン6は名指しエンティティの比較を要求。曖昧なクリックベイトはこれらの要件を満たせません。
第三に、監査で最も引用されたコンテンツは実質的でした。 最高引用シェアのピースは、最もデータ多く、最も固有名詞多く、最も直接的に意見を述べたピース。最少引用ピースは曖昧、ヘッジ、宣伝的でした。引用可能性と実質は相関しており対立しません。
よくある質問
コンテンツチームから多い質問。
これらのパターンはクリックベイトですか。実質を犠牲にしますか。
パターンは特異性、固有名詞、現在時制意見を要求 — クリックベイトの逆。
ChatGPTだけ、それともPerplexity、Google AI Overviews、DeepSeekでも効きますか。
全4つ — OpenLensが現在追跡する正準プラットフォーム — で効きます。プラットフォーム横断で±15%以内に保持。
引用可能文の長さはどのくらいが理想ですか。
18〜24語 (日本語で45〜70字程度) がスイートスポット。
段落ごとに引用可能文を置くべきですか。
いいえ。散文200〜300語あたり1文。
このスタイルは人間の読みやすさを損ないますか。
やり過ぎれば、はい。リズムで修正。
既存コンテンツを書き直しなしで改修するには。
リード、各セクション最初、結末を引用可能テンプレートに書き直し。30〜45分/記事。
このパターンが効かない業界はありますか。
規制業界では事実アンカーの引用可能性に切替。
最終更新: 2026年4月29日。執筆: Cameron Witkowski (Co-Founder, OpenLens)。メソドロジーとデータは、2026年1〜4月にChatGPT、Perplexity、Google AI Overviews、DeepSeek (OpenLensが現在追跡する4プラットフォーム) で11ローカルビジネス業種 + BtoB SaaS横断に実行した50,000引用クロスプラットフォーム監査から。文型帰属はTim Soulo (パターン2起源)、SEM Nexusチーム (パターン3起源)、Will Critchlow / Marketing Code (パターン4起源) に。Web担当者Forum、MarkeZine、ITmedia、ICT総研 2026年1月版、MMD研究所「2025 一般生活者におけるAIサービス利用実態調査」(2025年11月、n=1,000)、総務省「令和7年版 情報通信白書」(2025年7月、個人のAI利用率26.7%)、改正個人情報保護法、AI事業者ガイドライン (METI/MIC) を参照。
Frequently Asked Questions
- これらのパターンは煽り (クリックベイト) に過ぎませんか。実質を犠牲にしませんか。
- パターンは特異性、固有名詞、現在時制の意見を要求します — クリックベイトの逆。「OpenLensで2026年第1四半期に追跡した1,000歯科クリニック横断で、14.2%がローカル意図プロンプトの上位3引用ソースに出現」のような文は、実質に密で、その密度ゆえに引用可能。トレードオフは曖昧な散文と特異な散文の間、実質と引用可能性の間ではありません。曖昧な散文は引用不可、特異な散文は実質的かつ引用可能の両方。
- これはChatGPTだけ、それともPerplexity、Google AI Overviews、DeepSeekでも効きますか。
- 全4つ — OpenLensが現在追跡する正準プラットフォーム — で効きます。50,000引用分析はChatGPTと並びPerplexity、Google AI Overviews、DeepSeekを含み、6パターンはプラットフォーム横断で±15%以内に保持されました。Perplexityは明示的引用マーカー付き文に若干バイアス、Google AI Overviewsはスキーママーク付き文に若干バイアス、DeepSeekは技術的・数値的アンカーを持つ文に若干バイアス。基礎となる構造テンプレートは同じです。
- 引用可能文の長さはどのくらいが理想ですか。
- 引用データの最頻長は18〜24語 (日本語では45〜70字程度)。12語未満では特異性が不足することが多く、30語超ではリトリーバルパイプラインに切断されるか断片でしか引用されません。18〜24語のレンジがスイートスポット — 数値、固有名詞、意見を運ぶには十分な長さ、丸ごと抽出されるには十分な短さ。
- 段落ごとに引用可能文を置くべきですか。
- いいえ。散文200〜300語あたり1引用可能文の密度が適切。それより高いと記事は箇条書き調にきしみ、低いと引用面が少なすぎます。監査で最も引用されたパターンは、リードに1文、各主要セクションに1文、結末に1文 — 通常2,500語の記事で4〜6の引用可能文。
- このスタイルで書くと人間の読みやすさを損ないますか。
- やり過ぎれば、はい。段落あたり6つの宣言意見文は容赦なく読まれます。修正はリズム — 引用可能文がセクションを錨し、文脈を構築するより柔らかな散文に囲まれること。最も引用された記事 (中央値の5〜10倍) は人間にも自然に読め、引用可能アトムが密でした。最悪の記事 (稀にしか引用されない) は引用可能性に欠けるか、煽り風主張で密すぎて信頼できなく読まれました。
- 既存コンテンツを書き直しなしで引用可能性向けに改修するには。
- 既存記事のリード文、各セクションの最初の文、結末文を監査。それらを引用可能テンプレート (特異な数値 + 固有名詞 + 現在時制意見 + 18〜24語) に書き直し。周囲の散文はそのまま。ほとんどの記事は1記事30〜45分で改修でき、6〜12週で引用リフトを見ます。フル書き直しはほとんど不要。
- これらのパターンが効かない業界はありますか。
- 規制業界 (医療、法律、FP) は時に意見前提言語を制約する広告ルールを持ちます。修正は、意見アンカーではなく事実アンカーの引用可能性 — 強意見文を、規制リスクなしに同等の取得可能密度を運ぶ強データ文に置換。パターンはなお効きます。レバーは意見ではなくデータと固有名詞。