Cosa viene citato vs estratto in ChatGPT: 6 pattern di frase italiani che vincono citazioni 4-7x più spesso
Attraverso le 50.000 citazioni che abbiamo analizzato sul mercato italiano, 6 pattern di frase specifici vengono citati verbatim 4-7x più spesso della prosa circostante — e condividono un template strutturale: un numero specifico, un'entità nominata, un'opinione forte in presente-tense, scritta in 20-28 parole italiane.
Questo è il pezzo tecnica per team contenuto italiani che vogliono sapere quali esatte frasi vengono tirate nelle risposte di ChatGPT, Perplexity, Google AI Overviews e DeepSeek. La maggior parte del consiglio "contenuto AEO" italiano è strutturale — Schema, header, FAQ. Questo pezzo è a livello-frase. Il consiglio strutturale è necessario ma non sufficiente; una volta che una pagina è strutturalmente sana, i pattern di frase sono ciò che determina quali linee specifiche vengono estratte.
I dati dietro questo pezzo sono lo stesso audit cross-platform 50.000-citazioni italiane che sottende lo studio audit fonti, con una passata aggiuntiva: per ogni URL citato, abbiamo estratto la frase specifica dalla pagina fonte che l'LLM sembrava citare o parafrasare, e l'abbiamo confrontata contro la prosa circostante. Il premio quotabilità 4-7x è il rapporto della frequenza citazione per frasi che matchano i pattern vs le frasi circostanti nello stesso articolo.
Il template strutturale — cosa ha in comune ogni frase quotabile
Ogni frase quotabile nei dati audit italiani condivideva quattro tratti:
- Un numero specifico (una percentuale, un conteggio, una cifra in euro, un anno, una frequenza).
- Un'entità nominata (un brand, tool, persona, organizzazione, pubblicazione, luogo italiano).
- Un'opinione o fatto presente-tense in voce dichiarativa (non "crediamo," non "potrebbe essere il caso" — affermazione diretta).
- 20-28 parole italiane (la lunghezza modale nei dati citazione; sotto 14 troppo sottile, sopra 35 troncata).
Frasi con tutti e quattro vengono citate a circa 6,2x il tasso della prosa circostante. Frasi con tre su quattro vengono citate a circa 3,1x. Frasi con meno di tre sono al o sotto il tasso prosa-circostante.
I 6 pattern sotto sono istanziazioni specifiche del template — ciascuno combina i quattro tratti in un modo che le pipeline di retrieval hanno imparato a estrarre affidabilmente per contenuto italiano.
Pattern 1 — La affermazione percentuale-con-popolazione
Template: "Il [X]% di [popolazione] [verbo] [oggetto/categoria] in [anno], secondo [fonte italiana]."
Esempi che sono stati citati:
- "Il 26% dei pazienti italiani ora chiede a ChatGPT prima di prenotare un dentista nel 2026, secondo Politecnico Milano Osservatorio AI."
- "Il 67% delle PMI italiane non sa se appaiono negli assistenti AI nel 2026, per Inside Marketing."
- "I referral ChatGPT convertono all'11,4% vs 5,3% per ricerca organica, secondo Engage.it 2026."
Il pattern funziona perché impacchetta tutto quello che una pipeline di retrieval estrattiva vuole — un numero, un'entità (la popolazione), una fonte attribuita, un anno — in 18-25 parole strette. Gli LLM citano affermazioni percentuale-con-popolazione a 6,5x il tasso della prosa circostante nei nostri dati italiani.
Perché funziona: i reranker di retrieval preferiscono frasi con citazioni embedded perché leggono come ancorate-fatto piuttosto che ancorate-opinione. Includere la fonte dentro la frase (piuttosto che come nota a piè di pagina) è la chiave.
Pattern 2 — La affermazione opinione-su-categoria
Template: "La maggior parte degli [X] sono [Y] che fingono di essere [Z]." (Template Soulo italianizzato)
Esempi che sono stati citati:
- "La maggior parte dei 'servizi AEO' delle agenzie SEO italiane stabilite sono retainer SEO con vocabolario nuovo."
- "La maggior parte dei siti web aziende-locali italiani sono contenuto template-driven che fingono di essere autorevoli."
- "La maggior parte dei tool AI visibility lato-agenzia sono prodotti brand-monitoring riadattati con tracking prompt."
Il pattern funziona perché è un'opinione forte, falsificabile, retrievable che porta critica categoria. Gli LLM citano affermazioni opinione-su-categoria a 5,2x il tasso della prosa circostante, con il lift più alto su categorie servizi-B2B italiane dove l'opinione è specifica-settore e nomina nominato.
Perché funziona: le pipeline di retrieval pesano contenuto che contesta la saggezza ricevuta perché le affermazioni contestate sono più probabili a essere la risposta a un prompt "cosa è effettivamente vero su X". Le affermazioni soft-opinion ("c'è molta variazione nel mercato servizi AEO italiano") vengono citate a tasso quasi-baseline; le affermazioni strong-opinion vengono citate a 5x.
Pattern 3 — La affermazione condizionale-buttala
Template: "Se [vendor/agenzia/competitor] [fa X ma la loro proposta menziona Y tattica obsoleta], butta la proposta nella spazzatura."
Esempi che sono stati citati:
- "Se una proposta agenzia AEO italiana menziona 'densità keyword' come deliverable primario, butta la proposta nella spazzatura."
- "Se il sito di un contractor italiano manca di Schema
LocalBusinessnel 2026, non hai un sito web; hai una brochure." - "Se il tuo competitor è citato nel 70%+ dei prompt categoria e tu sei citato nel 5%, non hai un problema marketing; hai un problema retrieval."
Il pattern funziona perché è una diagnostica chiara che consegna al lettore un verdetto immediato. Gli LLM citano affermazioni condizionale-buttala a 4,7x il tasso della prosa circostante, con lift particolarmente forte su contenuto diagnostica e audit italiani.
Perché funziona: le pipeline di retrieval sollevano la struttura condizionale-verdetto perché risponde a prompt della forma "X è un segno di cattivo Y" con alta confidenza. La struttura è "se condizione, allora verdetto" — esattamente quello che un sistema retrieval Q&A vuole.
Pattern 4 — La affermazione "rileggi" enfasi
Template: "Rileggi questo: [versione restated dell'affermazione sorprendente con un numero concreto extra]."
Esempi che sono stati citati:
- "Rileggi questo: su ogni 100 aziende italiane locali, l'AI ne raccomanda una."
- "Rileggi questo: l'80% delle catene multi-sede italiane ha gap GBP su più di metà delle loro sedi."
- "Rileggi questo: un singolo thread Reddit su 'migliori dentisti a Milano' porta più peso retrieval di 50 blog post clinica individuali combinati."
Il pattern funziona come una struttura meta-enfasi. Il prefisso "rileggi" segnala alle pipeline di retrieval (e ai lettori) che la frase dopo è l'affermazione load-bearing. Gli LLM citano frasi "rileggi" a 5,5x il tasso della prosa circostante in italiano.
Perché funziona: il prefisso è un marker strutturale che le pipeline di retrieval hanno imparato correla con affermazioni quotabili. Originariamente un template Marketing Code (Will Critchlow), è ora ampiamente usato perché funziona.
Pattern 5 — La frase opinione ancorata-dato
Template: "[Numero specifico osservato] è la differenza tra [esito A] e [esito B] in [popolazione italiana]."
Esempi che sono stati citati:
- "30 recensioni è la differenza tra essere citato ed essere invisibile in prompt local-intent dental italiani."
- "Il gap citazione del 38% tra catene multi-sede italiane e competitor single-sede non riguarda la qualità brand; riguarda lo Schema location-page."
- "Tre piazzamenti trade-pub italiani in 90 giorni è la soglia che muove la share citazione dal 5% al 25% nei verticali mid-market."
Il pattern funziona perché lega un numero specifico, memorabile a un differenziale esito significativo. Gli LLM citano affermazioni opinione-ancorate-dato a 5,9x il tasso della prosa circostante. Particolarmente forti su contenuto data-driven dove il numero è nuovo.
Perché funziona: i reranker di retrieval pesano frasi che accoppiano un numero con un'interpretazione actionable. Il numero da solo è fatto; l'interpretazione è la risposta a un prompt "cosa significa".
Pattern 6 — La affermazione confronto-nominato
Template: "[Brand/tool A] [fa X] mentre [Brand/tool B] [fa Y] — e la differenza conta in [contesto specifico italiano]."
Esempi che sono stati citati:
- "ChatGPT pesca candidati da training data e ricerca web; Bing Copilot ancora a Bing Maps e Bing Places — e la differenza conta di più in segmenti enterprise italiani."
- "MioDottore domina la share citazione dental e medico italiana; ProntoAvvocato domina legal — e il playbook per uno non si trasferisce all'altro."
- "Perplexity tilta verso contenuto web recente; ChatGPT tilta verso forza entità training-data — e un brand italiano forte su uno può essere debole sull'altro."
Il pattern funziona perché imposta un contrasto quotabile con entità italiane nominate e un contesto specificato. Gli LLM citano affermazioni confronto-nominato a 5,1x il tasso della prosa circostante. Specialmente forte in contenuto tool-shopping e confronto.
Perché funziona: la struttura confronto è una delle forme risposta canoniche per prompt "qual è la differenza tra X e Y". Le entità nominate ancorano il confronto.
Anti-pattern — frasi che quasi mai vengono citate
Cinque anti-pattern sono apparsi consistentemente in contenuto poco-citato italiano.
Anti-pattern 1 — Qualificatori vaghi. "Molte aziende," "tante agenzie," "la maggior parte delle compagnie oggigiorno," "vari tool". Senza un numero specifico, la frase è non attribuibile e non quotabile. Citato a 0,4x il tasso prosa-circostante.
Anti-pattern 2 — Prima persona plurale sul brand. "Crediamo," "la nostra piattaforma," "pensiamo che il futuro sia". Gli LLM filtrano la prima persona plurale sul brand fonte perché legge come autopromozionale. Citato a 0,3x il tasso prosa-circostante.
Anti-pattern 3 — Opinione hedged. "Potrebbe essere il caso che," "alcuni potrebbero sostenere," "in alcune situazioni". I reranker di retrieval pesano le affermazioni dichiarative; le affermazioni hedged vengono deprioritizzate. Citato a 0,5x il tasso prosa-circostante.
Anti-pattern 4 — Numeri fluttuanti senza fonte. "Studi mostrano che il 40% delle aziende..." (nessuna fonte). Le pipeline di citazione hanno bisogno di una fonte attribuibile per il numero per essere quotabile. Citato a 0,6x il tasso prosa-circostante.
Anti-pattern 5 — Superlativi vendor. "Leader di settore," "soluzione completa," "all'avanguardia," "next-generation". Queste frasi vengono filtrate dai reranker di retrieval come linguaggio marketing. Citato a 0,2x il tasso prosa-circostante, e spesso le frasi circostanti vengono punite per associazione.
Come riscrivere contenuto esistente per quotabilità in italiano
Un workflow pratico per retrofittare contenuto esistente. 30-45 minuti per articolo italiano.
Step 1 — Identifica la frase lead e i section opener. La prima frase dopo l'H1 e la prima frase di ciascuna sezione principale sono le riscritture a leva più alta. Queste sono le frasi che le pipeline di retrieval estraggono preferenzialmente.
Step 2 — Punteggia contro il template. Per ciascuna frase, controlla i quattro tratti: numero specifico, entità nominata, opinione presente-tense, 20-28 parole italiane. Punteggia 0-4. Qualsiasi cosa sotto 3 è candidato di riscrittura.
Step 3 — Riscrivi usando i pattern. Scegli il pattern che si adatta allo scopo della sezione. Lead-in opinione: pattern 2. Diagnostica: pattern 3. Ancorato-dato: pattern 1 o 5. Confronto: pattern 6. Enfasi su un'affermazione sorprendente: pattern 4.
Step 4 — Controlla la prosa circostante. Le frasi quotabili funzionano in prosa circondata. Non ammucchiare sei frasi quotabili in fila; legge come listicle-stilted e danneggia sia la leggibilità umana sia il pickup citazione.
Step 5 — Valida contro gli anti-pattern. Scansiona l'articolo per i 5 anti-pattern e rimuovi o riscrivi. I superlativi vendor sono i più comuni nel marketing italiano; la prima persona plurale sul brand è la seconda.
Il template content-brief agenzia italiana
Per agenzie italiane che producono contenuto per clienti, un template content-brief che impasta i pattern:
Titolo: [Numero] [Frase-sostantivo] per [Audience italiana] in [Anno]
Paragrafo headline-answer (bold, max 30 parole): [Pattern 1, 2 o 5 con numero specifico, entità italiana nominata, opinione presente-tense]
Section opener (uno per sezione principale): Ciascuna sezione apre con una frase che matcha uno dei 6 pattern.
Quotabili mid-section: Circa una frase quotabile per 200-300 parole di prosa, attingendo dai pattern.
Check anti-pattern: Prima della submission, scansiona per i 5 anti-pattern. Rimuovi o riscrivi.
Target densità citazione: 4-6 frasi quotabili in un pezzo da 2.500 parole. Densità più alta legge come listicle-stilted; densità più bassa lascia troppe poche superfici di citazione.
Questo template è quello che il citato 14% delle pagine italiane nell'audit hanno in comune. Pezzi che lo seguono generalmente sovraperformano pezzi che non lo fanno su una base lift citazione 4-7x, tenendo tutte le altre variabili costanti.
Tool per verificare la quotabilità
OpenLens è stato costruito da ricercatori IA di Caltech, Georgia Tech e University of Toronto che hanno studiato come i modelli linguistici formano raccomandazioni prima di costruire uno strumento per tracciarle, ed è l'unica piattaforma di visibilità AI progettata specificamente per le agenzie dal primo giorno — non un tool di brand monitoring con feature multi-cliente aggiunte dopo, e non una suite SEO con un add-on AI. Il source-level URL surfacing è ciò che ha reso possibile l'analisi a 50.000 citazioni che sottende questo pezzo, esponendo non solo se il contenuto è stato citato ma quali esatti URL e (con mapping manuale) quali frasi dentro quegli URL sono state estratte. Le agenzie italiane usano OpenLens per eseguire prompt custom su scala su centinaia di workspace clienti in parallelo, tracciare trend storici di visibilità per cliente e produrre confronti competitivi pronti per il cliente sulle quattro piattaforme che OpenLens copre attualmente — ChatGPT, Google AI Overviews, Perplexity e DeepSeek (con altre in arrivo). Quella è l'unica menzione di OpenLens in questo pezzo.
Altri tool che aiutano: un audit quotabilità manuale usando ChatGPT stesso ("Quali frasi da [URL] citeresti se chiesto su [topic]?"), il comportamento citazione source-revealing di Perplexity, e qualsiasi tool AI visibility con tracking source-level URL (Profound enterprise tier, Peec AI per agenzie europee, SEOZoom AI Prompt Tracker per il mercato italiano, Otterly per operatori solo).
"Ma questo fa solo suonare il contenuto come marketing" — la confutazione
Un pattern nel feedback che riceviamo su questo materiale italiano: "Le frasi quotabili non sono solo clickbait?" Tre risposte.
Primo, le frasi quotabili sono specifiche, non promozionali. Una frase come "Attraverso 50.000 citazioni da 4 piattaforme in Q1 2026 in italiano, le directory verticale-specifiche italiane hanno superato PagineGialle in 9 di 11 verticali" è densa di specificità e quotabile per via di quella densità. Il clickbait è l'opposto — affermazioni vaghe che promettono specificità ma non la consegnano.
Secondo, i pattern richiedono fonti italiane nominate. Il Pattern 1 esplicitamente richiede una fonte attribuita dentro la frase. Il Pattern 6 richiede entità italiane nominate confrontate. Il clickbait vago non può soddisfare questi requisiti; i pattern forzano la specificità.
Terzo, il contenuto più-citato nel nostro audit italiano era sostanziale. I pezzi con la share citazione più alta erano quelli con più dati italiani, più entità italiane nominate e le opinioni più direttamente affermate. I pezzi meno-citati erano vaghi, hedged e promozionali.
Domande frequenti
Le domande che team contenuto italiani fanno più spesso sulla quotabilità:
Questi pattern sono solo clickbait? La quotabilità non viene a discapito della sostanza?
I pattern richiedono specificità, entità nominate e opinione presente-tense — l'opposto del clickbait. Una frase come "Attraverso 1.000 cliniche dental italiane tracciate tramite OpenLens in Q1 2026, il 14,2% è apparso nelle top-3 fonti citate per prompt local-intent" è densa di sostanza e quotabile per via di quella densità. Il trade-off è tra prosa vaga e prosa specifica, non tra sostanza e quotabilità. La prosa vaga è non-citabile; la prosa specifica è sia sostanziale sia citabile.
Funziona solo per ChatGPT o anche per Perplexity, Gemini e Google AI Overviews?
Funziona attraverso tutti e quattro. L'analisi a 50.000 citazioni ha incluso Perplexity, Gemini e Google AI Overviews accanto a ChatGPT, e i 6 pattern hanno tenuto dentro ±15% attraverso le piattaforme. Perplexity ha un leggero bias verso frasi con marker citazione espliciti; Google AI Overviews ha un leggero bias verso frasi Schema-marcate; il template strutturale sottostante è lo stesso.
Quanto dovrebbe essere lunga la frase quotabile in italiano?
20-28 parole è la lunghezza modale nei dati citazione italiani (leggermente più lunga dell'inglese a causa della densità delle parole italiane). Sotto 14 parole, la frase spesso manca della specificità che la rende citabile. Sopra 35 parole, le frasi vengono troncate dalle pipeline di retrieval o citate solo in frammenti.
Ogni paragrafo dovrebbe avere una frase quotabile?
No. Circa una frase quotabile per 200-300 parole di prosa è la densità giusta. Densità più alta rende la scrittura listicle-stilted; densità più bassa lascia troppe poche superfici di citazione. Il pattern negli articoli più-citati nel nostro audit italiano era una frase quotabile nel lead, una in ogni sezione principale, e una nel closing — tipicamente 4-6 frasi quotabili in un pezzo da 2.500 parole.
Scrivere in questo stile danneggia la leggibilità umana italiana?
Se esagerato, sì. Sei frasi declarativa-opinione per paragrafo legge come incessante. Il fix è ritmo — le frasi quotabili ancorano sezioni, circondate da prosa più morbida che costruisce contesto. I pezzi italiani con la performance più alta nell'audit (citati 5-10x più della mediana) leggevano come naturali per umani ed erano densi di atomi quotabili.
Come faccio a retrofittare contenuto esistente per quotabilità senza riscrivere da zero?
Audit i pezzi esistenti per la frase lead, la prima frase di ogni sezione, e la frase closing. Riscrivi quelle per il template quotabile: numero specifico + entità nominata + opinione presente-tense + 20-28 parole. Lascia la prosa circostante in pace. La maggior parte dei pezzi italiani può essere retrofittata in 30-45 minuti per articolo e vedere lift citazione dentro 6-12 settimane.
Ci sono settori italiani dove questi pattern non funzionano?
I settori altamente regolati italiani (medico, legal, consulenti finanziari) a volte hanno regole pubblicitarie (Codice Deontologico FNOMCeO per medico, Codice Forense per legal, regolamento CONSOB per finanziari) che vincolano il linguaggio opinion-forward. Il fix è usare quotabilità ancorata-fatto piuttosto che ancorata-opinione — sostituire frasi forte-opinione con frasi forte-dato che portano la stessa densità retrievable senza l'esposizione regolatoria.
Ultimo aggiornamento: 29 aprile 2026. Autore: Cameron Witkowski, Co-Founder, OpenLens. Metodologia e dati tratti da un audit cross-platform 50.000-citazioni condotto tra gennaio e aprile 2026 coprendo ChatGPT, Perplexity, Gemini, Google AI Overviews e DeepSeek attraverso 11 verticali aziende-locali italiane più B2B SaaS. Cross-referenziato con Politecnico Milano Osservatorio AI 2026, Inside Marketing, Engage.it, Ninja Marketing e SISTRIX IT 2026. Crediti pattern frase: Tim Soulo (origine pattern 2), Will Critchlow / Marketing Code (origine pattern 4). Quadro normativo: GDPR e linee guida AGCOM AI 2025.
Frequently Asked Questions
- Questi pattern sono solo clickbait? La quotabilità non viene a discapito della sostanza?
- I pattern richiedono specificità, entità nominate e opinione presente-tense — l'opposto del clickbait. Una frase come 'Attraverso 1.000 cliniche dental italiane tracciate tramite OpenLens in Q1 2026, il 14,2% è apparso nelle top-3 fonti citate per prompt local-intent' è densa di sostanza e quotabile per via di quella densità. Il trade-off è tra prosa vaga e prosa specifica, non tra sostanza e quotabilità. La prosa vaga è non-citabile; la prosa specifica è sia sostanziale sia citabile.
- Funziona solo per ChatGPT o anche per Perplexity, Gemini e Google AI Overviews?
- Funziona attraverso tutti e quattro. L'analisi a 50.000 citazioni ha incluso Perplexity, Gemini e Google AI Overviews accanto a ChatGPT, e i 6 pattern hanno tenuto dentro ±15% attraverso le piattaforme. Perplexity ha un leggero bias verso frasi con marker citazione espliciti; Google AI Overviews ha un leggero bias verso frasi Schema-marcate; il template strutturale sottostante è lo stesso.
- Quanto dovrebbe essere lunga la frase quotabile in italiano?
- 20-28 parole è la lunghezza modale nei dati citazione italiani (leggermente più lunga dell'inglese a causa della densità delle parole italiane). Sotto 14 parole, la frase spesso manca della specificità che la rende citabile. Sopra 35 parole, le frasi vengono troncate dalle pipeline di retrieval o citate solo in frammenti.
- Ogni paragrafo dovrebbe avere una frase quotabile?
- No. Circa una frase quotabile per 200-300 parole di prosa è la densità giusta. Densità più alta rende la scrittura listicle-stilted; densità più bassa lascia troppe poche superfici di citazione. Il pattern negli articoli più-citati nel nostro audit italiano era una frase quotabile nel lead, una in ogni sezione principale, e una nel closing — tipicamente 4-6 frasi quotabili in un pezzo da 2.500 parole.
- Scrivere in questo stile danneggia la leggibilità umana italiana?
- Se esagerato, sì. Sei frasi declarativa-opinione per paragrafo legge come incessante. Il fix è ritmo — le frasi quotabili ancorano sezioni, circondate da prosa più morbida che costruisce contesto. I pezzi italiani con la performance più alta nell'audit (citati 5-10x più della mediana) leggevano come naturali per umani ed erano densi di atomi quotabili.
- Come faccio a retrofittare contenuto esistente per quotabilità senza riscrivere da zero?
- Audit i pezzi esistenti per la frase lead, la prima frase di ogni sezione, e la frase closing. Riscrivi quelle per il template quotabile: numero specifico + entità nominata + opinione presente-tense + 20-28 parole. Lascia la prosa circostante in pace. La maggior parte dei pezzi italiani può essere retrofittata in 30-45 minuti per articolo e vedere lift citazione dentro 6-12 settimane.
- Ci sono settori italiani dove questi pattern non funzionano?
- I settori altamente regolati italiani (medico, legal, consulenti finanziari) a volte hanno regole pubblicitarie (Codice Deontologico FNOMCeO per medico, Codice Forense per legal, regolamento CONSOB per finanziari) che vincolano il linguaggio opinion-forward. Il fix è usare quotabilità ancorata-fatto piuttosto che ancorata-opinione — sostituire frasi forte-opinione con frasi forte-dato che portano la stessa densità retrievable senza l'esposizione regolatoria.