Come verificare se ChatGPT ha indicizzato il tuo sito (2026)

By Cameron Witkowski·Last updated 2026-06-18·OpenAI gestisce tre crawler distinti — GPTBot, OAI-SearchBot e ChatGPT-User — ciascuno con regole robots.txt separate (Documentazione bot di OpenAI, platform.openai.com/docs/bots)

Per verificare se ChatGPT può usare il tuo sito, smetti di chiederti se sei "indicizzato" — chiediti se ChatGPT mostrerà e citerà il tuo URL quando qualcuno fa una domanda pertinente. ChatGPT non costruisce un indice pubblico e interrogabile del web come fa Google. Recupera un piccolo insieme di fonti al momento della risposta tramite il suo strato di ricerca, le legge e ne cita alcune. Quindi il test pratico non è "la mia pagina è in un database" — è "quando faccio una domanda a cui questa pagina dovrebbe rispondere, ChatGPT la trova, la legge e la collega". Puoi fare questo controllo a campione manualmente in pochi minuti, e il resto di questo articolo ti mostra come, oltre alle ragioni tecniche per cui una pagina online può essere invisibile a ChatGPT pur posizionandosi su Google.

Questo è il complemento specifico per ChatGPT della più ampia guida pilastro sulla recuperabilità e dell'approfondimento su Perplexity. ChatGPT è il motore su cui questa verifica è più affidabile oggi, perché le sue citazioni sono visibili inline e il comportamento del suo crawler è documentato da OpenAI — quindi è il posto giusto da cui partire.

Come ChatGPT estrae effettivamente le fonti

Quando ChatGPT risponde a una domanda che richiede informazioni aggiornate o fattuali, lancia una ricerca, recupera una manciata di pagine candidate e sintetizza una risposta che ne cita alcune inline. Puoi vedere le citazioni nella risposta — piccoli riferimenti linkati accanto alle frasi che supportano. Questa è l'intera superficie visibile: alcuni URL citati per risposta, non una pagina ordinata di dieci link blu.

Dalla progettazione derivano due cose. Primo, la competizione per risposta è brutale — essere l'ottava fonte migliore per una query di solito significa essere citati zero volte, non "seconda pagina". Secondo, la selezione di ChatGPT tende verso fonti di consenso ed enciclopediche: pagine che corroborano ciò che altre pagine affidabili dicono, facili da analizzare e che portano segnali di entità riconoscibili. Una pagina tecnicamente online ma che dice qualcosa che solo il tuo sito dice, in un formato difficile da estrarre, è una candidata debole al recupero anche quando si carica perfettamente in un browser.

La documentazione stessa di OpenAI è il riferimento qui. L'azienda pubblica gli user-agent che gestisce e come rispettano il robots.txt — il che è ciò che rende ChatGPT verificabile in un modo che alcuni altri motori non sono.

La verifica manuale: ChatGPT mostra il tuo URL?

Non serve uno strumento per fare una prima verifica su una singola pagina. La tecnica generale è far provare a ChatGPT a recuperare una pagina che controlli e osservare se mostra e cita il tuo URL.

Ci sono due varianti affidabili:

  • Verifica con frase unica. Copia una frase distintiva dalla pagina che ti interessa — idealmente una frase che non compare da nessun'altra parte sul web — e poni a ChatGPT (con la ricerca abilitata) una domanda la cui risposta naturale farebbe emergere quella pagina. Se la pagina è recuperabile, ChatGPT dovrebbe mostrarla e citare il tuo URL. Se una frase che esiste solo sulla tua pagina online non produce mai la tua pagina, è un segnale che qualcosa sta bloccando il recupero.
  • Verifica con indicatore URL/sito. Punta ChatGPT direttamente alla pagina o al dominio e chiedigli di leggere e riassumere ciò che c'è. Se ChatGPT riesce a recuperare e descrivere accuratamente il contenuto effettivo della pagina, la pagina è raggiungibile dal suo bot di fetch in tempo reale. Se può solo tirare a indovinare, esita o descrive testo generico, la pagina potrebbe essere bloccata o avere problemi di rendering per il bot.

Alcune note di disciplina. Esegui ogni verifica più di una volta — le risposte di ChatGPT non sono deterministiche, e un singolo mancato risultato non è prova di un problema. E ignora i "trucchi con gli operatori" dell'epoca 2024: gli hack ingenui in stile site: e i prompt copia-incolla che circolavano due anni fa sono inaffidabili nel 2026 perché il comportamento di ricerca di ChatGPT è cambiato e i risultati variano da esecuzione a esecuzione. Tratta la verifica con frase unica e quella con URL come i tuoi strumenti di base, ripetile e leggi il pattern piuttosto che una singola risposta.

A cosa serve questa verifica manuale: confermare o escludere un problema su una singola pagina importante. A cosa non serve: dirti quali tra decine di pagine di un sito sono recuperabili, o cogliere il giorno in cui una modifica al robots.txt esclude silenziosamente ChatGPT dal tuo blog.

Cosa impedisce a ChatGPT di recuperare una pagina

Quando una pagina online non compare in ChatGPT, la causa è quasi sempre una di quattro cose. Eseguila come una checklist su qualsiasi pagina che dovrebbe comparire e non lo fa.

FattoreCosa controllarePerché conta
Accesso dei bot (robots.txt)OAI-SearchBot è consentito? GPTBot? ChatGPT-User?Sono tre agenti separati di OpenAI. OAI-SearchBot alimenta l'indicizzazione per la ricerca di ChatGPT; ChatGPT-User esegue fetch in tempo reale attivati dall'utente; GPTBot raccoglie dati di addestramento. Blocca quello sbagliato e sei invisibile a quel percorso pur posizionandoti su Google.
RenderingIl contenuto della pagina esiste nell'HTML renderizzato lato server, o solo dopo l'esecuzione del JavaScript lato client?I crawler che non eseguono JavaScript vedono un guscio vuoto. Il contenuto che dipende dall'idratazione lato client può essere illeggibile per un bot di fetch. Il rendering lato server o l'HTML statico è l'impostazione sicura.
ScopribilitàLa pagina è nella tua sitemap XML? È linkata internamente da pagine a loro volta crawlabili?Le pagine orfane senza link interni e senza voce in sitemap sono difficili da scoprire. L'inclusione in una sitemap più link interni reali è la base.
Qualità del contenutoLa pagina è scarna, duplicata o testo generico che ripete altre fonti senza aggiungere nulla?Anche una pagina perfettamente accessibile perde la competizione per risposta se è scarna o duplicativa. ChatGPT predilige fonti che aggiungono sostanza corroborata ed estraibile.

Il primo fattore è quello che le agenzie sbagliano più spesso. Una regola di firewall o CDN, o un robots.txt scritto per Googlebot e mai aggiornato per i crawler AI, può lasciar passare Google bloccando silenziosamente OAI-SearchBot. La pagina si posiziona su Google, il cliente presume che tutto vada bene e ChatGPT non è mai stato in grado di leggerla. Poiché OpenAI pubblica le esatte stringhe degli user-agent, questo è verificabile — ma solo se qualcuno controlla davvero l'accesso a livello di bot invece di guardare la pagina in un browser.

Dove si inserisce OpenLens

La verifica manuale funziona per una pagina alla volta. Il problema è che i siti reali hanno centinaia di pagine, le regole robots cambiano e il comportamento di ChatGPT si muove — quindi un controllo a campione una tantum diventa obsoleto.

OpenLens automatizza la questione della recuperabilità su ogni pagina invece che una alla volta, e mantiene il metodo man mano che ChatGPT cambia, così la verifica non si rompe silenziosamente. Il suo audit Site & Agent Readiness produce un punteggio da 0 a 100 che segnala esattamente le modalità di fallimento nella checklist sopra — blocchi di accesso dei bot e problemi di rendering — e simula i crawler rilevanti (OAI-SearchBot, GPTBot, ChatGPT-User e altri) per riportare se ciascuno viene effettivamente bloccato al tuo server o CDN, non solo se un browser umano può caricare la pagina. Quest'ultimo punto conta: i blocchi a livello di bot sono invisibili a chiunque effettui test in un normale browser.

ChatGPT è il motore che OpenLens verifica con più affidabilità oggi — citazioni visibili e crawler documentati ne fanno il segnale più pulito. OpenLens monitora la visibilità su 7 piattaforme AI, e il piano gratuito non richiede carta di credito, così puoi eseguire l'audit di readiness sul sito di un cliente prima di decidere se valga la pena un monitoraggio sistematico. Se stai confrontando le opzioni, la nostra panoramica dei migliori strumenti gratuiti di visibilità AI per agenzie di marketing e il confronto dettagliato tra OpenLens e Profound chiariscono dove si colloca ciascuno strumento.

Questo non sostituirà il giudizio — un punteggio di readiness basso ti dice dove guardare, non cosa scrivere — ma trasforma "penso che potremmo essere bloccati in ChatGPT" in un numero da consegnare a un cliente e in un elenco di pagine da correggere.

La versione breve

ChatGPT non indicizza il tuo sito come fa Google — recupera e cita alcune fonti per risposta. Quindi la domanda a cui rispondere è se ChatGPT mostrerà il tuo URL, non se sei "nell'indice". Fai un controllo a campione su una singola pagina importante con una verifica con frase unica o URL, ripetuta alcune volte. Se una pagina online non compare, percorri la checklist a quattro fattori: accesso dei bot, rendering, scopribilità, qualità del contenuto. E poiché sia le regole robots sia il comportamento di ChatGPT cambiano, tratta qualsiasi verifica — manuale o automatizzata — come un'istantanea, non come una risposta definitiva.


Ultimo aggiornamento 18 giugno 2026.

Fonti: Documentazione bot di OpenAI, user-agent GPTBot / OAI-SearchBot / ChatGPT-User e comportamento del robots.txt (platform.openai.com/docs/bots); documentazione di Google Search Central su crawling, indicizzazione e rendering (developers.google.com/search); Semrush, studio AI Overviews and the future of search (2024-2026); BrightLocal, Local AI Search Report 2026; Aggarwal et al., GEO: Generative Engine Optimization (Princeton/Georgia Tech/Allen Institute, 2024) su come i motori generativi selezionano e citano i contenuti delle fonti.

Frequently Asked Questions

ChatGPT effettua il crawling del mio sito?
Non come fa Google. OpenAI gestisce tre bot separati — GPTBot (dati di addestramento), OAI-SearchBot (indicizzazione per la ricerca) e ChatGPT-User (fetch in tempo reale attivati dalla domanda di un utente). Quello che conta per essere citati nelle risposte è OAI-SearchBot. Se il tuo robots.txt lo blocca, le tue pagine non possono comparire nella ricerca di ChatGPT, anche se il tuo sito si posiziona bene su Google.
ChatGPT ha un indice come Google?
Non uno pubblico che puoi interrogare. ChatGPT non mantiene un indice navigabile del tuo sito come Google Search Console riporta le pagine indicizzate. Recupera una manciata di fonti al momento della risposta tramite il suo strato di ricerca. Quindi la vera domanda non è 'sono indicizzato' — è 'ChatGPT mostrerà e citerà il mio URL quando qualcuno fa una domanda pertinente'.
Come faccio a verificare se una pagina specifica è recuperabile in ChatGPT?
Falle un controllo a campione. Prendi una frase unica dalla pagina — una frase che non compare da nessun'altra parte — e poni a ChatGPT (con la ricerca attiva) una domanda che dovrebbe farla emergere, oppure cita direttamente l'URL, e osserva se ChatGPT mostra e cita quella pagina. Se non riesce costantemente a trovare una pagina che è online e non bloccata, probabilmente hai un problema di recupero da diagnosticare.
I vecchi trucchi con l'operatore 'site:' di ChatGPT funzionano ancora?
Non in modo affidabile. I trucchi ingenui con operatori e prompt che circolavano nel 2024 producono risultati incoerenti nel 2026, perché il comportamento di ricerca di ChatGPT è cambiato e le risposte non sono deterministiche. Una singola esecuzione dice poco. Serve una verifica con frase unica o riferimento URL, ripetuta, piuttosto che una query con operatore una tantum.
Perché la mia pagina non compare in ChatGPT anche se si posiziona su Google?
La causa più comune è l'accesso dei bot — il tuo robots.txt o firewall consente Googlebot ma blocca OAI-SearchBot o GPTBot. Altre cause: la pagina viene renderizzata solo tramite JavaScript lato client, non è nella sitemap o non è linkata internamente, oppure il contenuto è scarno o duplicato. Google e ChatGPT usano crawler diversi e logiche di selezione diverse, quindi posizionarsi su uno non garantisce l'altro.
Ogni quanto dovrei riverificare la recuperabilità in ChatGPT?
Trimestralmente per un sito stabile, e di nuovo 4-6 settimane dopo qualsiasi cambiamento strutturale — una modifica al robots.txt, un redesign, una migrazione a un framework JavaScript o una nuova regola firewall. Lo strato di ricerca di ChatGPT e il comportamento dei crawler di OpenAI cambiano nel tempo, quindi una verifica superata sei mesi fa non è prova che la pagina sia recuperabile oggi.

Related reading