Introduzione
Gary Illyes di Google ha recentemente discusso le ragioni alla base dei frustranti errori "crawled but not indexed" durante un'intervista alla conferenza SERP Conf 2024 in Bulgaria. Le sue intuizioni fanno luce su questo problema comune e offrono indicazioni preziose per risolverlo.
Punti chiave:
1. Similitudine dei contenuti:
- Illyes ha confermato che uno dei motivi di questo errore è la somiglianza dei contenuti. Se il contenuto di una pagina rispecchia fedelmente altri contenuti già indicizzati, Google potrebbe decidere di non indicizzarla.
2. Qualità generale del sito:
- La qualità complessiva di un sito web influisce in modo significativo sull'indicizzazione. Un numero elevato di pagine "crawlate ma non indicizzate" può indicare problemi di qualità del sito.
3. Problemi tecnici:
- Anche i problemi tecnici, come il fatto di servire lo stesso contenuto su più URL, possono portare a questo errore. La percezione del sito da parte di Google potrebbe cambiare se vengono rilevati tali problemi.
4. Duplicazione:
- I contenuti duplicati sono un altro fattore importante. Google potrebbe scansionare una pagina ma decidere di non indicizzarla se nel suo indice è già presente una versione simile con segnali migliori.
Spiegazione dettagliata:
Durante l'intervista, Illyes ha risposto a una domanda se l'errore "crawled but not indexed" potesse derivare da una pagina troppo simile a un contenuto già indicizzato. Ha confermato che questa potrebbe essere una delle ragioni, ma ha sottolineato che diversi fattori contribuiscono a questo problema.
Granularità e complessità:
Illyes ha sottolineato la complessità della classificazione di questi errori a causa del modo in cui i dati vengono gestiti internamente a Google. Ha spiegato che, sebbene il contenuto duplicato sia un fattore significativo, ci sono molte altre potenziali ragioni per questo errore.
Problemi di qualità:
Illyes ha sottolineato che la qualità generale di un sito può influenzare notevolmente l'indicizzazione. Un aumento delle pagine "crawlate ma non indicizzate" potrebbe indicare un calo della percezione della qualità del sito da parte di Google. Ciò potrebbe essere dovuto a vari motivi, tra cui contenuti scadenti o errori tecnici.
Problemi tecnici:
Anche i problemi tecnici, come ad esempio un sito web che erroneamente serve lo stesso contenuto per URL diversi, possono portare a questo problema. Tali errori possono indurre Google a riconsiderare le sue decisioni di indicizzazione.
Segnali del sito:
Illyes ha menzionato che se un altro sito con segnali migliori ospita lo stesso contenuto, Google potrebbe preferire indicizzare quel sito. Questo scenario si verifica spesso con i contenuti sindacati, dove la versione dell'editore originale non viene indicizzata.
Aspetti pratici da prendere in considerazione:
La comprensione di queste cause può aiutare i webmaster a individuare e risolvere gli errori "crawled but not indexed". Le azioni chiave includono:
-
Esaminare la somiglianza dei contenuti: Assicurarsi che i contenuti siano unici e non troppo simili a quelli già indicizzati.
-
Migliorare la qualità del sito: Concentrarsi sul miglioramento della qualità complessiva del sito per migliorarne la percezione da parte di Google.
-
Risolvere i problemi tecnici: Risolvere eventuali problemi tecnici che potrebbero causare contenuti duplicati o altri problemi.
-
Monitorare i segnali del sito: Tenete conto di come i segnali del vostro sito si confrontano con quelli degli altri, soprattutto se i vostri contenuti sono diffusi.
Intervenendo su queste aree, è possibile migliorare le possibilità di indicizzazione delle pagine da parte di Google.