Intro
Gary Illyes von Google erörterte kürzlich in einem Interview auf der SERP Conf 2024-Konferenz in Bulgarien die Gründe für die frustrierenden "Crawled but not indexed"-Fehler. Seine Erkenntnisse beleuchten dieses häufige Problem und bieten wertvolle Hinweise zu seiner Behebung.
Wichtige Punkte:
1. Inhaltliche Ähnlichkeit:
- Illyes bestätigte, dass ein Grund für diesen Fehler die Ähnlichkeit der Inhalte ist. Wenn der Inhalt einer Seite anderen, bereits indizierten Inhalten sehr ähnlich ist, kann Google beschließen, sie nicht zu indizieren.
2. Allgemeine Standortqualität:
- Die Gesamtqualität einer Website wirkt sich erheblich auf die Indizierung aus. Eine hohe Anzahl von "gecrawlten, aber nicht indizierten" Seiten kann auf Qualitätsprobleme mit der Website hinweisen.
3. Technische Fragen:
- Auch technische Probleme, z. B. die Bereitstellung desselben Inhalts unter mehreren URLs, können zu diesem Fehler führen. Die Wahrnehmung der Website durch Google könnte sich ändern, wenn solche Probleme festgestellt werden.
4. Vervielfältigung:
- Doppelte Inhalte sind ein weiterer wichtiger Faktor. Google kann eine Seite crawlen, aber nicht indizieren, wenn eine ähnliche Version mit besseren Signalen bereits im Index vorhanden ist.
Ausführliche Erläuterung:
Während des Interviews antwortete Illyes auf die Frage, ob der Fehler "gecrawlt, aber nicht indiziert" darauf zurückzuführen sein könnte, dass eine Seite einem bereits indizierten Inhalt zu ähnlich ist. Er bestätigte, dass dies ein Grund sein könnte, betonte aber, dass mehrere Faktoren zu diesem Problem beitragen.
Granularität und Komplexität:
Illyes wies auf die Komplexität der Kategorisierung dieser Fehler hin, die auf die Art und Weise zurückzuführen ist, wie die Daten bei Google intern gehandhabt werden. Er erklärte, dass doppelte Inhalte zwar ein wichtiger Faktor sind, es aber auch viele andere mögliche Gründe für diesen Fehler gibt.
Fragen der Qualität:
Illyes wies darauf hin, dass die allgemeine Qualität einer Website die Indizierung stark beeinflussen kann. Ein Anstieg der "gecrawlten, aber nicht indizierten" Seiten könnte ein Hinweis darauf sein, dass Google die Qualität der Website als schlecht einschätzt. Dies kann verschiedene Gründe haben, darunter schlechte Inhalte oder technische Fehler.
Technische Probleme:
Technische Probleme, wie z. B. eine Website, die fälschlicherweise denselben Inhalt für verschiedene URLs anbietet, können ebenfalls zu diesem Problem führen. Solche Fehler können dazu führen, dass Google seine Indizierungsentscheidungen überdenkt.
Standort-Signale:
Illyes erwähnte, dass Google es vorziehen könnte, eine andere Website mit besseren Signalen zu indexieren, wenn diese denselben Inhalt enthält. Dieses Szenario tritt häufig bei syndizierten Inhalten auf, bei denen die Version des ursprünglichen Herausgebers nicht indiziert ist.
Praktische Erkenntnisse:
Das Verständnis dieser Ursachen kann Webmastern bei der Fehlersuche und -behebung von "gecrawlten, aber nicht indizierten" Fehlern helfen. Zu den wichtigsten Maßnahmen gehören:
-
Prüfen Sie die Ähnlichkeit der Inhalte: Vergewissern Sie sich, dass Ihr Inhalt einzigartig ist und nicht zu ähnlich zu bereits indizierten Inhalten.
-
Verbessern Sie die Qualität der Website: Konzentrieren Sie sich auf die Verbesserung der Gesamtqualität Ihrer Website, um ihre Wahrnehmung durch Google zu verbessern.
-
Lösen Sie technische Probleme: Beheben Sie alle technischen Probleme, die zu doppelten Inhalten oder anderen Problemen führen könnten.
-
Website-Signale überwachen: Achten Sie darauf, wie die Signale Ihrer Website im Vergleich zu anderen sind, insbesondere wenn Ihre Inhalte syndiziert werden.
Indem Sie diese Bereiche angehen, können Sie Ihre Chancen verbessern, dass Ihre Seiten von Google indiziert werden.