Intro
Gary Illyes van Google besprak onlangs de redenen achter de frustrerende "crawled but not indexed" fouten tijdens een interview op de SERP Conf 2024 conferentie in Bulgarije. Zijn inzichten werpen licht op dit veelvoorkomende probleem en bieden waardevolle richtlijnen om het op te lossen.
Belangrijke punten:
1. Inhoudelijke gelijkenis:
- Illyes bevestigde dat een van de redenen voor deze fout gelijkenis van inhoud is. Als de inhoud van een pagina sterk lijkt op andere inhoud die al is geïndexeerd, kan Google ervoor kiezen deze niet te indexeren.
2. Algemene locatiekwaliteit:
- De algehele kwaliteit van een website is van grote invloed op de indexering. Een hoog aantal "gecrawld maar niet geïndexeerd" pagina's kan duiden op kwaliteitsproblemen met de site.
3. Technische kwesties:
- Technische problemen, zoals het serveren van dezelfde inhoud op meerdere URL's, kunnen ook tot deze fout leiden. Google's perceptie van de site kan veranderen als dergelijke problemen worden gedetecteerd.
4. Duplicatie:
- Dubbele inhoud is een andere belangrijke factor. Google kan een pagina crawlen maar besluiten deze niet te indexeren als er al een vergelijkbare versie met betere signalen in de index staat.
Gedetailleerde uitleg:
Tijdens het interview antwoordde Illyes op een vraag of de "gecrawled maar niet geïndexeerd" fout het gevolg kan zijn van een pagina die te veel lijkt op reeds geïndexeerde inhoud. Hij bevestigde dat dit een reden zou kunnen zijn, maar benadrukte dat meerdere factoren bijdragen aan dit probleem.
Granulariteit en complexiteit:
Illyes merkte op dat het categoriseren van deze fouten complex is vanwege de manier waarop gegevens intern bij Google worden verwerkt. Hij legde uit dat, hoewel dubbele inhoud een belangrijke factor is, er veel andere mogelijke redenen zijn voor deze fout.
Kwaliteitsproblemen:
Illyes benadrukte dat de algemene kwaliteit van een site van grote invloed kan zijn op de indexering. Een toename van het aantal "gecrawld maar niet geïndexeerd" pagina's kan duiden op een afname van Google's perceptie van de kwaliteit van de site. Dit kan verschillende oorzaken hebben, waaronder slechte inhoud of technische fouten.
Technische problemen:
Technische problemen, zoals een website die per ongeluk dezelfde inhoud voor verschillende URL's serveert, kunnen ook tot dit probleem leiden. Dergelijke fouten kunnen ertoe leiden dat Google zijn indexeringsbeslissingen heroverweegt.
Locatiesignalen:
Illyes zei dat als een andere site met betere signalen dezelfde inhoud host, Google misschien liever die site indexeert. Dit scenario komt vaak voor bij gesyndiceerde inhoud waarbij de versie van de oorspronkelijke uitgever niet wordt geïndexeerd.
Praktische aanknopingspunten:
Inzicht in deze oorzaken kan webmasters helpen bij het opsporen en oplossen van "gecrawld maar niet geïndexeerd"-fouten. De belangrijkste acties zijn:
-
Controleer inhoudsgelijkenis: Zorg ervoor dat je inhoud uniek is en niet te veel lijkt op bestaande geïndexeerde inhoud.
-
Verbeter de kwaliteit van uw site: Richt u op het verbeteren van de algehele kwaliteit van uw site om de perceptie ervan door Google te verbeteren.
-
Technische problemen oplossen: Pak alle technische problemen aan die dubbele inhoud of andere problemen kunnen veroorzaken.
-
Houd sitesignalen in de gaten: Houd in de gaten hoe de signalen van uw site zich verhouden tot die van anderen, vooral als uw inhoud wordt gesyndiceerd.
Door deze gebieden aan te pakken, kunt u de kans vergroten dat uw pagina's door Google worden geïndexeerd.