• Google Zoek Updates & SEO Inzichten

Het uitpakken van Google's enorme lek in zoekdocumentatie

  • Felix Rose-Collins
  • 7 min read
Het uitpakken van Google's enorme lek in zoekdocumentatie

Intro

Een enorm lek van interne Google Search ranking documentatie heeft schokgolven door de SEO gemeenschap gestuurd. Het lek, dat meer dan 14.000 potentiële rankingfuncties blootlegt, biedt een ongekend kijkje onder de motorkap van Google's streng bewaakte systeem voor zoekrangschikking.

Het verhaal achter het lek

Erfan Azimi deelde een lek in een Google API-document met Rand Fishkin van SparkToro, die vervolgens Michael King van iPullRank inschakelde om de informatie te helpen verspreiden. De gelekte bestanden, afkomstig van een Google API document commit met de titel "yoshi-code-bot /elixer-google-api," waren niet het resultaat van een hack of een klokkenluider, maar eerder van een interne documentvrijgave.

Overzicht van het lek

Het lek geeft een uitgebreid overzicht van Google's rankingfactoren, onthult inzichten in PageRank variaties, website autoriteit metriek en nog veel meer. Hier is een gedetailleerd overzicht:

Belangrijkste inzichten uit het uitlekken van Google zoekdocumenten

PageRank en zijn variaties

  • PageRank_NS: Dit algoritme, dat nu is afgeschaft, wordt geassocieerd met het begrijpen van documenten en wijzigt de traditionele PageRank om zich te richten op een gelokaliseerde subset van het netwerk rond zaadknooppunten.

  • Zeven soorten PageRank: Google noemt zeven verschillende soorten PageRank, waaronder de beroemde ToolBarPageRank. Deze variaties geven aan dat Google meerdere methoden gebruikt om het belang van pagina's te beoordelen.

Identificatie van het bedrijfsmodel

Het algoritme van Google kan verschillende bedrijfsmodellen herkennen, waaronder nieuwssites, YMYL-sites (Your Money or Your Life), persoonlijke blogs, e-commerce en videosites. De reden achter het specifiek filteren op persoonlijke blogs blijft onduidelijk en roept vragen op over de bredere bedoelingen van Google.

Algoritme-onderdelen

  • NavBoost: Een herrangschikkingsmechanisme gebaseerd op gebruikersgedrag en kliklogs, sterk beïnvloed door Chrome-gegevens.

  • NSR (Normalized Site Rank): Wordt gebruikt om de siterangorde te berekenen voor sitebrokken op hostniveau.

  • ChardScores: Scores op siteniveau die de kwaliteit van sites/pagina's voorspellen op basis van inhoud.

Site Autoriteit statistieken

Google gebruikt een autoriteitsmeting voor de hele site en verschillende signalen, waaronder verkeer van Chrome-browsers, om de autoriteit van een site te evalueren. Dit suggereert dat de algehele kwaliteit en geloofwaardigheid van de site een belangrijke rol spelen in de ranking.

Inbeddingstechnieken en actuele autoriteit

  • Ingebedde pagina's en sites: Google gebruikt pagina-embeddings, site-embeddings, sitefocus en siteradius in zijn scorefunctie om inzicht te krijgen in de actuele relevantie en consistentie van de inhoud van een website.

  • Onderwerpgrenzen en onderwerpautoriteit: Metrics zoals siteFocusScore, siteRadius, siteEmbeddings en pageEmbeddings worden gebruikt om topic autoriteit te meten, waarbij het belang van het behouden van een duidelijke topic focus wordt benadrukt.

googleapi

Klikgegevens en gebruikersbetrokkenheid

  • NavBoost: NavBoost vertrouwt op klikgegevens en gebruikersgedrag om zoekresultaten opnieuw te rangschikken, wat het belang onderstreept van statistieken over gebruikersbetrokkenheid.

  • Klikken: Google meet verschillende soorten klikken, waaronder slechte klikken, goede klikken, laatste langste klikken en sitebrede impressies.

Inzicht in kwaliteit NSR-gegevens

Belangrijke scorefactoren uit het NSR-gegevensdocument zijn onder andere:

  • titelmatchScore: Een titlematchscore voor de hele site die aangeeft hoe goed titels overeenkomen met zoekopdrachten van gebruikers.

  • site2vecEmbedding: Een vector voor de hele site, vergelijkbaar met word2vec, die het belang van uitgebreide site-inbeddingen benadrukt.

  • pnavClicks: Waarschijnlijk gerelateerd aan navigatie-informatie afgeleid van klikgegevens van gebruikers.

  • chromeInTotal: Chrome-weergaven voor de hele site, met nadruk op het belang van sitebrede signalen.

  • chardVariance en chardScoreVariance: Scores die de kwaliteit van sites/pagina's voorspellen op basis van inhoud, waarbij consistentie de sleutel is.

NSR Data Insights

Praktische tips voor SEO-professionals

  1. Investeer in een goed ontworpen site: Zorg ervoor dat je site een intuïtieve architectuur heeft om te optimaliseren voor NavBoost, dat vertrouwt op gebruikersgedrag en kliklogs voor het opnieuw rangschikken van zoekresultaten.

  2. Topic irrelevante pagina's verwijderen/blokkeren: Verwijder of blokkeer pagina's die niet actueel relevant zijn. Bepaal je doelonderwerp en zorg ervoor dat elke pagina goed scoort op dit gebied.

  3. Optimaliseer koppen en inhoud: Optimaliseer koppen rond zoekopdrachten en zorg ervoor dat alinea's deze zoekopdrachten duidelijk beantwoorden om de pagina-inbedding en relevantie te verbeteren.

  4. Focus op klikken en indrukken: Schrijf inhoud die meer vertoningen en klikken aantrekt, met de nadruk op gebruikersbetrokkenheid.

  5. Werk inhoud regelmatig bij: Werk inhoud regelmatig bij met unieke informatie, nieuwe afbeeldingen en video's om frisheid te behouden en hoog te scoren op inspanningsberekeningen.

  6. Onderhoud inhoud van hoge kwaliteit: Consistentie in inhoud van hoge kwaliteit is cruciaal. De chard-scores op siteniveau van Google voorspellen de kwaliteit van de site/pagina op basis van de inhoud.

  7. Waarde impressiegroei: Groeiende impressies is een positief teken van de prestaties van de site.

  8. Optimaliseren voor entiteitbetekenis: Focus op het verbeteren van salience-scores voor entiteiten en topentiteitidentificatie zoals vermeld in het lek.

  9. Slecht presterende pagina's verwijderen: Identificeer en elimineer pagina's met slechte gebruikersgegevens en zonder backlinks om hoge sitebrede scores te behouden.

panda

Hoe Google's geheugen van een oude versie van een document te verwijderen

Volgens het lek houdt Google elke versie van een webpagina bij in een intern webarchief dat lijkt op de Wayback Machine. Google gebruikt echter alleen de laatste 20 versies van een document. Als je een pagina bijwerkt, wacht op een crawl en het proces 20 keer herhaalt, kun je effectief bepaalde versies van de pagina naar buiten duwen. Deze tactiek kan nuttig zijn voor het verbeteren van historische gewichten en scores die zijn gekoppeld aan oudere versies.

Google ranking systeem

Google Search Ranking System

Een interessant vermoeden uit het lek is de invloed van termgewicht (lettergrootte). Het onderstrepen van woorden of het aanpassen van de woordgrootte kan de documentscores beïnvloeden. Daarnaast geven de opslagmechanismen van de index van Google verschillende prioriteiten aan inhoud:

  • Flashdrives: Voor de belangrijkste en regelmatig bijgewerkte inhoud.

  • Solid State-schijven: Voor minder belangrijke inhoud.

  • Standaard harde schijven: Voor onregelmatig bijgewerkte inhoud.

De indexeerder van Google: Alexandria

Alexandria

De indexer van Google heet Alexandria, naar de beroemde bibliotheek. Andere indexers die worden genoemd zijn SegIndexer, die documenten in lagen plaatst, en TeraGoogle, die de opslag in het langetermijngeheugen afhandelt.

Seed sites en autoriteit voor de hele site

Het lek vermeldt een factor met de naam isElectionAuthority, wat mogelijk duidt op seed sites of topical authorities. Het suggereert dat sites met een hoge autoriteit, zoals die met een PageRank van 9/10, een aanzienlijke invloed hebben. Echter, nsrIsElectionAuthority wordt als afgeschreven beschouwd, waardoor er onduidelijkheid bestaat over de interpretatie.

Korte inhoud kan rangschikken

In tegenstelling tot wat vaak wordt gedacht, staat korte inhoud niet gelijk aan dunne inhoud. Het lek bevestigt dat korte inhoud goed kan scoren, zij het met een ander scoresysteem.

Nieuwe links vs. bestaande links

Volgens de freshdocs linkwaarde vermenigvuldiger zijn links van nieuwere webpagina's waardevoller dan links die in oudere inhoud zijn geplaatst. Dit geeft aan dat nichebewerkingen effectief kunnen zijn, maar dat verse links een grotere impact hebben.

Favoriete ontdekkingen

Paginakwaliteit (PQ)

Google gebruikt een LLM om de "moeite" van artikelpagina's in te schatten, om te bepalen of een pagina gemakkelijk kan worden gekopieerd. Hulpmiddelen, afbeeldingen, video's, unieke informatie en diepte van de informatie zijn manieren om hoog te scoren op de inspanningsberekeningen.

Onderwerpgrenzen en onderwerpgezag

Actuele autoriteit, ondersteund door siteFocusScore, siteRadius, siteEmbeddings en pageEmbeddings, is cruciaal. Het handhaven van een duidelijke actuele focus en het minimaliseren van afwijkingen van het onderwerp helpt bij het verbeteren van rankings.

Beeldkwaliteit

ImageQualityClickSignals meet de kwaliteit van afbeeldingen op basis van klikgegevens (bruikbaarheid, presentatie, aantrekkelijkheid, betrokkenheid).

Gastheer NSR

Host NSR is de siterank die wordt berekend voor sitebrokken op hostniveau, waarbij de kwaliteit in segmenten wordt gemeten. Dit chunking-systeem helpt Google de kwaliteit van sites uitgebreid te beoordelen.

Unified Theory of Ranking

In dit gedeelte wordt geprobeerd om de factoren uit het lek te consolideren in een wiskundige formule, waarbij verschillende maatstaven en hun invloed op de algemene ranglijstscore ® worden benadrukt.

Definities en statistieken

formula

User Interaction Scores (UIS):

formula

  • UgcScore: Betrokkenheid bij door gebruikers gegenereerde inhoud.

  • TitelMatchScore: Relevantie van titels voor zoekopdrachten van gebruikers.

  • ChromeInTotal: Totaal aantal interacties getraceerd via Chrome.

  • SiteImpressies: Totaal aantal site-impressies.

  • TopicImpressies: Impressies op onderwerpspecifieke pagina's.

  • SiteClicks: Doorklikpercentage voor de site.

  • TopicClicks: Doorklikpercentage voor onderwerpspecifieke pagina's.

Kwaliteitsscores voor inhoud (CQS):

formula

  • BeeldKwaliteitKlikSignalen: Kwaliteitssignalen van afbeeldingsklikken.

  • VideoScore: Kwaliteit en engagement van videocontent.

  • ShoppingScore: Score voor winkelgerelateerde inhoud.

  • Pagina-inbedding: Semantische inbedding van pagina-inhoud.

  • SiteEmbedding: Semantische inbedding van site-inhoud.

  • SiteRadius: Maat voor de afwijking binnen de site-inbedding.

  • SiteFocus: Metriek die de focus van het onderwerp aangeeft.

  • TekstVertrouwen: Vertrouwen in de relevantie en kwaliteit van de tekst.

  • EffortScore: Inspanning en kwaliteit bij het maken van content.

Link Scores (LS):

Link Scores

  • TrustedAnchors: Kwaliteit en betrouwbaarheid van inkomende links.

  • SiteLinkIn: Gemiddelde waarde van inkomende links.

  • PageRank: Verschillende PageRank-scores (0, 1, 2, ToolBar, NR).

Relevantie Boost (RB):

Relevance Boost

  • TopicEmbedding: Relevantie in de tijd.

  • QnA: Basiskwaliteitsbeoordeling.

  • STS: Geaggregeerde score gebaseerd op tekstbegrip, saillantie en entiteiten.

Kwaliteitsverbeteraar (QB):

Quality Boost

  • SAS: Site-autoriteitsscore met betrekking tot vertrouwen, betrouwbaarheid en linkautoriteit.

  • EFTS: Inspanningsscore met tekst, multimedia en commentaar.

  • FS: Versheidsscore gebaseerd op update- en oorspronkelijke postdatums.

  • CSA: Inhoudelijke aanpassingen op basis van SERP- en on-page kenmerken.

CSA

Inhoudsspecifieke aanpassingen (CSA):

  • CDS: Chrome-gegevensscore die zich richt op vertoningen en klikken op de hele site.

  • SDS: Serp degradatie score gebaseerd op SERP ervaringsmeting.

  • EQSS: Experimentele Q Star score voor experimentele variabelen.

Volledige formule

R=(∑i=17wi⋅UISi)+(∑i=19vi⋅CQSi)+(∑i=13xi⋅LSi)×(RB+QB+X)-.

R=((w1​⋅UgcScore+w2​⋅TitleMatchScore+w3​⋅ChromeInTotal+w4​⋅SiteImpressions+w5​⋅TopicImpressions+w6​⋅SiteClicks+w7​⋅TopicClicks)+(v1​⋅ImageQualityClickSignals+v2​⋅VideoScore+v3​⋅ShoppingScore+v4​⋅PageEmbedding+v5​⋅SiteEmbedding+v6​⋅SiteRadius+v7​⋅SiteFocus+v8​⋅TextConfidence+v9​⋅EffortScore)+(x1​⋅TrustedAnchors+x2​⋅SiteLinkIn+x3​⋅PageRank))×(TopicEmbedding+QnA+STS+SAS+EFTS+FS)+(y1​⋅CDS+y2​⋅SDS+y3​⋅EQSS)

Overzicht algemene scores

1. Betrokkenheid van de gebruiker:

  • UgcScore, TitleMatchScore, ChromeInTotal, SiteImpressions, Topic Impressions, Site Clicks, Topic Clicks

2. Multi-Media Scores:

  • BeeldKwaliteitKlikSignalen, VideoScore, ShoppingScore

3. Koppelingen:

  • TrustedAnchors, SiteLinkIn (gemiddelde waarde van inkomende links), PageRank (0, 1, 2, ToolBar, NR)

4. Inhoudelijk begrip:

  • PageEmbedding, SiteEmbedding, SiteRadius, SiteFocus, TextConfidence, EffortScore

Conclusie

Het lek in de documentatie biedt onschatbare inzichten in de rankingmechanismen van Google, ontkracht verschillende mythes en onthult ingewikkelde factoren die de zoekresultaten beïnvloeden. SEO-professionals kunnen deze kennis gebruiken om hun strategieën te verfijnen, waarbij ze zich kunnen richten op gebruikersbetrokkenheid, thematische relevantie en consistente kwaliteit van de inhoud. Terwijl de SEO-gemeenschap deze onthullingen verwerkt, zullen velen waarschijnlijk hun aanpak heroverwegen in het licht van deze nieuwe informatie.

Door deze inzichten te begrijpen en toe te passen, kunnen SEO-beoefenaars beter navigeren door de complexiteit van Google's rankingsysteem en uiteindelijk de zichtbaarheid en prestaties van hun website in de zoekresultaten verbeteren.

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Begin Ranktracker te gebruiken... Gratis!

Ontdek wat uw website belemmert in de ranking.

Maak een gratis account aan

Of log in met uw gegevens

Different views of Ranktracker app