Intro
Ein massives Leck in der internen Google-Such-Ranking-Dokumentation hat Schockwellen durch die SEO-Community geschickt. Das Leck, das über 14.000 potenzielle Ranking-Funktionen enthüllte, bietet einen beispiellosen Blick unter die Haube von Googles streng gehütetem Such-Ranking-System.
Die Geschichte hinter dem Leck
Erfan Azimi teilte ein Leck in einem Google-API-Dokument mit Rand Fishkin von SparkToro, der daraufhin Michael King von iPullRank anheuerte, um die Informationen zu verbreiten. Die durchgesickerten Dateien, die aus einer Google-API-Dokumentenübergabe mit dem Titel "yoshi-code-bot /elixer-google-api" stammen, waren nicht das Ergebnis eines Hacks oder eines Whistleblowers, sondern einer internen Dokumentenfreigabe.
Überblick über das Leck
Das Leck bietet einen umfassenden Überblick über die Ranking-Faktoren von Google und gibt Einblicke in PageRank-Variationen, Metriken zur Website-Autorität und vieles mehr. Hier ist eine detaillierte Aufschlüsselung:
Wichtige Erkenntnisse aus dem Leck in den Google-Suchdokumenten
PageRank und seine Variationen
-
PageRank_NS: Dieser Algorithmus, der inzwischen veraltet ist, ist mit dem Verstehen von Dokumenten verbunden und ändert den traditionellen PageRank, um sich auf eine lokalisierte Teilmenge des Netzwerks um die Seed-Knoten zu konzentrieren.
-
Sieben Arten von PageRank: Google erwähnt sieben verschiedene Arten von PageRank, darunter den berühmten ToolBarPageRank. Diese Variationen deuten darauf hin, dass Google mehrere Methoden zur Bewertung der Bedeutung einer Seite einsetzt.
Identifizierung des Geschäftsmodells
Der Algorithmus von Google kann verschiedene Geschäftsmodelle erkennen, darunter Nachrichtenseiten, YMYL-Seiten (Your Money or Your Life), persönliche Blogs, E-Commerce und Videoseiten. Der Grund für die gezielte Filterung von persönlichen Blogs bleibt unklar und wirft Fragen zu den weitergehenden Absichten von Google auf.
Algorithmus-Komponenten
-
NavBoost: Ein Re-Ranking-Mechanismus, der auf dem Nutzerverhalten und den Klickprotokollen basiert und stark von Chrome-Daten beeinflusst wird.
-
NSR (Normalized Site Rank): Dient zur Berechnung des Site Rank für Site Chunks auf Host-Ebene.
-
ChardScores: Bewertungen auf Site-Ebene zur Vorhersage der Site-/Seitenqualität auf der Grundlage des Inhalts.
Metriken zur Website-Autorität
Google verwendet eine standortweite Autoritätsmetrik und mehrere Signale, einschließlich des Verkehrs von Chrome-Browsern, um die Autorität einer Website zu bewerten. Dies deutet darauf hin, dass die allgemeine Qualität und Glaubwürdigkeit der Website eine wichtige Rolle für das Ranking spielen.
Einbettungstechniken und thematische Zuständigkeit
-
Seiten- und Website-Einbettungen: Google verwendet Seiteneinbettungen, Seiteneinbettungen, Seitenfokus und Seitenradius in seiner Bewertungsfunktion, um die thematische Relevanz und Konsistenz des Inhalts einer Website zu verstehen.
-
Themengrenzen und thematische Autorität: Metriken wie siteFocusScore, siteRadius, siteEmbeddings und pageEmbeddings werden verwendet, um die thematische Autorität zu messen, und unterstreichen, wie wichtig es ist, einen klaren thematischen Schwerpunkt zu setzen.
Klickdaten und Nutzerbindung
-
NavBoost: NavBoost stützt sich auf Klickdaten und das Nutzerverhalten, um Suchergebnisse neu zu ordnen, was die Bedeutung von Metriken zur Nutzerbindung unterstreicht.
-
Klick-Metriken: Google misst verschiedene Arten von Klicks, darunter schlechte Klicks, gute Klicks, die längsten Klicks und seitenweite Impressionen.
Qualität der NSR-Daten Einblicke
Zu den wichtigsten Bewertungsfaktoren aus dem NSR-Datendokument gehören:
-
titlematchScore: Eine siteweite Titelübereinstimmungsbewertung, die angibt, wie gut die Titel mit den Nutzeranfragen übereinstimmen.
-
site2vecEinbettung: Ein seitenweiter Vektor ähnlich wie word2vec, der die Bedeutung einer umfassenden Seiteneinbettung hervorhebt.
-
pnavClicks: Bezieht sich wahrscheinlich auf Navigationsinformationen, die aus Benutzer-Klickdaten abgeleitet werden.
-
chromeInTotal: Site-weite Chrome-Ansichten, die die Bedeutung von Site-weiten Signalen unterstreichen.
-
chardVariance und chardScoreVariance: Bewertungen, die die Qualität einer Website/Seite auf der Grundlage des Inhalts vorhersagen, wobei Konsistenz der Schlüssel ist.
Praktische Tipps für SEO-Fachleute
-
Investieren Sie in eine gut gestaltete Website: Stellen Sie sicher, dass Ihre Website über eine intuitive Architektur verfügt, um sie für NavBoost zu optimieren, das sich bei der Neueinstufung von Suchergebnissen auf das Nutzerverhalten und die Klickprotokolle stützt.
-
Entfernen/Blockieren thematisch irrelevanter Seiten: Entfernen oder blockieren Sie Seiten, die thematisch nicht relevant sind. Legen Sie Ihr Zielthema fest und stellen Sie sicher, dass jede Seite in diesem Bereich gut abschneidet.
-
Optimieren Sie Überschriften und Inhalt: Optimieren Sie die Überschriften im Hinblick auf die Suchanfragen und stellen Sie sicher, dass die Absätze diese Suchanfragen eindeutig beantworten, um die Einbettung der Seite und die Relevanz zu verbessern.
-
Konzentrieren Sie sich auf Klicks und Impressionen: Schreiben Sie Inhalte, die mehr Impressionen und Klicks anziehen, und betonen Sie das Engagement der Nutzer.
-
Regelmäßige Aktualisierung der Inhalte: Aktualisieren Sie den Inhalt regelmäßig mit einzigartigen Informationen, neuen Bildern und Videos, um ihn frisch zu halten und bei der Berechnung des Aufwands zu punkten.
-
Qualitativ hochwertige Inhalte pflegen: Konsistenz bei qualitativ hochwertigen Inhalten ist entscheidend. Googles Chard-Scores auf Website-Ebene sagen die Qualität der Website/Seite anhand des Inhalts voraus.
-
Wert Impressionswachstum: Wachsende Impressionen sind ein positives Zeichen für die Leistung einer Website.
-
Optimierung für Entity Salience: Konzentrieren Sie sich auf die Verbesserung der Auffälligkeitswerte für Entitäten und die Identifizierung von Top-Entitäten, wie im Leck erwähnt.
-
Entfernen Sie schlecht funktionierende Seiten: Identifizieren und eliminieren Sie Seiten mit schlechten Nutzermetriken und fehlenden Backlinks, um hohe Site-Scores zu erhalten.
So entfernen Sie die Erinnerung von Google an eine alte Version eines Dokuments
Laut derundichten Stelle zeichnet Google jede Version einer Webseite auf und unterhält ein internes Webarchiv, ähnlich der Wayback Machine. Allerdings verwendet Google nur die letzten 20 Versionen eines Dokuments. Wenn Sie eine Seite aktualisieren, auf einen Crawl warten und den Vorgang 20 Mal wiederholen, können Sie bestimmte Versionen der Seite effektiv verdrängen. Diese Taktik könnte sich als nützlich erweisen, um die historische Gewichtung und die mit älteren Versionen verbundenen Bewertungen zu verbessern.
Google-Suchranking-System
Eine interessante Vermutung, die sich aus dem Leck ergibt, ist die Auswirkung der Begriffsgewichtung (Wortgröße). Das Falten von Wörtern oder die Anpassung der Größe von Wörtern kann die Bewertung von Dokumenten beeinflussen. Außerdem priorisieren Googles Index-Speichermechanismen den Inhalt unterschiedlich:
-
Flash-Laufwerke: Für die wichtigsten und regelmäßig aktualisierten Inhalte.
-
Solid State Drives: Für weniger wichtige Inhalte.
-
Standard-Festplatten: Für unregelmäßig aktualisierte Inhalte.
Googles Indexer: Alexandria
Der Indexer von Google heißt Alexandria, nach der berühmten Bibliothek. Zu den anderen erwähnten Indexern gehören SegIndexer, der Dokumente in Ebenen einordnet, und TeraGoogle, das für die Langzeitspeicherung zuständig ist.
Saatgutstandorte und standortübergreifende Behörde
Die undichte Stelle erwähnt einen Faktor namens isElectionAuthority, der möglicherweise auf Seed-Sites oder thematische Autoritäten hinweist. Er deutet darauf hin, dass Websites mit hoher Autorität, z. B. solche mit einem PageRank von 9/10, erheblichen Einfluss haben. Allerdings gilt nsrIsElectionAuthority als veraltet, was eine gewisse Unklarheit bei der Interpretation hinterlässt.
Kurze Inhalte können ranken
Entgegen der landläufigen Meinung sind kurze Inhalte nicht gleichbedeutend mit dünnen Inhalten. Das Leck bestätigt, dass kurze Inhalte gut ranken können, wenn auch mit einem anderen Punktesystem.
Frische Links vs. Bestehende Links
Laut dem freshdocs-Linkwertmultiplikator sind Links von neueren Webseiten wertvoller als solche, die in ältere Inhalte eingefügt wurden. Dies deutet darauf hin, dass Nischenbearbeitungen zwar effektiv sein können, frische Links aber eine größere Wirkung haben.
Bevorzugte Entdeckungen
Seitenqualität (PQ)
Google verwendet einen LLM, um den "Aufwand" für Artikelseiten abzuschätzen und festzustellen, ob eine Seite leicht repliziert werden kann. Tools, Bilder, Videos, einzigartige Informationen und die Tiefe der Informationen sind Möglichkeiten, um bei der Berechnung des Aufwands zu punkten.
Themengrenzen und Themenautorität
Thematische Autorität, unterstützt durch siteFocusScore, siteRadius, siteEmbeddings und pageEmbeddings, ist entscheidend. Die Beibehaltung eines klaren thematischen Schwerpunkts und die Minimierung von Abweichungen vom Thema tragen zur Verbesserung der Rankings bei.
Bildqualität
ImageQualityClickSignals misst die Bildqualität anhand von Klickdaten (Nützlichkeit, Präsentation, Attraktivität, Engagement).
Gastgeber NSR
Host NSR ist ein Site Rank, der für Site Chunks auf Host-Ebene berechnet wird und die Qualität in Segmenten misst. Dieses Chunking-System hilft Google, die Qualität einer Website umfassend zu bewerten.
Einheitliche Theorie der Rangfolge
In diesem Abschnitt wird versucht, die Faktoren aus dem Leak in einer mathematischen Formel zusammenzufassen, wobei verschiedene Metriken und ihre Auswirkungen auf die Gesamtpunktzahl ® hervorgehoben werden.
Definitionen und Metriken
Benutzer-Interaktions-Scores (UIS):
-
UgcScore: Engagement für nutzergenerierte Inhalte.
-
TitelMatchScore: Relevanz der Titel für Benutzeranfragen.
-
ChromeInTotal: Insgesamt über Chrome erfasste Interaktionen.
-
Seitenaufrufe: Website-Impressionen insgesamt.
-
ThemaEindrücke: Impressionen auf themenspezifischen Seiten.
-
Website-Klicks: Klickrate für die Website.
-
ThemaKlicks: Durchklickrate für themenspezifische Seiten.
Punkte für die Inhaltsqualität (CQS):
-
ImageQualityClickSignals: Qualitätssignale von Bildklicks.
-
VideoScore: Qualität und Engagement von Videoinhalten.
-
ShoppingScore: Punkte für einkaufsbezogene Inhalte.
-
PageEmbedding: Semantische Einbettung von Seiteninhalten.
-
SiteEmbedding: Semantische Einbettung von Website-Inhalten.
-
StandortRadius: Maß für die Abweichung innerhalb der Einbettung des Standorts.
-
SiteFocus: Metrik, die den Themenschwerpunkt angibt.
-
TextGlaubwürdigkeit: Vertrauen in die Relevanz und Qualität des Textes.
-
EffortScore: Aufwand und Qualität bei der Erstellung von Inhalten.
Link Scores (LS):
-
TrustedAnchors: Qualität und Vertrauenswürdigkeit der eingehenden Links.
-
SiteLinkIn: Durchschnittlicher Wert der eingehenden Links.
-
PageRank: Verschiedene PageRank-Werte (0, 1, 2, ToolBar, NR).
Relevanzsteigerung (RB):
-
ThemaEinbettung: Relevanz im Zeitverlauf.
-
QnA: Grundlegende Qualitätsmaßnahme.
-
STS: Aggregierte Punktzahl auf der Grundlage von Textverständnis, Bedeutung und Entitäten.
Qualitätssteigerung (QB):
-
SAS: Bewertung der Autorität einer Website in Bezug auf Vertrauen, Zuverlässigkeit und Link-Autorität.
-
EFTS: Aufwandspunkte, die Text, Multimedia und Kommentare enthalten.
-
FS: Frischegrad basierend auf Aktualisierungs- und ursprünglichem Veröffentlichungsdatum.
-
CSA: Inhaltsspezifische Anpassungen auf der Grundlage von SERP- und On-Page-Merkmalen.
Inhaltsspezifische Anpassungen (CSA):
-
CDS: Chrome Data Score mit Schwerpunkt auf Impressionen und Klicks auf der gesamten Website.
-
SDS: Serp Demotion Score basierend auf der SERP-Erfahrungsmessung.
-
EQSS: Experimenteller Q-Star-Score für experimentelle Variablen.
Vollständige Formel
R=(∑i=17wi⋅UISi)+(∑i=19vi⋅CQSi)+(∑i=13xi⋅LSi)×(RB+QB+X)-
R=((w1⋅UgcScore+w2⋅TitleMatchScore+w3⋅ChromeInTotal+w4⋅SiteImpressions+w5⋅TopicImpressions+w6⋅SiteClicks+w7⋅TopicClicks)+(v1⋅ImageQualityClickSignals+v2⋅VideoScore+v3⋅ShoppingScore+v4⋅PageEmbedding+v5⋅SiteEmbedding+v6⋅SiteRadius+v7⋅SiteFocus+v8⋅TextConfidence+v9⋅EffortScore)+(x1⋅TrustedAnchors+x2⋅SiteLinkIn+x3⋅PageRank))×(TopicEmbedding+QnA+STS+SAS+EFTS+FS)+(y1⋅CDS+y2⋅SDS+y3⋅EQSS)
Überblick über das allgemeine Scoring
1. Engagement der Nutzer:
- UgcScore, TitleMatchScore, ChromeInTotal, SiteImpressions, Topic Impressions, Site Clicks, Topic Clicks
2. Multimediale Partituren:
- ImageQualityClickSignals, VideoScore, ShoppingScore
3. Links:
- TrustedAnchors, SiteLinkIn (Durchschnittswert der eingehenden Links), PageRank (0, 1, 2, ToolBar, NR)
4. Inhaltliches Verstehen:
- PageEmbedding, SiteEmbedding, SiteRadius, SiteFocus, TextConfidence, EffortScore
Schlussfolgerung
Das Dokumentationsleck bietet unschätzbare Einblicke in die Ranking-Mechanismen von Google, entlarvt einige Mythen und enthüllt komplizierte Faktoren, die die Suchergebnisse beeinflussen. SEO-Profis können dieses Wissen nutzen, um ihre Strategien zu verfeinern und sich auf das Engagement der Nutzer, die thematische Relevanz und die konsistente Qualität der Inhalte zu konzentrieren. Während die SEO-Gemeinschaft diese Enthüllungen verdaut, werden viele wahrscheinlich ihre Ansätze im Lichte dieser neuen Informationen überdenken.
Durch das Verständnis und die Anwendung dieser Erkenntnisse können SEO-Fachleute die Komplexität des Google-Rankingsystems besser durchschauen und letztendlich die Sichtbarkeit und Leistung ihrer Website in den Suchergebnissen verbessern.