• Aktualizacje wyszukiwarki Google i statystyki SEO

Rozpakowywanie masowego wycieku dokumentacji wyszukiwania Google

  • Felix Rose-Collins
  • 6 min read
Rozpakowywanie masowego wycieku dokumentacji wyszukiwania Google

Wprowadzenie

Ogromny wyciek wewnętrznej dokumentacji rankingowej wyszukiwarki Google wywołał falę wstrząsów w społeczności SEO. Wyciek, który ujawnił ponad 14 000 potencjalnych funkcji rankingowych, oferuje bezprecedensowe spojrzenie pod maskę ściśle strzeżonego systemu rankingów wyszukiwania Google.

Historia kryjąca się za wyciekiem

Erfan Azimi podzielił się wyciekiem dokumentów Google API z Randem Fishkinem ze SparkToro, który następnie zaangażował Michaela Kinga z iPullRank do pomocy w rozpowszechnianiu informacji. Wyciekłe pliki, pochodzące z commitu dokumentu Google API zatytułowanego "yoshi-code-bot /elixer-google-api", nie były wynikiem włamania ani informatora, ale raczej wewnętrznego wydania dokumentu.

Przegląd wycieku

Wyciek zapewnia kompleksowy wgląd w czynniki rankingowe Google, ujawniając wgląd w zmiany PageRank, wskaźniki autorytetu witryny i wiele więcej. Oto szczegółowe zestawienie:

Kluczowe wnioski z wycieku dokumentów wyszukiwarki Google

PageRank i jego odmiany

  • PageRank_NS: Obecnie przestarzały, algorytm ten jest powiązany ze zrozumieniem dokumentu i modyfikuje tradycyjny PageRank, aby skupić się na zlokalizowanym podzbiorze sieci wokół węzłów zalążkowych.

  • Siedem rodzajów PageRank: Google wymienia siedem różnych typów PageRank, w tym słynny ToolBarPageRank. Te różnice wskazują, że Google stosuje wiele metod oceny ważności strony.

Identyfikacja modelu biznesowego

Algorytm Google może identyfikować różne modele biznesowe, w tym witryny informacyjne, witryny YMYL (Your Money or Your Life), blogi osobiste, e-commerce i witryny wideo. Powód specjalnego filtrowania blogów osobistych pozostaje niejasny i rodzi pytania o szersze intencje Google.

Składniki algorytmu

  • NavBoost: Mechanizm zmiany rankingu oparty na zachowaniu użytkowników i dziennikach kliknięć, na który duży wpływ mają dane Chrome.

  • NSR (znormalizowany ranking witryny): Służy do obliczania rankingu witryn dla fragmentów witryn na poziomie hosta.

  • ChardScores: Wyniki na poziomie witryny przewidujące jakość witryny / strony na podstawie treści.

Wskaźniki autorytetu witryny

Google wykorzystuje wskaźnik autorytetu całej witryny i kilka sygnałów, w tym ruch z przeglądarek Chrome, do oceny autorytetu witryny. Sugeruje to, że ogólna jakość i wiarygodność witryny odgrywają znaczącą rolę w rankingu.

Techniki osadzania i autorytet tematyczny

  • Osadzanie stron i witryn: Google wykorzystuje osadzanie stron, osadzanie witryn, skupienie na witrynie i promień witryny w swojej funkcji punktacji, aby zrozumieć trafność tematyczną i spójność treści witryny.

  • Granice tematu i autorytet tematu: Metryki takie jak siteFocusScore, siteRadius, siteEmbeddings i pageEmbeddings są używane do pomiaru autorytetu tematycznego, podkreślając znaczenie utrzymania wyraźnego skupienia na temacie.

googleapi

Dane kliknięć i zaangażowanie użytkowników

  • NavBoost: NavBoost opiera się na danych dotyczących kliknięć i zachowania użytkowników, aby zmienić ranking wyników wyszukiwania, podkreślając znaczenie wskaźników zaangażowania użytkowników.

  • Wskaźniki kliknięć: Google mierzy różne rodzaje kliknięć, w tym złe kliknięcia, dobre kliknięcia, ostatnie najdłuższe kliknięcia i wyświetlenia w całej witrynie.

Wgląd w wysokiej jakości dane NSR

Kluczowe czynniki punktacji z dokumentu danych NSR obejmują:

  • titlematchScore: Wynik dopasowania tytułów w całej witrynie wskazujący, jak dobrze tytuły pasują do zapytań użytkowników.

  • site2vecEmbedding: Wektor dla całej witryny podobny do word2vec, podkreślający znaczenie kompleksowego osadzenia witryny.

  • pnavClicks: Prawdopodobnie związane z informacjami nawigacyjnymi pochodzącymi z danych kliknięć użytkownika.

  • chromeInTotal: Wyświetlenia Chrome w całej witrynie, podkreślające znaczenie sygnałów w całej witrynie.

  • chardVariance i chardScoreVariance: Wyniki przewidujące jakość witryny/strony na podstawie zawartości, przy czym kluczowa jest spójność.

NSR Data Insights

Praktyczne wskazówki dla specjalistów SEO

  1. Zainwestuj w dobrze zaprojektowaną witrynę: Upewnij się, że Twoja witryna ma intuicyjną architekturę, aby zoptymalizować ją pod kątem NavBoost, który opiera się na zachowaniu użytkowników i dziennikach kliknięć w celu zmiany rankingu wyników wyszukiwania.

  2. Usuwanie/blokowanie stron nieistotnych tematycznie: Usuń lub zablokuj strony, które nie są tematycznie istotne. Ustal temat docelowy i upewnij się, że każda strona ma dobre wyniki w tym obszarze.

  3. Optymalizacja nagłówków i treści: Zoptymalizuj nagłówki wokół zapytań i upewnij się, że akapity wyraźnie odpowiadają na te zapytania, aby poprawić osadzanie stron i trafność.

  4. Skup się na kliknięciach i wyświetleniach: Pisz treści, które przyciągają więcej wyświetleń i kliknięć, kładąc nacisk na zaangażowanie użytkowników.

  5. Regularna aktualizacja treści: Regularnie aktualizuj zawartość, dodając unikalne informacje, nowe obrazy i filmy, aby zachować świeżość i uzyskać wysoki wynik w obliczeniach wysiłku.

  6. Utrzymywanie wysokiej jakości treści: Spójność wysokiej jakości treści ma kluczowe znaczenie. Wyniki chard Google na poziomie witryny przewidują jakość witryny / strony na podstawie treści.

  7. Wzrost wartości wyświetleń: Rosnąca liczba wyświetleń jest pozytywną oznaką wydajności witryny.

  8. Optymalizacja pod kątem istotności jednostek: Skoncentruj się na poprawie wyników istotności jednostek i identyfikacji najlepszych jednostek, jak wspomniano w wycieku.

  9. Usuwanie stron o słabych wynikach: Zidentyfikuj i wyeliminuj strony ze słabymi wskaźnikami użytkownika i bez linków zwrotnych, aby utrzymać wysokie wyniki w całej witrynie.

panda

Jak usunąć z pamięci Google starą wersję dokumentu?

Według przecieku, Google prowadzi rejestr każdej wersji strony internetowej, utrzymując wewnętrzne archiwum internetowe podobne do Wayback Machine. Google wykorzystuje jednak tylko 20 ostatnich wersji dokumentu. Jeśli zaktualizujesz stronę, poczekasz na indeksowanie i powtórzysz proces 20 razy, możesz skutecznie wypchnąć niektóre wersje strony. Ta taktyka może być przydatna do poprawy historycznych wag i wyników związanych ze starszymi wersjami.

System rankingowy wyszukiwarki Google

Google Search Ranking System

Jednym z interesujących przypuszczeń jest wpływ wagi terminu (rozmiaru dosłownego). Pogrubianie słów lub dostosowywanie ich rozmiaru może wpływać na wyniki dokumentów. Ponadto mechanizmy przechowywania indeksu Google w różny sposób ustalają priorytety treści:

  • Pendrive'y: Dla najważniejszych i regularnie aktualizowanych treści.

  • Dyski półprzewodnikowe: Dla mniej ważnych treści.

  • Standardowe dyski twarde: Dla nieregularnie aktualizowanej zawartości.

Google's Indexer: Alexandria

Alexandria

Indeksator Google nosi nazwę Alexandria, na cześć słynnej biblioteki. Inne wspomniane indeksatory to SegIndexer, który umieszcza dokumenty w warstwach, oraz TeraGoogle, który obsługuje przechowywanie w pamięci długoterminowej.

Witryny zalążkowe i władza nad witryną

Wyciek wspomina o czynniku o nazwie isElectionAuthority, prawdopodobnie wskazującym na strony zalążkowe lub tematyczne autorytety. Sugeruje to, że witryny o wysokim autorytecie, takie jak te z PageRank 9/10, mają znaczący wpływ. Jednak nsrIsElectionAuthority jest uważany za przestarzały, pozostawiając pewne niejasności w interpretacji.

Krótka treść może mieć wysoką pozycję w rankingu

Wbrew powszechnemu przekonaniu, krótka treść nie oznacza cienkiej treści. Wyciek potwierdza, że krótkie treści mogą być dobrze oceniane, choć z innym systemem punktacji.

Świeże linki a istniejące linki

Zgodnie z mnożnikiem wartości linków freshdocs, linki z nowszych stron internetowych są bardziej wartościowe niż te wstawione do starszych treści. Oznacza to, że choć niszowe edycje mogą być skuteczne, świeże linki mają większy wpływ.

Ulubione odkrycia

Jakość strony (PQ)

Google używa LLM do oszacowania "wysiłku" dla stron z artykułami, pomagając określić, czy strona może być łatwo replikowana. Narzędzia, obrazy, filmy, unikalne informacje i głębia informacji to sposoby na uzyskanie wysokich wyników w obliczeniach wysiłku.

Granice tematu i autorytet tematu

Kluczowe znaczenie ma autorytet tematyczny, wspierany przez siteFocusScore, siteRadius, siteEmbeddings i pageEmbeddings. Utrzymywanie wyraźnego ukierunkowania tematycznego i minimalizowanie odchyleń od tematu pomaga poprawić rankingi.

Jakość obrazu

ImageQualityClickSignals mierzy jakość obrazu na podstawie danych dotyczących kliknięć (użyteczność, prezentacja, atrakcyjność, zaangażowanie).

Host NSR

Host NSR to ranking witryny obliczany dla fragmentów witryny na poziomie hosta, mierzący jakość w segmentach. Ten system segmentacji pomaga Google kompleksowo ocenić jakość witryny.

Ujednolicona teoria rankingu

W tej sekcji podjęto próbę skonsolidowania czynników z wycieku w formułę matematyczną, podkreślając różne wskaźniki i ich wpływ na ogólny wynik rankingu ®.

Definicje i wskaźniki

formula

Wyniki interakcji użytkownika (UIS):

formula

  • UgcScore: Zaangażowanie w treści generowane przez użytkowników.

  • TitleMatchScore: Trafność tytułów do zapytań użytkowników.

  • ChromeInTotal: całkowita liczba interakcji śledzonych przez Chrome.

  • SiteImpressions: Całkowita liczba wyświetleń witryny.

  • TopicImpressions: Wyświetlenia na stronach tematycznych.

  • SiteClicks: Współczynnik klikalności dla witryny.

  • TopicClicks: Współczynnik klikalności dla stron tematycznych.

Wyniki jakości treści (CQS):

formula

  • ImageQualityClickSignals: Sygnały jakości z kliknięć obrazu.

  • VideoScore: Jakość i zaangażowanie treści wideo.

  • ShoppingScore: Wynik dla treści związanych z zakupami.

  • PageEmbedding: Semantyczne osadzanie treści strony.

  • SiteEmbedding: Semantyczne osadzanie zawartości witryny.

  • SiteRadius: Miara odchylenia w obrębie osadzenia witryny.

  • SiteFocus: Metryka wskazująca skupienie na temacie.

  • TextConfidence: Zaufanie do trafności i jakości tekstu.

  • EffortScore: Wysiłek i jakość w tworzeniu treści.

Wyniki połączeń (LS):

Link Scores

  • TrustedAnchors: Jakość i wiarygodność linków przychodzących.

  • SiteLinkIn: Średnia wartość linków przychodzących.

  • PageRank: Różne wyniki PageRank (0, 1, 2, ToolBar, NR).

Relevance Boost (RB):

Relevance Boost

  • TopicEmbedding: Znaczenie w czasie.

  • QnA: Podstawowa miara jakości.

  • STS: Zagregowany wynik oparty na zrozumieniu tekstu, istotności i jednostkach.

Zwiększenie jakości (QB):

Quality Boost

  • SAS: Wynik autorytetu witryny odnoszący się do zaufania, wiarygodności i autorytetu linków.

  • EFTS: Wynik wysiłku obejmujący tekst, multimedia i komentarze.

  • FS: Ocena świeżości na podstawie daty aktualizacji i oryginalnego wpisu.

  • CSA: Dostosowania treści w oparciu o SERP i funkcje na stronie.

CSA

Dostosowania specyficzne dla treści (CSA):

  • CDS: Wynik danych Chrome skupiający się na wyświetleniach i kliknięciach w całej witrynie.

  • SDS: Wynik degradacji w SERP oparty na pomiarze doświadczenia SERP.

  • EQSS: Eksperymentalny wynik Q Star dla zmiennych eksperymentalnych.

Pełna formuła

R=(∑i=17wi⋅UISi)+(∑i=19vi⋅CQSi)+(∑i=13xi⋅LSi)×(RB+QB+X)-

R=((w1​⋅UgcScore+w2​⋅TitleMatchScore+w3​⋅ChromeInTotal+w4​⋅SiteImpressions+w5​⋅TopicImpressions+w6​⋅SiteClicks+w7​⋅TopicClicks)+(v1​⋅ImageQualityClickSignals+v2​⋅VideoScore+v3​⋅ShoppingScore+v4​⋅PageEmbedding+v5​⋅SiteEmbedding+v6​⋅SiteRadius+v7​⋅SiteFocus+v8​⋅TextConfidence+v9​⋅EffortScore)+(x1​⋅TrustedAnchors+x2​⋅SiteLinkIn+x3​⋅PageRank))×(TopicEmbedding+QnA+STS+SAS+EFTS+FS)+(y1​⋅CDS+y2​⋅SDS+y3​⋅EQSS)

Ogólny przegląd punktacji

1. Zaangażowanie użytkowników:

  • UgcScore, TitleMatchScore, ChromeInTotal, SiteImpressions, Topic Impressions, Site Clicks, Topic Clicks

2. Wyniki multimedialne:

  • ImageQualityClickSignals, VideoScore, ShoppingScore

3. Linki:

  • TrustedAnchors, SiteLinkIn (średnia wartość linków przychodzących), PageRank (0, 1, 2, ToolBar, NR)

4. Zrozumienie treści:

  • PageEmbedding, SiteEmbedding, SiteRadius, SiteFocus, TextConfidence, EffortScore

Wnioski

Wyciek dokumentacji zapewnia bezcenny wgląd w mechanizmy rankingowe Google, obalając kilka mitów i ujawniając skomplikowane czynniki wpływające na wyniki wyszukiwania. Specjaliści SEO mogą wykorzystać tę wiedzę do udoskonalenia swoich strategii, koncentrując się na zaangażowaniu użytkowników, trafności tematycznej i stałej jakości treści. W miarę jak społeczność SEO będzie analizować te rewelacje, wielu z nich prawdopodobnie ponownie rozważy swoje podejście w świetle tych nowych informacji.

Rozumiejąc i stosując te spostrzeżenia, praktycy SEO mogą lepiej poruszać się po zawiłościach systemu rankingowego Google, ostatecznie zwiększając widoczność i wydajność swojej witryny w wynikach wyszukiwania.

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Zacznij używać Ranktrackera... Za darmo!

Dowiedz się, co powstrzymuje Twoją witrynę przed zajęciem miejsca w rankingu.

Załóż darmowe konto

Lub Zaloguj się używając swoich danych uwierzytelniających

Different views of Ranktracker app