• Pembaruan Penelusuran Google & Wawasan SEO

Membongkar Bocoran Dokumentasi Pencarian Besar-besaran Google

  • Felix Rose-Collins
  • 7 min read
Membongkar Bocoran Dokumentasi Pencarian Besar-besaran Google

Intro

Kebocoran besar-besaran dokumentasi peringkat Google Search internal telah mengirimkan gelombang kejutan melalui komunitas SEO. Kebocoran tersebut, yang mengekspos lebih dari 14.000 fitur peringkat potensial, menawarkan pandangan yang belum pernah terjadi sebelumnya di balik sistem peringkat pencarian Google yang dijaga ketat.

Kisah di Balik Kebocoran tersebut

Erfan Azimi membagikan bocoran dokumen API Google kepada Rand Fishkin dari SparkToro, yang kemudian meminta Michael King dari iPullRank untuk membantu menyebarkan informasi tersebut. File yang bocor, yang berasal dari dokumen API Google yang berjudul "yoshi-code-bot /elixer-google-api", bukanlah hasil dari peretasan atau whistleblower, melainkan rilis dokumen internal.

Gambaran Umum Kebocoran

Bocoran ini memberikan pandangan yang komprehensif tentang faktor peringkat Google, mengungkapkan wawasan tentang variasi PageRank, metrik otoritas situs, dan banyak lagi. Berikut ini adalah rinciannya:

Wawasan Utama dari Bocoran Dokumen Pencarian Google

PageRank dan Variasinya

  • PageRank_NS: Sekarang sudah tidak digunakan lagi, algoritme ini dikaitkan dengan pemahaman dokumen dan memodifikasi PageRank tradisional untuk fokus pada subset jaringan yang terlokalisasi di sekitar seed node.

  • Tujuh Jenis PageRank: Google menyebutkan tujuh jenis PageRank yang berbeda, termasuk ToolBarPageRank yang terkenal. Variasi ini menunjukkan bahwa Google menggunakan beberapa metode untuk menilai kepentingan halaman.

Identifikasi Model Bisnis

Algoritme Google dapat mengidentifikasi berbagai model bisnis, termasuk situs berita, situs YMYL (Your Money or Your Life), blog pribadi, e-niaga, dan situs video. Alasan di balik penyaringan khusus untuk blog pribadi masih belum jelas dan menimbulkan pertanyaan tentang maksud Google yang lebih luas.

Komponen Algoritma

  • NavBoost: Mekanisme pemeringkatan ulang berdasarkan perilaku pengguna dan log klik, yang sangat dipengaruhi oleh data Chrome.

  • NSR (Peringkat Situs yang Dinormalisasi): Digunakan untuk menghitung peringkat situs untuk potongan situs tingkat host.

  • ChardScores: Skor tingkat situs yang memprediksi kualitas situs/halaman berdasarkan konten.

Metrik Otoritas Situs

Google menggunakan metrik otoritas di seluruh situs dan beberapa sinyal, termasuk lalu lintas dari browser Chrome, untuk mengevaluasi otoritas situs. Hal ini menunjukkan bahwa kualitas dan kredibilitas situs secara keseluruhan memainkan peran penting dalam menentukan peringkat.

Teknik Penyematan dan Otoritas Topik

  • Penyematan Halaman dan Situs: Google menggunakan penyematan halaman, penyematan situs, fokus situs, dan radius situs dalam fungsi penilaiannya untuk memahami relevansi topik dan konsistensi konten situs web.

  • Batas Topik dan Otoritas Topik: Metrik seperti siteFocusScore, siteRadius, siteEmbeddings, dan pageEmbedings digunakan untuk mengukur otoritas topik, yang menekankan pentingnya mempertahankan fokus topik yang jelas.

googleapi

Klik Data dan Keterlibatan Pengguna

  • NavBoost: NavBoost mengandalkan data klik dan perilaku pengguna untuk menentukan peringkat ulang hasil pencarian, menggarisbawahi pentingnya metrik keterlibatan pengguna.

  • Metrik Klik: Google mengukur berbagai jenis klik, termasuk klik buruk, klik bagus, klik terlama, dan tayangan di seluruh situs.

Wawasan Data NSR yang Berkualitas

Faktor-faktor penilaian utama dari dokumen data NSR meliputi:

  • titlematchScore: Skor kecocokan judul di seluruh situs yang menunjukkan seberapa baik judul cocok dengan kueri pengguna.

  • site2vecEmbedding: Vektor di seluruh situs yang mirip dengan word2vec, menyoroti pentingnya penyematan situs yang komprehensif.

  • pnavClicks: Kemungkinan terkait dengan informasi navigasi yang berasal dari data klik pengguna.

  • chromeInTotal: Tampilan Chrome di seluruh situs, yang menekankan pentingnya sinyal di seluruh situs.

  • chardVariance dan chardScoreVariance: Skor yang memprediksi kualitas situs/halaman berdasarkan konten, dengan konsistensi sebagai kuncinya.

NSR Data Insights

Hal-hal Praktis untuk Profesional SEO

  1. Berinvestasi dalam Situs yang Dirancang dengan Baik: Pastikan situs Anda memiliki arsitektur yang intuitif untuk mengoptimalkan NavBoost, yang mengandalkan perilaku pengguna dan log klik untuk menentukan peringkat ulang hasil pencarian.

  2. Hapus/Blokir Halaman yang Tidak Relevan dengan Topik: Hapus atau blokir halaman yang tidak relevan dengan topik. Tentukan topik target Anda dan pastikan setiap halaman memiliki nilai yang baik di area ini.

  3. Optimalkan Judul dan Konten: Optimalkan judul di sekitar kueri dan pastikan paragraf menjawab kueri tersebut dengan jelas untuk meningkatkan penyematan dan relevansi halaman.

  4. Fokus pada Klik dan Tayangan: Tulis konten yang menarik lebih banyak tayangan dan klik, dengan menekankan keterlibatan pengguna.

  5. Perbarui Konten Secara Teratur: Perbarui konten secara teratur dengan informasi unik, gambar, dan video baru untuk menjaga kesegaran dan mendapatkan skor tinggi dalam perhitungan upaya.

  6. Pertahankan Konten Berkualitas Tinggi: Konsistensi dalam konten berkualitas tinggi sangat penting. Skor chard tingkat situs Google memprediksi kualitas situs/halaman berdasarkan konten.

  7. Pertumbuhan Nilai Tayangan: Impresi yang terus bertambah adalah tanda positif dari kinerja situs.

  8. Optimalkan untuk Entity Salience: Fokus pada peningkatan skor salience untuk entitas dan identifikasi entitas teratas seperti yang disebutkan dalam kebocoran.

  9. Hapus Halaman Berkinerja Buruk: Identifikasi dan hilangkan halaman dengan metrik pengguna yang buruk dan tidak ada tautan balik untuk mempertahankan skor tinggi di seluruh situs.

panda

Cara Menghapus Memori Google dari Versi Lama Dokumen

Menurut bocoran tersebut, Google menyimpan catatan setiap versi dari sebuah halaman web, memelihara arsip web internal yang mirip dengan Wayback Machine. Namun, Google hanya menggunakan 20 versi terakhir dari sebuah dokumen. Jika Anda memperbarui sebuah halaman, menunggu perayapan, dan mengulangi prosesnya 20 kali, Anda dapat secara efektif mendorong keluar versi tertentu dari halaman tersebut. Taktik ini dapat berguna untuk meningkatkan bobot historis dan skor yang terkait dengan versi yang lebih lama.

Sistem Peringkat Pencarian Google

Google Search Ranking System

Salah satu dugaan yang menarik dari bocoran tersebut adalah dampak dari bobot istilah (ukuran literal). Menebalkan kata atau menyesuaikan ukuran kata dapat memengaruhi skor dokumen. Selain itu, mekanisme penyimpanan indeks Google memprioritaskan konten secara berbeda:

  • Flash Drive: Untuk konten yang paling penting dan diperbarui secara berkala.

  • Solid State Drive: Untuk konten yang tidak terlalu penting.

  • Hard Drive Standar: Untuk konten yang diperbarui secara tidak teratur.

Pengindeks Google: Alexandria

Alexandria

Pengindeks Google diberi nama Alexandria, yang diambil dari nama perpustakaan yang terkenal. Pengindeks lain yang disebutkan termasuk SegIndexer, yang menempatkan dokumen ke dalam tingkatan, dan TeraGoogle, yang menangani penyimpanan memori jangka panjang.

Lokasi Benih dan Otoritas di Seluruh Lokasi

Bocoran tersebut menyebutkan sebuah faktor yang dinamakan isElectionAuthority, yang mungkin mengindikasikan situs unggulan atau otoritas topik. Hal ini menunjukkan bahwa situs dengan otoritas tinggi, seperti yang memiliki PageRank 9/10, memiliki pengaruh yang signifikan. Namun, nsrIsElectionAuthority dianggap sudah tidak digunakan lagi, meninggalkan beberapa ambiguitas dalam interpretasi.

Konten Pendek Bisa Mendapat Peringkat

Berlawanan dengan kepercayaan umum, konten pendek tidak sama dengan konten tipis. Bocoran tersebut menegaskan bahwa konten pendek dapat memperoleh peringkat yang baik, meskipun dengan sistem penilaian yang berbeda.

Tautan Baru vs Tautan yang Sudah Ada

Menurut pengali nilai tautan freshdocs, tautan dari halaman web yang lebih baru lebih berharga daripada tautan yang disisipkan ke dalam konten yang lebih lama. Hal ini menunjukkan bahwa meskipun pengeditan khusus bisa efektif, tautan baru memiliki dampak yang lebih tinggi.

Penemuan Favorit

Kualitas Halaman (PQ)

Google menggunakan LLM untuk memperkirakan "upaya" untuk halaman artikel, membantu menentukan apakah sebuah halaman dapat dengan mudah direplikasi. Alat bantu, gambar, video, informasi unik, dan kedalaman informasi adalah cara untuk mendapatkan skor tinggi dalam perhitungan upaya.

Batas Topik dan Otoritas Topik

Otoritas topik, yang didukung oleh siteFocusScore, siteRadius, siteEmbeddings, dan pageEmbeddings, sangat penting. Mempertahankan fokus topik yang jelas dan meminimalkan penyimpangan dari topik membantu meningkatkan peringkat.

Kualitas Gambar

ImageQualityClickSignals mengukur kualitas gambar berdasarkan data klik (kegunaan, presentasi, daya tarik, dan keterlibatan).

Tuan rumah NSR

Host NSR adalah peringkat situs yang dihitung untuk potongan situs tingkat host, yang mengukur kualitas dalam segmen. Sistem pemotongan ini membantu Google menilai kualitas situs secara komprehensif.

Teori Pemeringkatan Terpadu

Bagian ini mencoba mengkonsolidasikan faktor-faktor dari kebocoran ke dalam rumus matematika, menyoroti berbagai metrik dan dampaknya terhadap skor peringkat secara keseluruhan.

Definisi dan Metrik

formula

Skor Interaksi Pengguna (UIS):

formula

  • UgcScore: Keterlibatan konten buatan pengguna.

  • Skor kecocokan judul: Relevansi judul dengan kueri pengguna.

  • ChromeInTotal: Total interaksi yang dilacak melalui Chrome.

  • Tayangan situs: Total tayangan situs.

  • Tayangan Topik: Tayangan pada halaman khusus topik.

  • Klik Situs: Rasio klik-tayang untuk situs.

  • Klik Topik: Rasio klik-tayang untuk halaman khusus topik.

Skor Kualitas Konten (CQS):

formula

  • Sinyal Klik Kualitas Gambar: Sinyal kualitas dari klik gambar.

  • VideoScore: Kualitas dan keterlibatan konten video.

  • Skor Belanja: Skor untuk konten yang berhubungan dengan belanja.

  • Penyematan Halaman: Penyematan semantik konten halaman.

  • Penyematan Situs: Penyematan semantik konten situs.

  • SiteRadius: Ukuran deviasi dalam penyematan situs.

  • Fokus Situs: Metrik yang menunjukkan fokus topik.

  • Keyakinan Teks: Keyakinan akan relevansi dan kualitas teks.

  • EffortScore: Upaya dan kualitas dalam pembuatan konten.

Skor Tautan (LS):

Link Scores

  • Jangkar tepercaya: Kualitas dan kepercayaan tautan masuk.

  • Tautan Situs: Nilai rata-rata tautan masuk.

  • PageRank: Berbagai skor PageRank (0, 1, 2, ToolBar, NR).

Peningkatan Relevansi (RB):

Relevance Boost

  • Penanaman topik: Relevansi dari waktu ke waktu.

  • Tanya Jawab: Ukuran kualitas dasar.

  • STS: Skor agregat berdasarkan pemahaman teks, penonjolan, dan entitas.

Peningkatan Kualitas (QB):

Quality Boost

  • SAS: Skor otoritas situs yang berkaitan dengan kepercayaan, keandalan, dan otoritas tautan.

  • EFTS: Skor upaya yang menggabungkan teks, multimedia, dan komentar.

  • FS: Skor kesegaran berdasarkan tanggal pembaruan dan tanggal posting asli.

  • CSA: Penyesuaian khusus konten berdasarkan SERP dan fitur pada halaman.

CSA

Penyesuaian Khusus Konten (CSA):

  • CDS: Skor data Chrome yang berfokus pada tayangan dan klik di seluruh situs.

  • SDS: Skor penurunan peringkat SERP berdasarkan pengukuran pengalaman SERP.

  • EQSS: Skor Q Star eksperimental untuk variabel eksperimental.

Formula Lengkap

R = (∑i = 17wi⋅UISi) + (∑i = 19vi⋅CQSi) + (∑i = 13xi⋅LSi) × (RB + RB + X) -

R=((w1​⋅UgcScore+w2​⋅TitleMatchScore+w3​⋅ChromeInTotal+w4​⋅SiteImpressions+w5​⋅TopicImpressions+w6​⋅SiteClicks+w7​⋅TopicClicks)+(v1​⋅ImageQualityClickSignals+v2​⋅VideoScore+v3​⋅ShoppingScore+v4​⋅PageEmbedding+v5​⋅SiteEmbedding+v6​⋅SiteRadius+v7​⋅SiteFocus+v8​⋅TextConfidence+v9​⋅EffortScore)+(x1​⋅TrustedAnchors+x2​⋅SiteLinkIn+x3​⋅PageRank))×(TopicEmbedding+QnA+STS+SAS+EFTS+FS)+(y1​⋅CDS+y2​⋅SDS+y3​⋅EQSS)

Ikhtisar Penilaian Umum

1. Keterlibatan Pengguna:

  • UgcScore, TitleMatchScore, ChromeInTotal, Tayangan Situs, Tayangan Topik, Klik Situs, Klik Topik

2. Skor Multi-Media:

  • Sinyal Klik Kualitas Gambar, Skor Video, Skor Belanja

3. Tautan:

  • TrustedAnchors, SiteLinkIn (nilai rata-rata tautan masuk), PageRank (0, 1, 2, ToolBar, NR)

4. Pemahaman Konten:

  • PageEmbedding, SiteEmbedding, SiteRadius, SiteFocus, TextConfidence, EffortScore

Kesimpulan

Bocoran dokumentasi ini memberikan wawasan yang sangat berharga ke dalam mekanisme peringkat Google, menyanggah beberapa mitos dan mengungkapkan faktor-faktor rumit yang mempengaruhi hasil pencarian. Para profesional SEO dapat memanfaatkan pengetahuan ini untuk menyempurnakan strategi mereka, dengan fokus pada keterlibatan pengguna, relevansi topik, dan kualitas konten yang konsisten. Ketika komunitas SEO mencerna pengungkapan ini, banyak yang mungkin akan mempertimbangkan kembali pendekatan mereka dengan mempertimbangkan informasi baru ini.

Dengan memahami dan menerapkan wawasan ini, praktisi SEO dapat menavigasi kompleksitas sistem peringkat Google dengan lebih baik, yang pada akhirnya meningkatkan visibilitas dan kinerja situs web mereka dalam hasil pencarian.

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Mulai gunakan Ranktracker... Gratis!

Cari tahu apa yang menghambat situs web Anda untuk mendapatkan peringkat.

Buat akun gratis

Atau Masuk menggunakan kredensial Anda

Different views of Ranktracker app