• Teknologi

Yandex membocorkan kode yang berisi 1.922 faktor peringkat pencarian Ranktracker menjelaskan semua faktor peringkat

  • Felix Rose-Collins
  • 7 min read
Yandex membocorkan kode yang berisi 1.922 faktor peringkat pencarian Ranktracker menjelaskan semua faktor peringkat

Intro

Anda mungkin pernah mendengar tentang Yandex, ini adalah mesin pencari terbesar ke-4 berdasarkan pangsa pasar di seluruh dunia. Kemarin kode sumber milik Yandex bocor.

Bagian yang paling menarik bagi komunitas SEO adalah: daftar semua 1922 faktor peringkat yang digunakan dalam algoritma pencarian

Kami telah mengunduh kode, menganalisisnya, dan di sini kode tersebut disajikan dengan cara yang bermanfaat.

Yandex leak

Insiden ini seharusnya tidak mengejutkan, karena Yandex atau produk-produknya sering kali berada di bawah serangan siber. Pada tahun 2016, Hackread.com secara eksklusif melaporkan bagaimana sebuah vendor web gelap menjual 6,3 juta data akun pengguna Yandex.

Pada bulan September 2021, raksasa mesin pencari Rusia ini terkena salah satu serangan DDoS terbesar yang didukung oleh 200.000 perangkat IoT yang disusupi.

Perkenalkan Ranktracker

Platform Lengkap untuk SEO yang Efektif

Di balik setiap bisnis yang sukses adalah kampanye SEO yang kuat. Namun dengan banyaknya alat dan teknik pengoptimalan yang dapat dipilih, mungkin sulit untuk mengetahui dari mana harus memulai. Nah, jangan takut lagi, karena saya punya hal yang tepat untuk membantu. Menghadirkan platform lengkap Ranktracker untuk SEO yang efektif

Kami akhirnya membuka pendaftaran ke Ranktracker secara gratis!

Buat akun gratis

Atau Masuk menggunakan kredensial Anda

Yandex git sources

Mengapa sebesar ini?

Yandex adalah salah satu perusahaan IT terbesar di Rusia. Di negara ini, Yandex menyediakan layanan yang lebih luas daripada Google. Bayangkan satu perusahaan yang menggantikan Google, Uber, Amazon, Netflix, dan Spotify.

Apakah kebocoran ini nyata?

Saya pribadi tidak pernah bekerja di Yandex, tetapi saya mengenal beberapa orang yang pernah bekerja di sana pada waktu yang berbeda atau masih bekerja di sana. Saya memverifikasi bahwa setidaknya beberapa arsip pasti berisi kode sumber modern untuk layanan perusahaan serta dokumentasi yang mengarah ke URL intranet yang sebenarnya.

Apa yang ada di dalamnya

Pembocor telah membagikan tautan magnet yang berisi 44,7GB file yang ditautkan ke sumber git Yandex. File-file tersebut diduga dicuri dari Yandex pada bulan Juli 2022. Selain berisi pedoman anti-spam, repositori kode tersebut diyakini memiliki kode sumber Yandex.

Bocoran tersebut mengungkapkan sekitar 1.922 faktor peringkat yang digunakan mesin pencari dalam algoritme pencariannya. Kode tersebut bocor dalam bentuk torrent. Berdasarkan analisis yang diposting oleh pengguna Twitter Alex Buraks, data yang bocor tersebut mencakup banyak faktor peringkat, termasuk relevansi teks, PageRank, usia konten, kesegaran, dll.

Selain itu, ada beberapa faktor perilaku pengguna akhir, faktor terkait tautan, dan keandalan host. SEO menemukan beberapa faktor peringkat yang tidak biasa, seperti jumlah pengunjung unik, peringkat domain rata-rata di seluruh kueri, dan persen lalu lintas organik.

Sepertinya setidaknya kode sumber untuk semua layanan utama Yandex telah bocor:

  • Mesin Pencari dan Bot Pengindeksan
  • Peta - Seperti Google Maps dan Street View
  • Alice - Asisten AI seperti Siri / Alexa
  • Taksi - Layanan taksi seperti Uber
  • Langsung - Layanan iklan seperti Google Ads / Adwords
  • Mail - Layanan mail seperti GMail
  • Disk - Layanan penyimpanan file seperti Google drive
  • Pasar - Pasar seperti Amazon
  • Perjalanan - Seperti Booking.com plus tiket Pesawat, Kereta Api, dan Bus
  • Yandex360 - Seperti Google Workspaces untuk layanan di domain Anda sendiri
  • Cloud - Mungkin tidak semua kode infrastruktur bocor.
  • Bayar - Pemrosesan pembayaran seperti Stripe, tetapi dengan fitur yang terbatas
  • Metrika - Seperti Google Analytics
  • Dan setidaknya bagian backend dari sebagian besar layanan perusahaan lainnya ada di sana. Arsip terbesar yang disebut "frontend" masih harus dieksplorasi.

Shestakov lebih lanjut mencatat beberapa kunci API, yang kemungkinan besar telah digunakan untuk menguji penerapan.

Detail tentang kebocoran ini: dapat ditemukan di sini:

https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/

Yandex Bantah Upaya Peretasan

Yandex mengklaim bahwa mereka telah mengetahui kebocoran tersebut dan telah memulai investigasi untuk memeriksa bagaimana 'fragmen' kode sumber terekspos ke publik. Perlu dicatat bahwa kebocoran tersebut tidak termasuk data pribadi pengguna atau karyawan.

Namun, mengingat pentingnya Yandex dalam infrastruktur TI Rusia dan data yang bocor, dapat diasumsikan bahwa serangan itu dimotivasi oleh invasi negara itu ke Ukraina. Jadi, peretas pro-Ukraina bisa jadi terlibat.

Perkenalkan Ranktracker

Platform Lengkap untuk SEO yang Efektif

Di balik setiap bisnis yang sukses adalah kampanye SEO yang kuat. Namun dengan banyaknya alat dan teknik pengoptimalan yang dapat dipilih, mungkin sulit untuk mengetahui dari mana harus memulai. Nah, jangan takut lagi, karena saya punya hal yang tepat untuk membantu. Menghadirkan platform lengkap Ranktracker untuk SEO yang efektif

Kami akhirnya membuka pendaftaran ke Ranktracker secara gratis!

Buat akun gratis

Atau Masuk menggunakan kredensial Anda

Dalam pernyataan resminya, Yandex mengklarifikasi bahwa perusahaan tidak diretas dan mantan karyawannya bisa jadi terlibat dalam pembocoran kode sumbernya ke domain publik. Perusahaan IT terkemuka di Rusia ini menyatakan bahwa arsip yang bocor tersebut mencakup fragmen kode yang merupakan bagian dari repositori internal, yang datanya berbeda dengan apa yang digunakan di versi terbaru repositori tersebut.

"Yandex tidak diretas. Layanan keamanan kami menemukan fragmen kode dari repositori internal di domain publik, tetapi kontennya berbeda dari versi repositori saat ini yang digunakan di layanan Yandex," demikian pernyataan perusahaan.

Namun demikian, kebocoran kode sumber berbahaya karena dapat menimbulkan masalah keamanan yang serius bagi organisasi karena pelaku ancaman dapat mengamati kekayaan intelektual dan data sistem perusahaan. Kebocoran kode sumber akan membantu penyerang membuat eksploitasi keamanan yang ditargetkan.

Secara teoritis, apa perbedaan antara algoritme yang digunakan di Google dan di Yandex?

Keduanya sangat mirip:

Yandex vs Google

  • Ada banyak mantan googler di Yandex
  • Yanex dibangun sebagai tiruan Google;
  • Spesialis SEO di Rusia menggunakan taktik white hat SEO yang hampir sama untuk Yandex dan Google

Tentu saja ada banyak perbedaan, tetapi pendekatan dan sebagian besar faktor pemeringkatan tampaknya serupa.

Dalam praktiknya: membandingkan hasil pencarian Google vs Yandex, keduanya memiliki kecocokan ~70%.

Menurut Statcounter, Yandex mendekati Yahoo dan Bing dalam hal pangsa pasar:

search engine market share worldwide

File dengan faktor peringkat: https://dropbox.com/s/toyehkkfduogbwk/factors_gen.txt?dl=0

Struktur untuk setiap faktor:

  1. nama
  2. tautan ke wiki internal (terbatas)
  3. AntiSeoUpperBound (haha)
  4. deskripsi (dalam bahasa Rusia, saya menerjemahkannya untuk Anda)
  5. dll

1. Faktor pertama dalam daftar - PageRank.

First factor in the list - PageRank

Wawasan utama setelah menganalisis daftar ini: Usia tautan adalah faktor peringkat.

Age of links is a ranking factor.

2. Lalu lintas dan % lalu lintas organik adalah faktor peringkat.

Membeli PPC mempengaruhi peringkat.

Traffic and % of organic traffic are ranking factors

3. Angka dalam URL tidak baik untuk peringkat

Numbers in URLs is bad for rankings

4. Terlalu banyak garis miring pada URL tidak baik untuk peringkat

Too many slashes in URLs is bad for ranking

5. Pesimisme keras sama dengan PR = 0

Hard pessimization equal PR=0

6. Keandalan tuan rumah adalah faktor peringkat

Semakin sedikit 40x/50x kesalahan yang Anda miliki, semakin baik untuk lalu lintas organik Anda

Host reliability is a ranking factor

7. Ada faktor peringkat terpisah untuk meningkatkan Wikipedia

there is a separate ranking factor for uplifting Wikipedia

8. Banyak faktor peringkat yang berhubungan dengan perilaku pengguna - CTR, klik terakhir, waktu di situs, rasio pentalan

Catatan: Kami hampir yakin bahwa di Yandex, faktor-faktor tersebut berdampak lebih besar daripada di Google.

A lot of ranking factors connected with user behaviour - CTR, last-click, time on site, bounce rate

9. Usia dokumen dan pembaruan terakhir keduanya merupakan faktor pemeringkatan

Document age and last update both are ranking factors

10. Posisi domain rata-rata di semua kueri adalah faktor peringkat

Average domain position across all queries is a ranking factor

11. Kedalaman perayapan adalah faktor peringkat

Jaga agar halaman penting Anda lebih dekat ke halaman utama:

  • halaman atas: 1 klik dari halaman utama
  • halaman penting: <3 klik

Crawl depth is a ranking factor

12. Selain itu: faktor peringkat untuk halaman yatim piatu

Anda dapat menemukannya melalui alat audit situs web kami

Additionally: ranking factor for orphan pages

13. Tautan balik dari halaman utama lebih penting daripada dari halaman internal

Backlinks from main pages are more important than from internal pages

14. Jumlah kueri penelusuran situs/url Anda adalah faktor peringkat

Lebih banyak lebih baik

Number of search queries of your site/url is a ranking factor

15. Lalu lintas dari Wikipedia adalah faktor peringkat

Traffic from Wikipedia is a ranking factor

16. Jika url Anda akan menjadi yang terakhir untuk sesi pencarian (pengguna akan menemukan apa yang dia butuhkan) - ini akan memengaruhi peringkat

Ada beberapa faktor yang sangat ketat untuk hal ini dan juga faktor yang dapat diprediksi.

If your url would be the last for search session (user will find what he needs) - it would impact rankings

17. Faktor peringkat penanda

Semakin banyak pengguna menambahkan bookmark url, semakin banyak nilai faktor yang dimilikinya

Bookmarks ranking factor

18. Faktor peringkat khusus untuk video pendek (tiktok, pendek, gulungan)

Special ranking factors for short videos (tiktok, shorts, reels)

19. Maps js-api pada halaman (misalnya Google Maps) adalah faktor peringkat

Di Google (misalnya di ceruk perjalanan) menambahkan peta dengan info/fungsi yang berguna juga berfungsi dengan baik.

Maps js-api on page (for example Google Maps) is a ranking factor

20. Kata kunci dalam URL adalah faktor peringkat

Seperti yang bisa kita lihat dari deskripsi - yang optimal akan menyertakan hingga 3 kata dari kueri penelusuran.

Keywords in URL are ranking factors

21. Pengguna yang kembali merupakan faktor peringkat

Buatlah produk dengan retensi yang baik dan itu akan menguntungkan SEO Anda (ada banyak faktor peringkat untuk mengukurnya).

Returning users is a ranking factor

22. Persentase HURUF KAPITAL dalam <judul> adalah faktor peringkat

Percentage of CAPITAL LETTERS in title> is a ranking factor

23. Persentase lalu lintas langsung adalah faktor peringkat

Aka. Jika semua lalu lintas Anda berasal dari Penelusuran Organik - itu mencurigakan + buruk untuk peringkat.

Percentage of direct traffic is a ranking factor

24. Satu lagi faktor peringkat untuk kualitas konten - video yang disematkan rusak pada halaman

  • Sematkan video - bagus untuk peringkat.
  • Video sematan rusak - buruk.

One more ranking factor for content quality - broken embedded video on the page

25. Akun terverifikasi di jejaring sosial memiliki peringkat yang berbeda dengan url lainnya

Penting untuk pencarian merek - idealnya dalam pencarian merek Anda, hanya ada domain Anda + jejaring sosial terverifikasi di 10 besar

Verified accounts on social networks ranks differently as other urls

26. Jika jangkar backlink Anda berisi semua kata dari kata kunci - itu bagus untuk SEO

Jika ada dalam satu tautan - ini lebih menguntungkan. Terutama jika urutan kata-katanya sama.

If your backlinks anchors contain all words from the keywords - it's good for SEO

27. Rasio backlink "baik" vs "buruk" adalah faktor peringkat

![Rasio backlink "baik" vs "buruk" adalah faktor peringkat](https://www.ranktracker.com/media/yandex-leaked-code-containing-search-ranking-factors-ranktracker-explains-all-ranking-factors/images/i84.png "Rasio backlink "baik" vs "buruk" adalah faktor peringkat")

28. Peringkat kualitas teks pada domain merupakan faktor peringkat

Halaman dengan konten berkualitas rendah memengaruhi seluruh domain.

The quality rank of texts on the domain is a ranking factor

29. Jumlah iklan di halaman adalah faktor peringkat

Amount of advertisements on a page is a ranking factor

30. Ada keacakan sebagai faktor peringkat yang terpisah

Ketika Anda tidak mengerti mengapa beberapa halaman berada di atas - bisa jadi itu hanya acak (untuk menguji faktor perilaku).

There is a random as a separate ranking factor

31. JS dari Google Analytics adalah faktor peringkat

Bisa ditebak. Situs web yang bagus lebih sering menggunakan GA / Google Analytics daripada situs web yang buruk.

JS from Google Analytics is a ranking factor

32. Tautan balik dari 100 situs web terbaik menurut PageRank berdampak pada peringkat

Backlinks from the top 100 best websites by PageRank impacts on rankings

33. URL tidak memiliki angka

/100-kartu-kredit-terbaik

/kartu-kredit-terbaik

URL has no digits

34. Jumlah garis miring dalam URL

/finance/articles/2023/investment-advices

/saran-investasi

Number of slashes in URL

35. Jumlah non-huruf dalam URL

/pet-toys&all$currency=dollar#mobile

/ mainan hewan peliharaan

Number of non-letters in URL

36. Simbol '?' dalam URL adalah faktor peringkat

/movies?genre=action

/film-aksi

'?' symbol in the URL is a ranking factor

37. Kueri penelusuran = URL, termasuk titik dan spasi (??)

Permintaan pencarian adalah "Franklin D. Roosevelt":

/ roosevelt

/Franklin_D._Roosevelt

Search query = URL, including dots and spaces (??)

38. Tanggal lama dalam URL

/2009/12/01/cara-mengikat-dasi

/cara-mengikat-dasi

Old date in the URL

39. Kata kunci ada di URL, bukan di teks halaman

/video-game & halaman tentang musik

/video-game & halaman ini tentang video game

Keywords is in URL, not in the text of the page

40. Cakupan URL dengan trigram dari kueri penelusuran

/hotels-new-zealand

/nz

/hotel-murah-di-selandia-baru-penawaran-terbaik

URL coverage with trigrams from the search query

  • Sertakan 1-3 kata yang paling penting dalam URL;
  • Kurangi garis miring/digit/huruf, jika bukan bagian dari kata kunci Anda

41. bobot awal faktor peringkat Yandex

Bobot akhir dihitung oleh AI(matrixnet), tetapi nilai awal juga berguna.

initial weights of Yandex ranking factors

Kesimpulan

Nah, itu dia, hanya itu yang bisa kami bagikan untuk saat ini. Kami baru saja memulai. Ini memberikan gambaran kasar untuk Anda tentang apa yang ada di dalamnya.

Kami hanya menggores permukaannya saja di sini dengan begitu banyak wawasan yang lebih berharga di masa depan.

Tetapi kami cukup benar dalam banyak asumsi dan interpretasi dari luar tentang bagaimana mesin pencari yang begitu luas akan bekerja, setidaknya mengenai tautan.

Secara keseluruhan, bocoran kode Yandex menawarkan wawasan yang menarik tentang cara kerja mesin pencari modern.

Perkenalkan Ranktracker

Platform Lengkap untuk SEO yang Efektif

Di balik setiap bisnis yang sukses adalah kampanye SEO yang kuat. Namun dengan banyaknya alat dan teknik pengoptimalan yang dapat dipilih, mungkin sulit untuk mengetahui dari mana harus memulai. Nah, jangan takut lagi, karena saya punya hal yang tepat untuk membantu. Menghadirkan platform lengkap Ranktracker untuk SEO yang efektif

Kami akhirnya membuka pendaftaran ke Ranktracker secara gratis!

Buat akun gratis

Atau Masuk menggunakan kredensial Anda

Meskipun tidak semua temuan dapat langsung diterapkan pada Google, banyak asumsi yang dibuat dalam beberapa tahun terakhir tentang fungsi umum mesin pencari Internet besar telah dikonfirmasi.

Saya berasumsi bahwa industri SEO masih memiliki beberapa bulan yang menarik ke depannya dengan wawasan baru dari bocoran ini.

Pantau terus halaman ini karena kami akan terus menambahkan faktor peringkat dalam beberapa minggu & bulan ke depan.

Kredit khusus untuk https://twitter.com/alex_buraks

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Mulai gunakan Ranktracker... Gratis!

Cari tahu apa yang menghambat situs web Anda untuk mendapatkan peringkat.

Buat akun gratis

Atau Masuk menggunakan kredensial Anda

Different views of Ranktracker app