• Technologie

Yandex hat Code mit 1.922 Ranking-Faktoren veröffentlicht Ranktracker erklärt alle Ranking-Faktoren

  • Felix Rose-Collins
  • 7 min read
Yandex hat Code mit 1.922 Ranking-Faktoren veröffentlicht Ranktracker erklärt alle Ranking-Faktoren

Intro

Sie haben wahrscheinlich von Yandex gehört, der viertgrößten Suchmaschine nach Marktanteil weltweit. Gestern wurde der proprietäre Quellcode von Yandex geleakt.

Der interessanteste Teil für die SEO-Community ist die Liste aller 1922 Rankingfaktoren, die im Suchalgorithmus verwendet werden

Wir haben den Code heruntergeladen, analysiert und hier in hilfreicher Weise dargestellt.

Yandex leak

Der Vorfall sollte nicht überraschen, da Yandex oder seine Produkte häufig Opfer von Cyberangriffen werden. Im Jahr 2016 berichtete Hackread.com exklusiv über den Verkauf von 6,3 Millionen Yandex-Nutzerkontodaten durch einen Dark-Web-Anbieter.

Im September 2021 wurde der russische Suchmaschinenriese von einem der größten DDoS-Angriffe getroffen, der von 200.000 kompromittierten IoT-Geräten ausging.

Treffen Sie Ranktracker

Die All-in-One-Plattform für effektives SEO

Hinter jedem erfolgreichen Unternehmen steht eine starke SEO-Kampagne. Aber bei den zahllosen Optimierungstools und -techniken, die zur Auswahl stehen, kann es schwierig sein, zu wissen, wo man anfangen soll. Nun, keine Angst mehr, denn ich habe genau das Richtige, um zu helfen. Ich präsentiere die Ranktracker All-in-One-Plattform für effektives SEO

Wir haben endlich die Registrierung zu Ranktracker absolut kostenlos geöffnet!

Ein kostenloses Konto erstellen

Oder melden Sie sich mit Ihren Anmeldedaten an

Yandex git sources

Warum ist es so groß?

Yandex ist eines der größten IT-Unternehmen in Russland. Innerhalb des Landes bietet es ein breiteres Spektrum an Dienstleistungen als Google. Stellen Sie sich ein Unternehmen vor, das Google, Uber, Amazon, Netflix und Spotify ersetzt.

Ist diese undichte Stelle echt?

Ich selbst habe nie bei Yandex gearbeitet, aber ich kenne mehrere Leute, die zu verschiedenen Zeiten dort gearbeitet haben oder immer noch dort arbeiten. Ich habe mich vergewissert, dass zumindest einige der Archive mit Sicherheit modernen Quellcode für Unternehmensdienste sowie Dokumentation enthalten, die auf echte Intranet-URLs verweist.

Was drin ist

Der Leaker hat einen Magnet-Link geteilt, der 44,7 GB an Dateien enthält, die mit Yandex-Git-Quellen verknüpft sind. Die Dateien wurden angeblich im Juli 2022 von Yandex gestohlen. Die Code-Repositories enthalten nicht nur Anti-Spam-Richtlinien, sondern vermutlich auch den Quellcode von Yandex.

Das Leck enthüllte rund 1.922 Rankingfaktoren, die die Suchmaschine in ihrem Suchalgorithmus verwendet. Der Code wurde in Form eines Torrents geleakt. Laut der von Twitter-Nutzer Alex Buraks geposteten Analyse enthalten die durchgesickerten Daten zahlreiche Ranking-Faktoren, darunter Textrelevanz, PageRank, Alter der Inhalte, Aktualität usw.

Darüber hinaus gibt es mehrere Faktoren für das Verhalten der Endnutzer, linkbezogene Faktoren und die Zuverlässigkeit des Hosts. SEOs finden einige ungewöhnliche Ranking-Faktoren, wie z. B. die Anzahl der eindeutigen Besucher, das durchschnittliche Domain-Ranking bei Suchanfragen und den Anteil des organischen Verkehrs.

Es sieht so aus, als ob zumindest der Quellcode für alle wichtigen Dienste von Yandex geleakt wurde:

  • Suchmaschine und Indizierungsbot
  • Karten - wie Google Maps und Street View
  • Alice - KI-Assistentin wie Siri/Alexa
  • Taxi - Uber-ähnlicher Taxidienst
  • Direkt - Anzeigendienst wie Google Ads / Adwords
  • Mail - Mail-Dienst wie GMail
  • Disk - Dateispeicherdienst wie Google Drive
  • Markt - Marktplatz wie Amazon
  • Reisen - Wie Booking.com plus Flug-, Bahn- und Bustickets
  • Yandex360 - Wie Google Workspaces für Dienste auf Ihrer eigenen Domain
  • Cloud - Wahrscheinlich ist nicht der gesamte Infrastrukturcode durchgesickert.
  • Pay - Zahlungsabwicklung wie Stripe, aber mit eingeschränktem Funktionsumfang
  • Metrika - Wie Google Analytics
  • Und zumindest der Backend-Teil der meisten anderen Unternehmensdienste ist vorhanden. Das größte Archiv namens "Frontend" muss noch erforscht werden.

Shestakov stellte außerdem einige API-Schlüssel fest, die höchstwahrscheinlich zum Testen der Bereitstellung verwendet wurden.

Einzelheiten zu diesem Leck: finden Sie hier:

https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/

Yandex dementiert Hacking-Versuch

Yandex behauptet, dass es sich des Lecks bewusst ist und bereits eine Untersuchung eingeleitet hat, um zu prüfen, wie Quellcode-"Fragmente" an die Öffentlichkeit gelangt sind. Es ist erwähnenswert, dass das Leck keine persönlichen Daten von Nutzern oder Mitarbeitern enthält.

Angesichts der Bedeutung von Yandex für die russische IT-Infrastruktur und der durchgesickerten Daten könnte man jedoch annehmen, dass der Angriff durch den Einmarsch des Landes in der Ukraine motiviert war. Es könnten also pro-ukrainische Hacker beteiligt sein.

Treffen Sie Ranktracker

Die All-in-One-Plattform für effektives SEO

Hinter jedem erfolgreichen Unternehmen steht eine starke SEO-Kampagne. Aber bei den zahllosen Optimierungstools und -techniken, die zur Auswahl stehen, kann es schwierig sein, zu wissen, wo man anfangen soll. Nun, keine Angst mehr, denn ich habe genau das Richtige, um zu helfen. Ich präsentiere die Ranktracker All-in-One-Plattform für effektives SEO

Wir haben endlich die Registrierung zu Ranktracker absolut kostenlos geöffnet!

Ein kostenloses Konto erstellen

Oder melden Sie sich mit Ihren Anmeldedaten an

In seiner offiziellen Erklärung stellte Yandex klar, dass das Unternehmen nicht gehackt wurde und ein ehemaliger Mitarbeiter an der Veröffentlichung des Quellcodes beteiligt sein könnte. Russlands führendes IT-Unternehmen stellte fest, dass das geleakte Archiv Codefragmente enthält, die Teil eines internen Repositorys sind, dessen Daten sich von denen unterscheiden, die in der neuesten Version des Repositorys verwendet werden.

"Yandex wurde nicht gehackt. Unser Sicherheitsdienst fand Code-Fragmente aus einem internen Repository in der Öffentlichkeit, aber der Inhalt unterscheidet sich von der aktuellen Version des Repository in Yandex-Dienste verwendet", die Erklärung des Unternehmens zu lesen.

Dennoch sind Quellcodelecks gefährlich, da sie ernsthafte Sicherheitsprobleme für Unternehmen darstellen, da Bedrohungsakteure das geistige Eigentum und die Systemdaten des Unternehmens einsehen können. Das Lecken von Quellcode würde Angreifern helfen, gezielte Sicherheitslücken zu schaffen.

Was ist theoretisch der Unterschied zwischen den Algorithmen von Google und Yandex?

Sie sind sich recht ähnlich:

Yandex vs Google

  • Es gibt viele ehemalige Googler bei Yandex
  • Yanex wurde als Google-Klon entwickelt;
  • SEO-Spezialisten in Russland sind fast die gleichen weißen Hut SEO Taktiken für Yandex und für Google

Natürlich gibt es eine Menge Unterschiede, aber der Ansatz und die meisten Ranking-Faktoren scheinen ähnlich zu sein.

In der Praxis: Vergleicht man die Suchergebnisse von Google und Yandex, so liegt die Übereinstimmung bei etwa 70 %.

Laut Statcounter liegt Yandex beim Marktanteil nahe an Yahoo und Bing:

search engine market share worldwide

Die Datei mit den Rankingfaktoren: https://dropbox.com/s/toyehkkfduogbwk/factors_gen.txt?dl=0

Struktur für jeden Faktor:

  1. Name
  2. Link zum internen Wiki (eingeschränkt)
  3. AntiSeoUpperBound (haha)
  4. Beschreibung (auf Russisch, ich habe sie für Sie übersetzt)
  5. usw.

1. Der erste Faktor in der Liste - PageRank.

First factor in the list - PageRank

Die wichtigsten Erkenntnisse nach der Analyse dieser Liste: Das Alter der Links ist ein Rankingfaktor.

Age of links is a ranking factor.

2. Traffic und % des organischen Traffics sind Rankingfaktoren.

Der Kauf von PPC wirkt sich auf die Platzierungen aus.

Traffic and % of organic traffic are ranking factors

3. Zahlen in URLs sind schlecht für das Ranking

Numbers in URLs is bad for rankings

4. Zu viele Schrägstriche in URLs sind schlecht für das Ranking

Too many slashes in URLs is bad for ranking

5. Harte Pessimisierung gleich PR=0

Hard pessimization equal PR=0

6. Zuverlässigkeit des Hosts ist ein Ranking-Faktor

Je weniger 40x/50x-Fehler Sie haben, desto besser für Ihren organischen Verkehr

Host reliability is a ranking factor

7. Es gibt einen eigenen Ranking-Faktor für die Aufwertung von Wikipedia

there is a separate ranking factor for uplifting Wikipedia

8. Viele Ranking-Faktoren hängen mit dem Nutzerverhalten zusammen - CTR, letzter Klick, Verweildauer auf der Website, Absprungrate

Anmerkung: Wir sind uns fast sicher, dass diese Faktoren bei Yandex einen viel größeren Einfluss haben als bei Google.

A lot of ranking factors connected with user behaviour - CTR, last-click, time on site, bounce rate

9. Alter des Dokuments und letzte Aktualisierung sind beides Rankingfaktoren

Document age and last update both are ranking factors

10. Die durchschnittliche Domain-Position über alle Suchanfragen hinweg ist ein Ranking-Faktor

Average domain position across all queries is a ranking factor

11. Crawl-Tiefe ist ein Ranking-Faktor

Halten Sie Ihre wichtigen Seiten näher an der Hauptseite:

  • Top-Seiten: 1 Klick von der Hauptseite aus
  • wichtige Seiten: <3 Klicks

Crawl depth is a ranking factor

12. Zusätzlich: Rankingfaktor für verwaiste Seiten

Sie können dies über unser Website-Audit-Tool herausfinden

Additionally: ranking factor for orphan pages

13. Backlinks von Hauptseiten sind wichtiger als von internen Seiten

Backlinks from main pages are more important than from internal pages

14. Anzahl der Suchanfragen zu Ihrer Website/Url ist ein Ranking-Faktor

Je mehr, desto besser

Number of search queries of your site/url is a ranking factor

15. Traffic von Wikipedia ist ein Rankingfaktor

Traffic from Wikipedia is a ranking factor

16. Wenn Ihre Url die letzte für die Suchanfrage wäre (der Nutzer findet, was er braucht), hätte dies Auswirkungen auf das Ranking

Dafür gibt es strenge Faktoren und auch vorhersehbare Faktoren.

If your url would be the last for search session (user will find what he needs) - it would impact rankings

17. Ranking-Faktor Lesezeichen

Je mehr Nutzer eine URL zu ihren Lesezeichen hinzufügen, desto mehr Wert hat sie.

Bookmarks ranking factor

18. Besondere Rankingfaktoren für kurze Videos (Tiktok, Kurzfilme, Reels)

Special ranking factors for short videos (tiktok, shorts, reels)

19. Maps js-api auf der Seite (zum Beispiel Google Maps) ist ein Rankingfaktor

Bei Google (z. B. in der Reise-Nische) funktioniert das Hinzufügen von Karten mit nützlichen Informationen/Funktionen ebenfalls.

Maps js-api on page (for example Google Maps) is a ranking factor

20. Schlüsselwörter in der URL sind Rankingfaktoren

Wie wir aus der Beschreibung ersehen können, würde das Optimum bis zu 3 Wörter aus der Suchanfrage enthalten.

Keywords in URL are ranking factors

21. Wiederkehrende Nutzer sind ein Rankingfaktor

Bauen Sie Produkte mit guter Bindung und es würde Ihrer SEO zugute kommen (es gibt eine Menge Ranking-Faktoren, um dies zu messen).

Returning users is a ranking factor

22. Prozentualer Anteil von GROSSBUCHSTABEN in <title> ist ein Rankingfaktor

Percentage of CAPITAL LETTERS in title> is a ranking factor

23. Prozentualer Anteil des direkten Verkehrs ist ein Rankingfaktor

Aka. Wenn Ihr gesamter Traffic aus der organischen Suche stammt, ist das verdächtig und schlecht für das Ranking.

Percentage of direct traffic is a ranking factor

24. Ein weiterer Ranking-Faktor für die Qualität von Inhalten - eingebettetes Video auf der Seite

  • Videos einbetten - gut für das Ranking.
  • Defekte eingebettete Videos - schlecht.

One more ranking factor for content quality - broken embedded video on the page

25. Verifizierte Konten in sozialen Netzwerken werden anders gerankt als andere URLs

Wichtig für die Markensuche - idealerweise sollten bei der Suche nach Ihrer Marke nur Ihre Domains + verifizierte soziale Netzwerke in den Top 10 erscheinen

Verified accounts on social networks ranks differently as other urls

26. Wenn die Anker Ihrer Backlinks alle Wörter aus den Schlüsselwörtern enthalten - ist das gut für SEO

Wenn es in einem Link steht, ist es vorteilhafter. Vor allem, wenn die Reihenfolge der Wörter die gleiche ist.

If your backlinks anchors contain all words from the keywords - it's good for SEO

27. Verhältnis "gute" vs. "schlechte" Backlinks ist ein Rankingfaktor

![Verhältnis "gute" vs "schlechte" Backlinks ist ein Rankingfaktor](https://www.ranktracker.com/media/yandex-leaked-code-containing-search-ranking-factors-ranktracker-explains-all-ranking-factors/images/i84.png "Verhältnis "gute" vs "schlechte" Backlinks ist ein Rankingfaktor")

28. Der Qualitätsrang von Texten auf der Domain ist ein Rankingfaktor

Seiten mit minderwertigem Inhalt beeinträchtigen die gesamte Domain.

The quality rank of texts on the domain is a ranking factor

29. Die Anzahl der Anzeigen auf einer Seite ist ein Ranking-Faktor

Amount of advertisements on a page is a ranking factor

30. Es gibt den Zufall als separaten Rankingfaktor

Wenn Sie nicht verstehen, warum einige der Seiten ganz oben stehen, könnte es sich um einen Zufall handeln (um Verhaltensfaktoren zu testen).

There is a random as a separate ranking factor

31. JS von Google Analytics ist ein Ranking-Faktor

Vorhersehbar. Gute Websites nutzen GA/Google Analytics häufiger als schlechte Websites.

JS from Google Analytics is a ranking factor

32. Auswirkungen der Backlinks von den 100 besten Websites nach PageRank auf die Platzierungen

Backlinks from the top 100 best websites by PageRank impacts on rankings

33. URL hat keine Ziffern

/100-beste-Kreditkarten

/best-credit-cards

URL has no digits

34. Anzahl der Schrägstriche in der URL

/finance/articles/2023/investment-advices

/Investment-Ratschläge

Number of slashes in URL

35. Anzahl der Nicht-Buchstaben in der URL

/pet-toys&all$currency=dollar#mobile

/Tierspielzeug

Number of non-letters in URL

36. Symbol '?' in der URL ist ein Rankingfaktor

/Filme?genre=action

/Action-Filme

'?' symbol in the URL is a ranking factor

37. Suchanfrage = URL, einschließlich Punkte und Leerzeichen (??)

Die Suchanfrage lautet "Franklin D. Roosevelt":

/roosevelt

/Franklin_D._Roosevelt

Search query = URL, including dots and spaces (??)

38. Altes Datum in der URL

/2009/12/01/wie-krawatte-gebunden-werden

/wie-eine-Krawatte-zu-binden

Old date in the URL

39. Schlüsselwörter stehen in der URL, nicht im Text der Seite

/Videospiele & Seite ist über Musik

/Videospiele & Seite ist über Videospiele

Keywords is in URL, not in the text of the page

40. URL-Abdeckung mit Trigrammen aus der Suchanfrage

/hotels-neu-zealand

/nz

/billige-hotels-in-neuseeland-beste-angebote

URL coverage with trigrams from the search query

  • Fügen Sie die 1-3 wichtigsten Wörter in die URL ein;
  • Weniger Schrägstriche/Ziffern/Nicht-Buchstaben, wenn sie nicht Teil Ihres Schlüsselworts sind

41. ursprüngliche Gewichtung der Yandex-Ranking-Faktoren

Die endgültigen Gewichte werden von AI(matrixnet) berechnet, aber auch die Anfangswerte sind nützlich.

initial weights of Yandex ranking factors

Schlussfolgerung

So, das ist alles, was wir im Moment teilen. Wir fangen gerade erst an. Das gibt Ihnen einen groben Überblick darüber, was da drin ist.

Wir kratzen hier nur an der Oberfläche und haben noch so viele wertvolle Erkenntnisse vor uns.

Aber wir hatten mit vielen Annahmen und Interpretationen von außen, wie eine so umfangreiche Suchmaschine funktionieren würde, zumindest was die Links betrifft, durchaus recht.

Alles in allem bietet das Yandex-Codeleck einen faszinierenden Einblick in die innere Funktionsweise einer modernen Suchmaschine.

Treffen Sie Ranktracker

Die All-in-One-Plattform für effektives SEO

Hinter jedem erfolgreichen Unternehmen steht eine starke SEO-Kampagne. Aber bei den zahllosen Optimierungstools und -techniken, die zur Auswahl stehen, kann es schwierig sein, zu wissen, wo man anfangen soll. Nun, keine Angst mehr, denn ich habe genau das Richtige, um zu helfen. Ich präsentiere die Ranktracker All-in-One-Plattform für effektives SEO

Wir haben endlich die Registrierung zu Ranktracker absolut kostenlos geöffnet!

Ein kostenloses Konto erstellen

Oder melden Sie sich mit Ihren Anmeldedaten an

Auch wenn sich nicht alle Erkenntnisse direkt auf Google übertragen lassen, so bestätigen sich doch viele Annahmen, die in den letzten Jahren über die allgemeine Funktionsweise großer Internetsuchmaschinen gemacht wurden.

Ich gehe davon aus, dass die SEO-Branche noch ein paar interessante Monate mit neuen Erkenntnissen aus diesem Leck vor sich hat.

Behalten Sie diese Seite im Auge, da wir in den kommenden Wochen und Monaten weitere Rankingfaktoren hinzufügen werden.

Besondere Hinweise an https://twitter.com/alex_buraks

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Starten Sie mit Ranktracker... kostenlos!

Finden Sie heraus, was Ihre Website vom Ranking abhält.

Ein kostenloses Konto erstellen

Oder melden Sie sich mit Ihren Anmeldedaten an

Different views of Ranktracker app