Intro
Sie haben wahrscheinlich von Yandex gehört, der viertgrößten Suchmaschine nach Marktanteil weltweit. Gestern wurde der proprietäre Quellcode von Yandex geleakt.
Der interessanteste Teil für die SEO-Community ist die Liste aller 1922 Rankingfaktoren, die im Suchalgorithmus verwendet werden
Wir haben den Code heruntergeladen, analysiert und hier in hilfreicher Weise dargestellt.
Der Vorfall sollte nicht überraschen, da Yandex oder seine Produkte häufig Opfer von Cyberangriffen werden. Im Jahr 2016 berichtete Hackread.com exklusiv über den Verkauf von 6,3 Millionen Yandex-Nutzerkontodaten durch einen Dark-Web-Anbieter.
Im September 2021 wurde der russische Suchmaschinenriese von einem der größten DDoS-Angriffe getroffen, der von 200.000 kompromittierten IoT-Geräten ausging.
Die All-in-One-Plattform für effektives SEO
Hinter jedem erfolgreichen Unternehmen steht eine starke SEO-Kampagne. Aber bei den zahllosen Optimierungstools und -techniken, die zur Auswahl stehen, kann es schwierig sein, zu wissen, wo man anfangen soll. Nun, keine Angst mehr, denn ich habe genau das Richtige, um zu helfen. Ich präsentiere die Ranktracker All-in-One-Plattform für effektives SEO
Wir haben endlich die Registrierung zu Ranktracker absolut kostenlos geöffnet!
Ein kostenloses Konto erstellenOder melden Sie sich mit Ihren Anmeldedaten an
Warum ist es so groß?
Yandex ist eines der größten IT-Unternehmen in Russland. Innerhalb des Landes bietet es ein breiteres Spektrum an Dienstleistungen als Google. Stellen Sie sich ein Unternehmen vor, das Google, Uber, Amazon, Netflix und Spotify ersetzt.
Ist diese undichte Stelle echt?
Ich selbst habe nie bei Yandex gearbeitet, aber ich kenne mehrere Leute, die zu verschiedenen Zeiten dort gearbeitet haben oder immer noch dort arbeiten. Ich habe mich vergewissert, dass zumindest einige der Archive mit Sicherheit modernen Quellcode für Unternehmensdienste sowie Dokumentation enthalten, die auf echte Intranet-URLs verweist.
Was drin ist
Der Leaker hat einen Magnet-Link geteilt, der 44,7 GB an Dateien enthält, die mit Yandex-Git-Quellen verknüpft sind. Die Dateien wurden angeblich im Juli 2022 von Yandex gestohlen. Die Code-Repositories enthalten nicht nur Anti-Spam-Richtlinien, sondern vermutlich auch den Quellcode von Yandex.
Das Leck enthüllte rund 1.922 Rankingfaktoren, die die Suchmaschine in ihrem Suchalgorithmus verwendet. Der Code wurde in Form eines Torrents geleakt. Laut der von Twitter-Nutzer Alex Buraks geposteten Analyse enthalten die durchgesickerten Daten zahlreiche Ranking-Faktoren, darunter Textrelevanz, PageRank, Alter der Inhalte, Aktualität usw.
Sie haben wahrscheinlich von Yandex gehört, der viertgrößten Suchmaschine nach Marktanteil weltweit. Gestern wurde der proprietäre Quellcode von Yandex geleakt.
- Alex Buraks (@alex_buraks) 27. Januar 2023
Der interessanteste Teil für die SEO-Community ist: die Liste aller 1922 Rankingfaktoren, die im Suchalgorithmus verwendet werden
[🧵THREAD] pic.twitter.com/6x82AAmbON
Darüber hinaus gibt es mehrere Faktoren für das Verhalten der Endnutzer, linkbezogene Faktoren und die Zuverlässigkeit des Hosts. SEOs finden einige ungewöhnliche Ranking-Faktoren, wie z. B. die Anzahl der eindeutigen Besucher, das durchschnittliche Domain-Ranking bei Suchanfragen und den Anteil des organischen Verkehrs.
Es sieht so aus, als ob zumindest der Quellcode für alle wichtigen Dienste von Yandex geleakt wurde:
- Suchmaschine und Indizierungsbot
- Karten - wie Google Maps und Street View
- Alice - KI-Assistentin wie Siri/Alexa
- Taxi - Uber-ähnlicher Taxidienst
- Direkt - Anzeigendienst wie Google Ads / Adwords
- Mail - Mail-Dienst wie GMail
- Disk - Dateispeicherdienst wie Google Drive
- Markt - Marktplatz wie Amazon
- Reisen - Wie Booking.com plus Flug-, Bahn- und Bustickets
- Yandex360 - Wie Google Workspaces für Dienste auf Ihrer eigenen Domain
- Cloud - Wahrscheinlich ist nicht der gesamte Infrastrukturcode durchgesickert.
- Pay - Zahlungsabwicklung wie Stripe, aber mit eingeschränktem Funktionsumfang
- Metrika - Wie Google Analytics
- Und zumindest der Backend-Teil der meisten anderen Unternehmensdienste ist vorhanden. Das größte Archiv namens "Frontend" muss noch erforscht werden.
Shestakov stellte außerdem einige API-Schlüssel fest, die höchstwahrscheinlich zum Testen der Bereitstellung verwendet wurden.
Einzelheiten zu diesem Leck: finden Sie hier:
https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/
Yandex dementiert Hacking-Versuch
Yandex behauptet, dass es sich des Lecks bewusst ist und bereits eine Untersuchung eingeleitet hat, um zu prüfen, wie Quellcode-"Fragmente" an die Öffentlichkeit gelangt sind. Es ist erwähnenswert, dass das Leck keine persönlichen Daten von Nutzern oder Mitarbeitern enthält.
Angesichts der Bedeutung von Yandex für die russische IT-Infrastruktur und der durchgesickerten Daten könnte man jedoch annehmen, dass der Angriff durch den Einmarsch des Landes in der Ukraine motiviert war. Es könnten also pro-ukrainische Hacker beteiligt sein.
Die All-in-One-Plattform für effektives SEO
Hinter jedem erfolgreichen Unternehmen steht eine starke SEO-Kampagne. Aber bei den zahllosen Optimierungstools und -techniken, die zur Auswahl stehen, kann es schwierig sein, zu wissen, wo man anfangen soll. Nun, keine Angst mehr, denn ich habe genau das Richtige, um zu helfen. Ich präsentiere die Ranktracker All-in-One-Plattform für effektives SEO
Wir haben endlich die Registrierung zu Ranktracker absolut kostenlos geöffnet!
Ein kostenloses Konto erstellenOder melden Sie sich mit Ihren Anmeldedaten an
In seiner offiziellen Erklärung stellte Yandex klar, dass das Unternehmen nicht gehackt wurde und ein ehemaliger Mitarbeiter an der Veröffentlichung des Quellcodes beteiligt sein könnte. Russlands führendes IT-Unternehmen stellte fest, dass das geleakte Archiv Codefragmente enthält, die Teil eines internen Repositorys sind, dessen Daten sich von denen unterscheiden, die in der neuesten Version des Repositorys verwendet werden.
"Yandex wurde nicht gehackt. Unser Sicherheitsdienst fand Code-Fragmente aus einem internen Repository in der Öffentlichkeit, aber der Inhalt unterscheidet sich von der aktuellen Version des Repository in Yandex-Dienste verwendet", die Erklärung des Unternehmens zu lesen.
Dennoch sind Quellcodelecks gefährlich, da sie ernsthafte Sicherheitsprobleme für Unternehmen darstellen, da Bedrohungsakteure das geistige Eigentum und die Systemdaten des Unternehmens einsehen können. Das Lecken von Quellcode würde Angreifern helfen, gezielte Sicherheitslücken zu schaffen.
Was ist theoretisch der Unterschied zwischen den Algorithmen von Google und Yandex?
Sie sind sich recht ähnlich:
- es gibt ein RankBrain-Analogon- MatrixNet
- sie verwenden PageRank (fast dasselbe wie bei Google);
- viele Textalgorithmen sind gleich.
- Es gibt viele ehemalige Googler bei Yandex
- Yanex wurde als Google-Klon entwickelt;
- SEO-Spezialisten in Russland sind fast die gleichen weißen Hut SEO Taktiken für Yandex und für Google
Natürlich gibt es eine Menge Unterschiede, aber der Ansatz und die meisten Ranking-Faktoren scheinen ähnlich zu sein.
In der Praxis: Vergleicht man die Suchergebnisse von Google und Yandex, so liegt die Übereinstimmung bei etwa 70 %.
Laut Statcounter liegt Yandex beim Marktanteil nahe an Yahoo und Bing:
Die Datei mit den Rankingfaktoren: https://dropbox.com/s/toyehkkfduogbwk/factors_gen.txt?dl=0
Struktur für jeden Faktor:
- Name
- Link zum internen Wiki (eingeschränkt)
- AntiSeoUpperBound (haha)
- Beschreibung (auf Russisch, ich habe sie für Sie übersetzt)
- usw.
1. Der erste Faktor in der Liste - PageRank.
Die wichtigsten Erkenntnisse nach der Analyse dieser Liste: Das Alter der Links ist ein Rankingfaktor.
2. Traffic und % des organischen Traffics sind Rankingfaktoren.
Der Kauf von PPC wirkt sich auf die Platzierungen aus.
3. Zahlen in URLs sind schlecht für das Ranking
4. Zu viele Schrägstriche in URLs sind schlecht für das Ranking
5. Harte Pessimisierung gleich PR=0
6. Zuverlässigkeit des Hosts ist ein Ranking-Faktor
Je weniger 40x/50x-Fehler Sie haben, desto besser für Ihren organischen Verkehr
7. Es gibt einen eigenen Ranking-Faktor für die Aufwertung von Wikipedia
8. Viele Ranking-Faktoren hängen mit dem Nutzerverhalten zusammen - CTR, letzter Klick, Verweildauer auf der Website, Absprungrate
Anmerkung: Wir sind uns fast sicher, dass diese Faktoren bei Yandex einen viel größeren Einfluss haben als bei Google.
9. Alter des Dokuments und letzte Aktualisierung sind beides Rankingfaktoren
10. Die durchschnittliche Domain-Position über alle Suchanfragen hinweg ist ein Ranking-Faktor
11. Crawl-Tiefe ist ein Ranking-Faktor
Halten Sie Ihre wichtigen Seiten näher an der Hauptseite:
- Top-Seiten: 1 Klick von der Hauptseite aus
- wichtige Seiten: <3 Klicks
12. Zusätzlich: Rankingfaktor für verwaiste Seiten
Sie können dies über unser Website-Audit-Tool herausfinden
13. Backlinks von Hauptseiten sind wichtiger als von internen Seiten
14. Anzahl der Suchanfragen zu Ihrer Website/Url ist ein Ranking-Faktor
Je mehr, desto besser
15. Traffic von Wikipedia ist ein Rankingfaktor
16. Wenn Ihre Url die letzte für die Suchanfrage wäre (der Nutzer findet, was er braucht), hätte dies Auswirkungen auf das Ranking
Dafür gibt es strenge Faktoren und auch vorhersehbare Faktoren.
17. Ranking-Faktor Lesezeichen
Je mehr Nutzer eine URL zu ihren Lesezeichen hinzufügen, desto mehr Wert hat sie.
18. Besondere Rankingfaktoren für kurze Videos (Tiktok, Kurzfilme, Reels)
19. Maps js-api auf der Seite (zum Beispiel Google Maps) ist ein Rankingfaktor
Bei Google (z. B. in der Reise-Nische) funktioniert das Hinzufügen von Karten mit nützlichen Informationen/Funktionen ebenfalls.
20. Schlüsselwörter in der URL sind Rankingfaktoren
Wie wir aus der Beschreibung ersehen können, würde das Optimum bis zu 3 Wörter aus der Suchanfrage enthalten.
21. Wiederkehrende Nutzer sind ein Rankingfaktor
Bauen Sie Produkte mit guter Bindung und es würde Ihrer SEO zugute kommen (es gibt eine Menge Ranking-Faktoren, um dies zu messen).
22. Prozentualer Anteil von GROSSBUCHSTABEN in <title> ist ein Rankingfaktor
23. Prozentualer Anteil des direkten Verkehrs ist ein Rankingfaktor
Aka. Wenn Ihr gesamter Traffic aus der organischen Suche stammt, ist das verdächtig und schlecht für das Ranking.
24. Ein weiterer Ranking-Faktor für die Qualität von Inhalten - eingebettetes Video auf der Seite
- Videos einbetten - gut für das Ranking.
- Defekte eingebettete Videos - schlecht.
25. Verifizierte Konten in sozialen Netzwerken werden anders gerankt als andere URLs
Wichtig für die Markensuche - idealerweise sollten bei der Suche nach Ihrer Marke nur Ihre Domains + verifizierte soziale Netzwerke in den Top 10 erscheinen
26. Wenn die Anker Ihrer Backlinks alle Wörter aus den Schlüsselwörtern enthalten - ist das gut für SEO
Wenn es in einem Link steht, ist es vorteilhafter. Vor allem, wenn die Reihenfolge der Wörter die gleiche ist.
27. Verhältnis "gute" vs. "schlechte" Backlinks ist ein Rankingfaktor
![Verhältnis "gute" vs "schlechte" Backlinks ist ein Rankingfaktor](https://www.ranktracker.com/media/yandex-leaked-code-containing-search-ranking-factors-ranktracker-explains-all-ranking-factors/images/i84.png "Verhältnis "gute" vs "schlechte" Backlinks ist ein Rankingfaktor")
28. Der Qualitätsrang von Texten auf der Domain ist ein Rankingfaktor
Seiten mit minderwertigem Inhalt beeinträchtigen die gesamte Domain.
29. Die Anzahl der Anzeigen auf einer Seite ist ein Ranking-Faktor
30. Es gibt den Zufall als separaten Rankingfaktor
Wenn Sie nicht verstehen, warum einige der Seiten ganz oben stehen, könnte es sich um einen Zufall handeln (um Verhaltensfaktoren zu testen).
31. JS von Google Analytics ist ein Ranking-Faktor
Vorhersehbar. Gute Websites nutzen GA/Google Analytics häufiger als schlechte Websites.
32. Auswirkungen der Backlinks von den 100 besten Websites nach PageRank auf die Platzierungen
33. URL hat keine Ziffern
❌ /100-beste-Kreditkarten
✅ /best-credit-cards
34. Anzahl der Schrägstriche in der URL
❌ /finance/articles/2023/investment-advices
✅ /Investment-Ratschläge
35. Anzahl der Nicht-Buchstaben in der URL
❌ /pet-toys&all$currency=dollar#mobile
✅ /Tierspielzeug
36. Symbol '?' in der URL ist ein Rankingfaktor
❌ /Filme?genre=action
✅ /Action-Filme
37. Suchanfrage = URL, einschließlich Punkte und Leerzeichen (??)
Die Suchanfrage lautet "Franklin D. Roosevelt":
❌ /roosevelt
✅ /Franklin_D._Roosevelt
38. Altes Datum in der URL
❌ /2009/12/01/wie-krawatte-gebunden-werden
✅ /wie-eine-Krawatte-zu-binden
39. Schlüsselwörter stehen in der URL, nicht im Text der Seite
❌ /Videospiele & Seite ist über Musik
✅ /Videospiele & Seite ist über Videospiele
40. URL-Abdeckung mit Trigrammen aus der Suchanfrage
✅ /hotels-neu-zealand
❌ /nz
❌ /billige-hotels-in-neuseeland-beste-angebote
- Fügen Sie die 1-3 wichtigsten Wörter in die URL ein;
- Weniger Schrägstriche/Ziffern/Nicht-Buchstaben, wenn sie nicht Teil Ihres Schlüsselworts sind
41. ursprüngliche Gewichtung der Yandex-Ranking-Faktoren
Die endgültigen Gewichte werden von AI(matrixnet) berechnet, aber auch die Anfangswerte sind nützlich.
Schlussfolgerung
So, das ist alles, was wir im Moment teilen. Wir fangen gerade erst an. Das gibt Ihnen einen groben Überblick darüber, was da drin ist.
Wir kratzen hier nur an der Oberfläche und haben noch so viele wertvolle Erkenntnisse vor uns.
Aber wir hatten mit vielen Annahmen und Interpretationen von außen, wie eine so umfangreiche Suchmaschine funktionieren würde, zumindest was die Links betrifft, durchaus recht.
Alles in allem bietet das Yandex-Codeleck einen faszinierenden Einblick in die innere Funktionsweise einer modernen Suchmaschine.
Die All-in-One-Plattform für effektives SEO
Hinter jedem erfolgreichen Unternehmen steht eine starke SEO-Kampagne. Aber bei den zahllosen Optimierungstools und -techniken, die zur Auswahl stehen, kann es schwierig sein, zu wissen, wo man anfangen soll. Nun, keine Angst mehr, denn ich habe genau das Richtige, um zu helfen. Ich präsentiere die Ranktracker All-in-One-Plattform für effektives SEO
Wir haben endlich die Registrierung zu Ranktracker absolut kostenlos geöffnet!
Ein kostenloses Konto erstellenOder melden Sie sich mit Ihren Anmeldedaten an
Auch wenn sich nicht alle Erkenntnisse direkt auf Google übertragen lassen, so bestätigen sich doch viele Annahmen, die in den letzten Jahren über die allgemeine Funktionsweise großer Internetsuchmaschinen gemacht wurden.
Ich gehe davon aus, dass die SEO-Branche noch ein paar interessante Monate mit neuen Erkenntnissen aus diesem Leck vor sich hat.
Behalten Sie diese Seite im Auge, da wir in den kommenden Wochen und Monaten weitere Rankingfaktoren hinzufügen werden.
Besondere Hinweise an https://twitter.com/alex_buraks