Intro
Du har säkert hört talas om Yandex, som är den fjärde största sökmotorn i världen sett till marknadsandel. I går läckte Yandex egen källkod.
Den mest intressanta delen för SEO-communityt är: listan över alla 1922 rankingfaktorer som används i sökalgoritmen.
Vi har laddat ner koden, analyserat den och presenterar den här på ett bra sätt.
Incidenten borde inte komma som en överraskning, eftersom Yandex eller dess produkter ofta utsätts för cyberattacker. År 2016 rapporterade Hackread.com exklusivt om hur en försäljare på den mörka webben sålde 6,3 miljoner kontouppgifter för Yandex-användare.
I september 2021 drabbades den ryska sökmotorjätten av en av de största DDoS-attackerna som drevs av 200 000 infekterade IoT-enheter.
Allt-i-ett-plattformen för effektiv SEO
Bakom varje framgångsrikt företag finns en stark SEO-kampanj. Men med otaliga optimeringsverktyg och tekniker att välja mellan kan det vara svårt att veta var man ska börja. Nåväl, frukta inte längre, för jag har precis det som kan hjälpa dig. Jag presenterar Ranktracker, en allt-i-ett-plattform för effektiv SEO.
Vi har äntligen öppnat registreringen av Ranktracker helt gratis!
Skapa ett kostnadsfritt kontoEller logga in med dina autentiseringsuppgifter
Varför är detta stort?
Yandex är ett av Rysslands största IT-företag. Inom landet erbjuder det ett bredare utbud av tjänster än Google. Föreställ dig ett företag som ersätter Google, Uber, Amazon, Netflix och Spotify.
Är läckan verklig?
Själv har jag aldrig arbetat på Yandex, men jag känner flera personer som har arbetat där vid olika tidpunkter eller fortfarande arbetar där. Jag har kontrollerat att åtminstone en del av arkiven med säkerhet innehåller modern källkod för företagets tjänster samt dokumentation som pekar på riktiga intranät-URL:er.
Vad finns inuti
Läckaren har delat en magnetlänk som innehåller 44,7 GB filer kopplade till Yandex git-källor. Filerna påstås ha stulits från Yandex i juli 2022. Förutom att de innehåller riktlinjer för antispam tros kodförråden innehålla Yandex källkod.
Läckan avslöjade cirka 1 922 rankingfaktorer som sökmotorn använder i sin sökalgoritm. Koden läckte ut som en torrent. Enligt den analys som Twitter-användaren Alex Buraks publicerat innehåller de läckta uppgifterna ett stort antal rankingfaktorer, bland annat textrelevans, PageRank, innehållets ålder, färskhet osv.
Du har säkert hört talas om Yandex, som är den fjärde största sökmotorn i världen sett till marknadsandel. I går läckte Yandex' egen källkod.
- Alex Buraks (@alex_buraks) January 27, 2023
Den mest intressanta delen för SEO-folket är: listan över alla 1922 rankingfaktorer som används i sökalgoritmen.
[🧵THREAD] pic.twitter.com/6x82AAmbON
Dessutom finns det flera faktorer som rör slutanvändarens beteende, länkrelaterade faktorer och värdtillförlitlighet. SEO:s hittar några ovanliga rankingfaktorer, t.ex. antalet unika besökare, genomsnittlig domänrankning i alla sökningar och procent av organisk trafik.
Det ser ut som om åtminstone källkoden för alla Yandex större tjänster har läckt ut:
- Sökmotor och indexeringsbot
- Kartor - som Google Maps och Street View
- Alice - AI-assistent som Siri/Alexa
- Taxi - Uber-liknande taxitjänst
- Direkt - Annonstjänst som Google Ads / Adwords
- Mail - E-posttjänst som GMail
- Disk - Fillagringstjänst som Google Drive
- Marknad - Marknadsplats som Amazon
- Resor - som Booking.com plus flyg-, tåg- och bussbiljetter
- Yandex360 - Som Google Workspaces för tjänster på din egen domän
- Molnet - Troligen läckte inte all infrastrukturkod ut.
- Pay - Betalningshantering som Stripe, men med begränsade funktioner.
- Metrika - som Google Analytics
- Och åtminstone backend-delen av de flesta andra företagstjänster finns där. Det största arkivet som kallas "frontend" är ännu inte utforskat.
Shestakov noterade också några API-nycklar, som sannolikt har använts för att testa distributionen.
Mer information om läckan finns här:
https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/
Yandex förnekar försök till hackning
Yandex hävdar att man är medveten om läckan och har redan inlett en utredning för att kontrollera hur "fragment" av källkoden exponerades för allmänheten. Det är värt att notera att läckan inte omfattar användares eller anställdas personuppgifter.
Med tanke på Yandex betydelse för Rysslands IT-infrastruktur och läckta uppgifter kan man dock anta att attacken motiverades av landets invasion av Ukraina. Så pro-ukrainska hackare skulle kunna vara inblandade.
Allt-i-ett-plattformen för effektiv SEO
Bakom varje framgångsrikt företag finns en stark SEO-kampanj. Men med otaliga optimeringsverktyg och tekniker att välja mellan kan det vara svårt att veta var man ska börja. Nåväl, frukta inte längre, för jag har precis det som kan hjälpa dig. Jag presenterar Ranktracker, en allt-i-ett-plattform för effektiv SEO.
Vi har äntligen öppnat registreringen av Ranktracker helt gratis!
Skapa ett kostnadsfritt kontoEller logga in med dina autentiseringsuppgifter
I sitt officiella uttalande klargjorde Yandex att företaget inte blev hackat och att en tidigare anställd kan vara inblandad i att källkoden läckte ut till allmänheten. Rysslands ledande IT-företag noterade att det läckta arkivet innehåller kodfragment som ingår i ett internt arkiv, vars data skiljer sig från det som används i den senaste versionen av arkivet.
"Yandex hackades inte. Vår säkerhetstjänst hittade kodfragment från ett internt arkiv som är offentligt tillgängligt, men innehållet skiljer sig från den nuvarande versionen av arkivet som används i Yandex tjänster", står det i företagets uttalande.
Källkodsläckor är dock farliga eftersom de utgör allvarliga säkerhetsproblem för organisationer, eftersom hotfulla aktörer kan ta del av företagets immateriella rättigheter och systemdata. Läckage av källkod skulle hjälpa angriparna att skapa riktade säkerhetsexploateringar.
Vad är teoretiskt sett skillnaden mellan algoritmerna i Google och Yandex?
De är ganska lika varandra:
- Det finns en analog till RankBrain- MatrixNet.
- de använder PageRank (nästan samma som i Google);
- Många textalgoritmer är desamma.
- Det finns många före detta googlare på Yandex.
- Yanex byggdes som en Google-klon;
- SEO-specialister i Ryssland använder nästan samma white hat SEO-taktik för Yandex och Google.
Naturligtvis finns det många skillnader, men tillvägagångssättet och de flesta rankingfaktorer verkar vara likartade.
I praktiken: om man jämför Google och Yandex sökresultat är de en ~70 % överensstämmelse.
Enligt Statcounter ligger Yandex nära Yahoo och Bing när det gäller marknadsandelar:
Filen med rankingfaktorer: https://dropbox.com/s/toyehkkfduogbwk/factors_gen.txt?dl=0
Struktur för varje faktor:
- namn
- länk till intern wiki (begränsad)
- AntiSeoUpperBound (haha)
- beskrivning (den är på ryska, jag har översatt den åt dig)
- osv.
1. Första faktorn i listan - PageRank.
De viktigaste insikterna efter att ha analyserat denna lista: Länkarnas ålder är en rankingfaktor.
2. Trafik och andel organisk trafik är rankingfaktorer.
Att köpa PPC påverkar rankningen.
3. Siffror i webbadresser är dåligt för rankningen
4. För många snedstreck i webbadresser är dåligt för rankningen
5. Hård pessimisering lika med PR=0
6. Värdens tillförlitlighet är en rankingfaktor
Ju färre 40x/50x-fel du har, desto bättre för din organiska trafik.
7. Det finns en separat rankingfaktor för upplyftande Wikipedia
8. Många rankningsfaktorer som är kopplade till användarnas beteende - CTR, sista klick, tid på webbplatsen, avvisningsfrekvens.
Observera: Vi är nästan säkra på att dessa faktorer påverkar Yandex mycket mer än Google.
9. Dokumentets ålder och senaste uppdatering är båda rankingfaktorer
10. Genomsnittlig domänposition i alla sökningar är en rankingfaktor.
11. Krypningsdjup är en rankingfaktor
Håll dina viktiga sidor närmare huvudsidan:
- översta sidorna: 1 klick från huvudsidan
- viktiga sidor: <3 klick
12. Dessutom: rankingfaktor för föräldralösa sidor
Du kan ta reda på detta med hjälp av vårt verktyg för granskning av webbplatsen.
13. Backlinks från huvudsidor är viktigare än från interna sidor.
14. Antalet sökfrågor på din webbplats/url är en rankingfaktor.
Ju mer desto bättre
15. Trafik från Wikipedia är en rankingfaktor
16. Om din webbadress skulle vara den sista för sökningen (användaren hittar det han behöver) - skulle det påverka rankningen.
Det finns både strikta faktorer för detta och förutsägbara faktorer.
17. Bokmärken som rankingfaktor
Ju fler användare som lägger till en webbadress i bokmärkena, desto mer faktorvärde har den.
18. Särskilda rankingfaktorer för korta videor (tiktok, shorts, reels)
19. Maps js-api på sidan (till exempel Google Maps) är en rankingfaktor
I Google (t.ex. inom resenäringen) fungerar det också bra att lägga till kartor med användbar information/funktionalitet.
20. Nyckelord i URL är rankingfaktorer
Som vi kan se i beskrivningen kan den optimala sökningen inkludera upp till 3 ord från sökfrågan.
21. Återkommande användare är en rankingfaktor
Om du bygger produkter med god retention kan det gynna din SEO (det finns många rankingfaktorer för att mäta det).
22. Procentuell andel versaler i <title> är en rankingfaktor
23. Procentuell andel direkttrafik är en rankingfaktor
Aka. Om all din trafik kommer från organisk sökning är det misstänkt och dåligt för rankningen.
24. Ytterligare en rankingfaktor för innehållskvalitet - trasig inbäddad video på sidan
- Bädda in videor - bra för rankningen.
- Trasiga inbäddningsvideor - dåligt.
25. Verifierade konton på sociala nätverk rankas annorlunda än andra webbadresser.
Viktigt för varumärkessökningar - om du söker efter ditt varumärke bör endast dina domäner + verifierade sociala nätverk finnas med bland de tio första sökningarna.
26. Om dina backlinks ankare innehåller alla ord från nyckelorden är det bra för SEO.
Om det finns i en enda länk är det mer fördelaktigt. Särskilt om ordföljden är densamma.
27. Förhållandet mellan "bra" och "dåliga" backlinks är en rankingfaktor.
![Förhållandet mellan "bra" och "dåliga" backlinks är en rankingfaktor](https://www.ranktracker.com/media/yandex-leaked-code-containing-search-ranking-factors-ranktracker-explains-all-ranking-factors/images/i84.png "Förhållandet mellan "bra" och "dåliga" backlinks är en rankingfaktor")
28. Kvalitetsrankningen av texter på domänen är en rankingfaktor.
Sidor med innehåll av låg kvalitet påverkar hela domänen.
29. Mängden annonser på en sida är en rankingfaktor
30. Det finns slumpmässighet som en separat rangordningsfaktor.
Om du inte förstår varför vissa sidor ligger överst - det kan vara slumpmässigt (för att testa beteendefaktorer).
31. JS från Google Analytics är en rankingfaktor
Förutsägbart. Bra webbplatser använder GA/Google Analytics oftare än dåliga webbplatser.
32. Backlinks från de 100 bästa webbplatserna enligt PageRank påverkar rankningen
33. URL har inga siffror
❌ /100-bästa-kreditkort
✅ /best-credit-cards
34. Antal snedstreck i URL-adressen
❌ /finance/articles/2023/investment-advices
✅ /investeringsrådgivning
35. Antal bokstäver som inte är bokstäver i URL
❌ /pet-toys&all$currency=dollar#mobile
✅ /pet-toys
36. Symbolen '?' i webbadressen är en rankingfaktor.
❌ /filmer?genre=action
✅ /action-movies
37. Sökfråga = URL, inklusive punkter och mellanslag (??)
Sökfrågan är "Franklin D. Roosevelt":
❌ /roosevelt
✅ /Franklin_D._Roosevelt
38. Gammalt datum i webbadressen
❌ /2009/12/01/hur man knyter en slips
✅ /how-to-tie-a-tie
39. Nyckelord finns i URL, inte i sidans text.
❌ /videospel & sidan handlar om musik
✅ /videospel & sidan handlar om videospel
40. URL-täckning med trigrams från sökfrågan
✅ /hotels-nya-zealand
❌ /nz
❌ /billiga-hotell-i-nya-zealand-bästa erbjudanden
- Inkludera 1-3 viktiga ord i webbadressen;
- Mindre snedstreck/siffror/icke-bokstäver, om det inte ingår i ditt nyckelord.
41. De ursprungliga vikterna för Yandex rankingfaktorer.
De slutliga vikterna beräknas av AI(matrixnet), men de ursprungliga värdena är också användbara.
Slutsats
Det är allt vi delar med oss av för tillfället. Vi har bara börjat. Detta ger dig en grov översikt över vad som finns där.
Vi har bara skrapat på ytan här och det finns många fler värdefulla insikter att ta del av.
Men vi hade rätt i många antaganden och tolkningar utifrån om hur en så omfattande sökmotor skulle fungera, åtminstone när det gäller länkar.
På det hela taget ger Yandex kodläcka en fascinerande inblick i hur en modern sökmotor fungerar.
Allt-i-ett-plattformen för effektiv SEO
Bakom varje framgångsrikt företag finns en stark SEO-kampanj. Men med otaliga optimeringsverktyg och tekniker att välja mellan kan det vara svårt att veta var man ska börja. Nåväl, frukta inte längre, för jag har precis det som kan hjälpa dig. Jag presenterar Ranktracker, en allt-i-ett-plattform för effektiv SEO.
Vi har äntligen öppnat registreringen av Ranktracker helt gratis!
Skapa ett kostnadsfritt kontoEller logga in med dina autentiseringsuppgifter
Även om inte alla resultat kan tillämpas direkt på Google, bekräftas många av de antaganden som gjorts under de senaste åren om hur stora sökmotorer på Internet fungerar i allmänhet.
Jag antar att SEO-branschen har några intressanta månader framför sig med nya insikter från denna läcka.
Håll ett öga på den här sidan eftersom vi kommer att fortsätta att lägga till rankingfaktorer under de kommande veckorna och månaderna.
Särskilda krediter till https://twitter.com/alex_buraks