• Teknik

Yandex har läckt kod som innehåller 1 922 rankingfaktorer Ranktracker förklarar alla rankingfaktorer

  • Felix Rose-Collins
  • 7 min read
Yandex har läckt kod som innehåller 1 922 rankingfaktorer Ranktracker förklarar alla rankingfaktorer

Intro

Du har säkert hört talas om Yandex, som är den fjärde största sökmotorn i världen sett till marknadsandel. I går läckte Yandex egen källkod.

Den mest intressanta delen för SEO-communityt är: listan över alla 1922 rankingfaktorer som används i sökalgoritmen.

Vi har laddat ner koden, analyserat den och presenterar den här på ett bra sätt.

Yandex leak

Incidenten borde inte komma som en överraskning, eftersom Yandex eller dess produkter ofta utsätts för cyberattacker. År 2016 rapporterade Hackread.com exklusivt om hur en försäljare på den mörka webben sålde 6,3 miljoner kontouppgifter för Yandex-användare.

I september 2021 drabbades den ryska sökmotorjätten av en av de största DDoS-attackerna som drevs av 200 000 infekterade IoT-enheter.

Möt Ranktracker

Allt-i-ett-plattformen för effektiv SEO

Bakom varje framgångsrikt företag finns en stark SEO-kampanj. Men med otaliga optimeringsverktyg och tekniker att välja mellan kan det vara svårt att veta var man ska börja. Nåväl, frukta inte längre, för jag har precis det som kan hjälpa dig. Jag presenterar Ranktracker, en allt-i-ett-plattform för effektiv SEO.

Vi har äntligen öppnat registreringen av Ranktracker helt gratis!

Skapa ett kostnadsfritt konto

Eller logga in med dina autentiseringsuppgifter

Yandex git sources

Varför är detta stort?

Yandex är ett av Rysslands största IT-företag. Inom landet erbjuder det ett bredare utbud av tjänster än Google. Föreställ dig ett företag som ersätter Google, Uber, Amazon, Netflix och Spotify.

Är läckan verklig?

Själv har jag aldrig arbetat på Yandex, men jag känner flera personer som har arbetat där vid olika tidpunkter eller fortfarande arbetar där. Jag har kontrollerat att åtminstone en del av arkiven med säkerhet innehåller modern källkod för företagets tjänster samt dokumentation som pekar på riktiga intranät-URL:er.

Vad finns inuti

Läckaren har delat en magnetlänk som innehåller 44,7 GB filer kopplade till Yandex git-källor. Filerna påstås ha stulits från Yandex i juli 2022. Förutom att de innehåller riktlinjer för antispam tros kodförråden innehålla Yandex källkod.

Läckan avslöjade cirka 1 922 rankingfaktorer som sökmotorn använder i sin sökalgoritm. Koden läckte ut som en torrent. Enligt den analys som Twitter-användaren Alex Buraks publicerat innehåller de läckta uppgifterna ett stort antal rankingfaktorer, bland annat textrelevans, PageRank, innehållets ålder, färskhet osv.

Dessutom finns det flera faktorer som rör slutanvändarens beteende, länkrelaterade faktorer och värdtillförlitlighet. SEO:s hittar några ovanliga rankingfaktorer, t.ex. antalet unika besökare, genomsnittlig domänrankning i alla sökningar och procent av organisk trafik.

Det ser ut som om åtminstone källkoden för alla Yandex större tjänster har läckt ut:

  • Sökmotor och indexeringsbot
  • Kartor - som Google Maps och Street View
  • Alice - AI-assistent som Siri/Alexa
  • Taxi - Uber-liknande taxitjänst
  • Direkt - Annonstjänst som Google Ads / Adwords
  • Mail - E-posttjänst som GMail
  • Disk - Fillagringstjänst som Google Drive
  • Marknad - Marknadsplats som Amazon
  • Resor - som Booking.com plus flyg-, tåg- och bussbiljetter
  • Yandex360 - Som Google Workspaces för tjänster på din egen domän
  • Molnet - Troligen läckte inte all infrastrukturkod ut.
  • Pay - Betalningshantering som Stripe, men med begränsade funktioner.
  • Metrika - som Google Analytics
  • Och åtminstone backend-delen av de flesta andra företagstjänster finns där. Det största arkivet som kallas "frontend" är ännu inte utforskat.

Shestakov noterade också några API-nycklar, som sannolikt har använts för att testa distributionen.

Mer information om läckan finns här:

https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/

Yandex förnekar försök till hackning

Yandex hävdar att man är medveten om läckan och har redan inlett en utredning för att kontrollera hur "fragment" av källkoden exponerades för allmänheten. Det är värt att notera att läckan inte omfattar användares eller anställdas personuppgifter.

Med tanke på Yandex betydelse för Rysslands IT-infrastruktur och läckta uppgifter kan man dock anta att attacken motiverades av landets invasion av Ukraina. Så pro-ukrainska hackare skulle kunna vara inblandade.

Möt Ranktracker

Allt-i-ett-plattformen för effektiv SEO

Bakom varje framgångsrikt företag finns en stark SEO-kampanj. Men med otaliga optimeringsverktyg och tekniker att välja mellan kan det vara svårt att veta var man ska börja. Nåväl, frukta inte längre, för jag har precis det som kan hjälpa dig. Jag presenterar Ranktracker, en allt-i-ett-plattform för effektiv SEO.

Vi har äntligen öppnat registreringen av Ranktracker helt gratis!

Skapa ett kostnadsfritt konto

Eller logga in med dina autentiseringsuppgifter

I sitt officiella uttalande klargjorde Yandex att företaget inte blev hackat och att en tidigare anställd kan vara inblandad i att källkoden läckte ut till allmänheten. Rysslands ledande IT-företag noterade att det läckta arkivet innehåller kodfragment som ingår i ett internt arkiv, vars data skiljer sig från det som används i den senaste versionen av arkivet.

"Yandex hackades inte. Vår säkerhetstjänst hittade kodfragment från ett internt arkiv som är offentligt tillgängligt, men innehållet skiljer sig från den nuvarande versionen av arkivet som används i Yandex tjänster", står det i företagets uttalande.

Källkodsläckor är dock farliga eftersom de utgör allvarliga säkerhetsproblem för organisationer, eftersom hotfulla aktörer kan ta del av företagets immateriella rättigheter och systemdata. Läckage av källkod skulle hjälpa angriparna att skapa riktade säkerhetsexploateringar.

Vad är teoretiskt sett skillnaden mellan algoritmerna i Google och Yandex?

De är ganska lika varandra:

  • Det finns en analog till RankBrain- MatrixNet.
  • de använder PageRank (nästan samma som i Google);
  • Många textalgoritmer är desamma.

Yandex vs Google

  • Det finns många före detta googlare på Yandex.
  • Yanex byggdes som en Google-klon;
  • SEO-specialister i Ryssland använder nästan samma white hat SEO-taktik för Yandex och Google.

Naturligtvis finns det många skillnader, men tillvägagångssättet och de flesta rankingfaktorer verkar vara likartade.

I praktiken: om man jämför Google och Yandex sökresultat är de en ~70 % överensstämmelse.

Enligt Statcounter ligger Yandex nära Yahoo och Bing när det gäller marknadsandelar:

search engine market share worldwide

Filen med rankingfaktorer: https://dropbox.com/s/toyehkkfduogbwk/factors_gen.txt?dl=0

Struktur för varje faktor:

  1. namn
  2. länk till intern wiki (begränsad)
  3. AntiSeoUpperBound (haha)
  4. beskrivning (den är på ryska, jag har översatt den åt dig)
  5. osv.

1. Första faktorn i listan - PageRank.

First factor in the list - PageRank

De viktigaste insikterna efter att ha analyserat denna lista: Länkarnas ålder är en rankingfaktor.

Age of links is a ranking factor.

2. Trafik och andel organisk trafik är rankingfaktorer.

Att köpa PPC påverkar rankningen.

Traffic and % of organic traffic are ranking factors

3. Siffror i webbadresser är dåligt för rankningen

Numbers in URLs is bad for rankings

4. För många snedstreck i webbadresser är dåligt för rankningen

Too many slashes in URLs is bad for ranking

5. Hård pessimisering lika med PR=0

Hard pessimization equal PR=0

6. Värdens tillförlitlighet är en rankingfaktor

Ju färre 40x/50x-fel du har, desto bättre för din organiska trafik.

Host reliability is a ranking factor

7. Det finns en separat rankingfaktor för upplyftande Wikipedia

there is a separate ranking factor for uplifting Wikipedia

8. Många rankningsfaktorer som är kopplade till användarnas beteende - CTR, sista klick, tid på webbplatsen, avvisningsfrekvens.

Observera: Vi är nästan säkra på att dessa faktorer påverkar Yandex mycket mer än Google.

A lot of ranking factors connected with user behaviour - CTR, last-click, time on site, bounce rate

9. Dokumentets ålder och senaste uppdatering är båda rankingfaktorer

Document age and last update both are ranking factors

10. Genomsnittlig domänposition i alla sökningar är en rankingfaktor.

Average domain position across all queries is a ranking factor

11. Krypningsdjup är en rankingfaktor

Håll dina viktiga sidor närmare huvudsidan:

  • översta sidorna: 1 klick från huvudsidan
  • viktiga sidor: <3 klick

Crawl depth is a ranking factor

12. Dessutom: rankingfaktor för föräldralösa sidor

Du kan ta reda på detta med hjälp av vårt verktyg för granskning av webbplatsen.

Additionally: ranking factor for orphan pages

13. Backlinks från huvudsidor är viktigare än från interna sidor.

Backlinks from main pages are more important than from internal pages

14. Antalet sökfrågor på din webbplats/url är en rankingfaktor.

Ju mer desto bättre

Number of search queries of your site/url is a ranking factor

15. Trafik från Wikipedia är en rankingfaktor

Traffic from Wikipedia is a ranking factor

16. Om din webbadress skulle vara den sista för sökningen (användaren hittar det han behöver) - skulle det påverka rankningen.

Det finns både strikta faktorer för detta och förutsägbara faktorer.

If your url would be the last for search session (user will find what he needs) - it would impact rankings

17. Bokmärken som rankingfaktor

Ju fler användare som lägger till en webbadress i bokmärkena, desto mer faktorvärde har den.

Bookmarks ranking factor

18. Särskilda rankingfaktorer för korta videor (tiktok, shorts, reels)

Special ranking factors for short videos (tiktok, shorts, reels)

19. Maps js-api på sidan (till exempel Google Maps) är en rankingfaktor

I Google (t.ex. inom resenäringen) fungerar det också bra att lägga till kartor med användbar information/funktionalitet.

Maps js-api on page (for example Google Maps) is a ranking factor

20. Nyckelord i URL är rankingfaktorer

Som vi kan se i beskrivningen kan den optimala sökningen inkludera upp till 3 ord från sökfrågan.

Keywords in URL are ranking factors

21. Återkommande användare är en rankingfaktor

Om du bygger produkter med god retention kan det gynna din SEO (det finns många rankingfaktorer för att mäta det).

Returning users is a ranking factor

22. Procentuell andel versaler i <title> är en rankingfaktor

Percentage of CAPITAL LETTERS in title> is a ranking factor

23. Procentuell andel direkttrafik är en rankingfaktor

Aka. Om all din trafik kommer från organisk sökning är det misstänkt och dåligt för rankningen.

Percentage of direct traffic is a ranking factor

24. Ytterligare en rankingfaktor för innehållskvalitet - trasig inbäddad video på sidan

  • Bädda in videor - bra för rankningen.
  • Trasiga inbäddningsvideor - dåligt.

One more ranking factor for content quality - broken embedded video on the page

25. Verifierade konton på sociala nätverk rankas annorlunda än andra webbadresser.

Viktigt för varumärkessökningar - om du söker efter ditt varumärke bör endast dina domäner + verifierade sociala nätverk finnas med bland de tio första sökningarna.

Verified accounts on social networks ranks differently as other urls

26. Om dina backlinks ankare innehåller alla ord från nyckelorden är det bra för SEO.

Om det finns i en enda länk är det mer fördelaktigt. Särskilt om ordföljden är densamma.

If your backlinks anchors contain all words from the keywords - it's good for SEO

27. Förhållandet mellan "bra" och "dåliga" backlinks är en rankingfaktor.

![Förhållandet mellan "bra" och "dåliga" backlinks är en rankingfaktor](https://www.ranktracker.com/media/yandex-leaked-code-containing-search-ranking-factors-ranktracker-explains-all-ranking-factors/images/i84.png "Förhållandet mellan "bra" och "dåliga" backlinks är en rankingfaktor")

28. Kvalitetsrankningen av texter på domänen är en rankingfaktor.

Sidor med innehåll av låg kvalitet påverkar hela domänen.

The quality rank of texts on the domain is a ranking factor

29. Mängden annonser på en sida är en rankingfaktor

Amount of advertisements on a page is a ranking factor

30. Det finns slumpmässighet som en separat rangordningsfaktor.

Om du inte förstår varför vissa sidor ligger överst - det kan vara slumpmässigt (för att testa beteendefaktorer).

There is a random as a separate ranking factor

31. JS från Google Analytics är en rankingfaktor

Förutsägbart. Bra webbplatser använder GA/Google Analytics oftare än dåliga webbplatser.

JS from Google Analytics is a ranking factor

32. Backlinks från de 100 bästa webbplatserna enligt PageRank påverkar rankningen

Backlinks from the top 100 best websites by PageRank impacts on rankings

33. URL har inga siffror

/100-bästa-kreditkort

/best-credit-cards

URL has no digits

34. Antal snedstreck i URL-adressen

/finance/articles/2023/investment-advices

/investeringsrådgivning

Number of slashes in URL

35. Antal bokstäver som inte är bokstäver i URL

/pet-toys&all$currency=dollar#mobile

/pet-toys

Number of non-letters in URL

36. Symbolen '?' i webbadressen är en rankingfaktor.

/filmer?genre=action

/action-movies

'?' symbol in the URL is a ranking factor

37. Sökfråga = URL, inklusive punkter och mellanslag (??)

Sökfrågan är "Franklin D. Roosevelt":

/roosevelt

/Franklin_D._Roosevelt

Search query = URL, including dots and spaces (??)

38. Gammalt datum i webbadressen

/2009/12/01/hur man knyter en slips

/how-to-tie-a-tie

Old date in the URL

39. Nyckelord finns i URL, inte i sidans text.

/videospel & sidan handlar om musik

/videospel & sidan handlar om videospel

Keywords is in URL, not in the text of the page

40. URL-täckning med trigrams från sökfrågan

/hotels-nya-zealand

/nz

/billiga-hotell-i-nya-zealand-bästa erbjudanden

URL coverage with trigrams from the search query

  • Inkludera 1-3 viktiga ord i webbadressen;
  • Mindre snedstreck/siffror/icke-bokstäver, om det inte ingår i ditt nyckelord.

41. De ursprungliga vikterna för Yandex rankingfaktorer.

De slutliga vikterna beräknas av AI(matrixnet), men de ursprungliga värdena är också användbara.

initial weights of Yandex ranking factors

Slutsats

Det är allt vi delar med oss av för tillfället. Vi har bara börjat. Detta ger dig en grov översikt över vad som finns där.

Vi har bara skrapat på ytan här och det finns många fler värdefulla insikter att ta del av.

Men vi hade rätt i många antaganden och tolkningar utifrån om hur en så omfattande sökmotor skulle fungera, åtminstone när det gäller länkar.

På det hela taget ger Yandex kodläcka en fascinerande inblick i hur en modern sökmotor fungerar.

Möt Ranktracker

Allt-i-ett-plattformen för effektiv SEO

Bakom varje framgångsrikt företag finns en stark SEO-kampanj. Men med otaliga optimeringsverktyg och tekniker att välja mellan kan det vara svårt att veta var man ska börja. Nåväl, frukta inte längre, för jag har precis det som kan hjälpa dig. Jag presenterar Ranktracker, en allt-i-ett-plattform för effektiv SEO.

Vi har äntligen öppnat registreringen av Ranktracker helt gratis!

Skapa ett kostnadsfritt konto

Eller logga in med dina autentiseringsuppgifter

Även om inte alla resultat kan tillämpas direkt på Google, bekräftas många av de antaganden som gjorts under de senaste åren om hur stora sökmotorer på Internet fungerar i allmänhet.

Jag antar att SEO-branschen har några intressanta månader framför sig med nya insikter från denna läcka.

Håll ett öga på den här sidan eftersom vi kommer att fortsätta att lägga till rankingfaktorer under de kommande veckorna och månaderna.

Särskilda krediter till https://twitter.com/alex_buraks

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Börja använda Ranktracker... gratis!

Ta reda på vad som hindrar din webbplats från att rankas.

Skapa ett kostnadsfritt konto

Eller logga in med dina autentiseringsuppgifter

Different views of Ranktracker app