• Teknologi

Yandex har lækket kode med 1.922 faktorer til rangering af søgninger Ranktracker forklarer alle rangeringsfaktorer

  • Felix Rose-Collins
  • 7 min read
Yandex har lækket kode med 1.922 faktorer til rangering af søgninger Ranktracker forklarer alle rangeringsfaktorer

Intro

Du har sikkert hørt om Yandex, som er den 4. største søgemaskine på verdensplan målt på markedsandel. I går blev Yandex' kildekode lækket.

Den mest interessante del for SEO-fællesskabet er: listen over alle 1922 rankingfaktorer, der anvendes i søgealgoritmen

Vi har downloadet koden, analyseret den og præsenterer den her på en nyttig måde.

Yandex leak

Hændelsen bør ikke komme som en overraskelse, da Yandex eller dets produkter ofte udsættes for cyberangreb. I 2016 rapporterede Hackread.com eksklusivt om, hvordan en sælger på det mørke net solgte 6,3 millioner Yandex-brugerkontodata.

I september 2021 blev den russiske søgemaskinegigant ramt af et af de største DDoS-angreb, der blev drevet af 200.000 kompromitterede IoT-enheder.

Mød Ranktracker

Alt-i-en-platformen til effektiv SEO

Bag enhver succesfuld virksomhed ligger en stærk SEO-kampagne. Men med utallige optimeringsværktøjer og -teknikker at vælge imellem kan det være svært at vide, hvor man skal starte. Nå, frygt ikke mere, for jeg har lige det, der kan hjælpe dig. Jeg præsenterer Ranktracker alt-i-en platformen til effektiv SEO

Vi har endelig åbnet for gratis registrering til Ranktracker!

Opret en gratis konto

Eller logge ind med dine legitimationsoplysninger

Yandex git sources

Hvorfor er det så stort?

Yandex er en af de største it-virksomheder i Rusland. I landet tilbyder det en bredere vifte af tjenester end Google. Forestil dig en virksomhed, der erstatter Google, Uber, Amazon, Netflix og Spotify.

Er denne lækage reel?

Jeg har aldrig personligt arbejdet hos Yandex, men jeg kender flere personer, der har arbejdet der på forskellige tidspunkter eller stadig arbejder der. Jeg har bekræftet, at i hvert fald nogle af arkiverne helt sikkert indeholder moderne kildekode til virksomhedens tjenester samt dokumentation, der peger på rigtige intranet-URL'er.

Hvad er der indeni

Lækkeren har delt et magnetlink, der indeholder 44,7 GB filer knyttet til Yandex git-kilder. Filerne blev angiveligt stjålet fra Yandex i juli 2022. Ud over at indeholde retningslinjer mod spam menes kodeoplagene at indeholde Yandex' kildekode.

Lækket afslørede omkring 1.922 rankingfaktorer, som søgemaskinen bruger i sin søgealgoritme. Koden blev lækket som en torrent. Ifølge analysen, der er offentliggjort af Twitter-brugeren Alex Buraks, omfatter de lækkede data adskillige rankingfaktorer, herunder tekstrelevans, PageRank, indholdets alder, friskhed osv.

Desuden findes der adskillige faktorer vedrørende slutbrugerens adfærd, linkrelaterede faktorer og værtspålidelighed. SEO'er finder nogle usædvanlige rankingfaktorer som f.eks. antallet af unikke besøgende, den gennemsnitlige domænerangering på tværs af forespørgsler og procentdelen af organisk trafik.

Det ser ud til, at i det mindste kildekoden til alle Yandex' store tjenester er blevet lækket:

  • Søgemaskine og indekseringsbot
  • Kort - som Google Maps og Street View
  • Alice - AI-assistent som Siri / Alexa
  • Taxi - Uber-lignende taxitjeneste
  • Direkte - Annonceringstjeneste som Google Ads / Adwords
  • Mail - Mailtjeneste som GMail
  • Disk - Fillagringstjeneste som Google Drev
  • Marked - Markedsplads som Amazon
  • Rejser - som Booking.com plus fly-, tog- og busbilletter
  • Yandex360 - Ligesom Google Workspaces for tjenester på dit eget domæne
  • Cloud - Det er sandsynligvis ikke al infrastrukturkode, der blev lækket.
  • Pay - Betalingsbehandling som Stripe, men med et begrænset antal funktioner
  • Metrika - Ligesom Google Analytics
  • Og i det mindste backend-delen af de fleste andre virksomhedstjenester er der. Det største arkiv kaldet "frontend" er endnu ikke blevet udforsket.

Shestakov bemærkede desuden nogle API-nøgler, som sandsynligvis er blevet brugt til at teste implementeringen.

Nærmere oplysninger om denne lækage: kan findes her:

https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/

Yandex benægter forsøg på hacking

Yandex hævder, at selskabet er bekendt med lækagen og har allerede indledt en undersøgelse for at undersøge, hvordan "fragmenter" af kildekoden blev offentliggjort. Det er værd at bemærke, at lækagen ikke omfatter brugernes eller medarbejdernes personlige data.

I betragtning af Yandex' betydning for Ruslands it-infrastruktur og lækkede data kan det dog antages, at angrebet var motiveret af landets invasion af Ukraine. Så pro-ukrainske hackere kunne være involveret.

Mød Ranktracker

Alt-i-en-platformen til effektiv SEO

Bag enhver succesfuld virksomhed ligger en stærk SEO-kampagne. Men med utallige optimeringsværktøjer og -teknikker at vælge imellem kan det være svært at vide, hvor man skal starte. Nå, frygt ikke mere, for jeg har lige det, der kan hjælpe dig. Jeg præsenterer Ranktracker alt-i-en platformen til effektiv SEO

Vi har endelig åbnet for gratis registrering til Ranktracker!

Opret en gratis konto

Eller logge ind med dine legitimationsoplysninger

I sin officielle erklæring præciserede Yandex, at virksomheden ikke blev hacket, og at en tidligere medarbejder kunne være involveret i at lække virksomhedens kildekode til det offentlige område. Ruslands førende it-virksomhed bemærkede, at det lækkede arkiv indeholder kodefragmenter, der er en del af et internt arkiv, hvis data er forskellige fra dem, der anvendes i den seneste version af arkivet.

"Yandex blev ikke hacket. Vores sikkerhedstjeneste fandt kodefragmenter fra et internt arkiv i det offentlige domæne, men indholdet adskiller sig fra den aktuelle version af det arkiv, der anvendes i Yandex-tjenester," hedder det i virksomhedens erklæring.

Ikke desto mindre er kildekodelækager farlige, fordi de udgør alvorlige sikkerhedsproblemer for organisationer, da trusselsaktører kan få adgang til virksomhedens intellektuelle ejendom og systemdata. Lækage af kildekoder vil hjælpe angribere med at skabe målrettede sikkerhedsudnyttelser.

Hvad er forskellen mellem algoritmer, der anvendes i Google og Yandex?

De er ret ens:

  • der findes en analog til RankBrain- MatrixNet
  • de bruger PageRank (næsten det samme som i Google);
  • mange tekstalgoritmer er de samme.

Yandex vs Google

  • Der er mange tidligere Google-folk i Yandex
  • Yanex blev bygget som en Google-klon;
  • SEO-specialister i Rusland bruger næsten de samme white hat SEO-taktikker til Yandex og Google

Der er naturligvis mange forskelle, men fremgangsmåden og de fleste rankingfaktorer synes at være ens.

I praksis: Sammenligner man Google og Yandex-søgeresultater, er de ~70 % ens.

Ifølge Statcounter er Yandex tæt på Yahoo og Bing med hensyn til markedsandel:

search engine market share worldwide

Filen med rankingfaktorer: https://dropbox.com/s/toyehkkfduogbwk/factors_gen.txt?dl=0

Struktur for hver enkelt faktor:

  1. navn
  2. link til intern wiki (begrænset)
  3. AntiSeoUpperBound (haha)
  4. beskrivelse (den er på russisk, jeg har oversat den for dig)
  5. osv.

1. Første faktor på listen - PageRank.

First factor in the list - PageRank

De vigtigste indsigter efter at have analyseret denne liste: Alder af links er en rankingfaktor.

Age of links is a ranking factor.

2. Trafik og % af organisk trafik er rankingfaktorer.

Køb af PPC påvirker placeringen.

Traffic and % of organic traffic are ranking factors

3. Tal i URL'er er dårligt for placeringerne

Numbers in URLs is bad for rankings

4. For mange skråstreger i URL'er er dårligt for placeringen

Too many slashes in URLs is bad for ranking

5. Hård pessimisering lig med PR=0

Hard pessimization equal PR=0

6. Værtens pålidelighed er en rangordningsfaktor

Jo færre 40x/50x-fejl du har, jo bedre for din organiske trafik

Host reliability is a ranking factor

7. Der er en separat rankingfaktor for opløftende Wikipedia

there is a separate ranking factor for uplifting Wikipedia

8. En masse rankingfaktorer, der er forbundet med brugeradfærd - CTR, sidste klik, tid på webstedet, afvisningsprocent

Bemærk: Vi er næsten sikre på, at disse faktorer har langt større betydning for Yandex end for Google.

A lot of ranking factors connected with user behaviour - CTR, last-click, time on site, bounce rate

9. Dokumentets alder og sidste opdatering er begge rankingfaktorer

Document age and last update both are ranking factors

10. Gennemsnitlig domæneposition på tværs af alle forespørgsler er en rankingfaktor

Average domain position across all queries is a ranking factor

11. Crawldybde er en rankingfaktor

Hold dine vigtige sider tættere på hovedsiden:

  • øverste sider: 1 klik fra hovedsiden
  • vigtige sider: <3 klik

Crawl depth is a ranking factor

12. Derudover: rankingfaktor for forældreløse sider

Du kan finde dette via vores værktøj til revision af webstedet

Additionally: ranking factor for orphan pages

13. Backlinks fra hovedsider er vigtigere end fra interne sider

Backlinks from main pages are more important than from internal pages

14. Antallet af søgeforespørgsler på dit websted/din URL er en rankingfaktor

Jo flere, jo bedre

Number of search queries of your site/url is a ranking factor

15. Trafik fra Wikipedia er en rankingfaktor

Traffic from Wikipedia is a ranking factor

16. Hvis din url ville være den sidste for søgesessionen (brugeren vil finde det, han har brug for) - ville det påvirke placeringer

Der er strenge faktorer for dette, men også forudsigelige faktorer.

If your url would be the last for search session (user will find what he needs) - it would impact rankings

17. Bogmærker ranking faktor

Jo flere brugere tilføjer en url til bogmærker, jo større faktorværdi har den

Bookmarks ranking factor

18. Særlige rankingfaktorer for korte videoer (tiktok, shorts, reels)

Special ranking factors for short videos (tiktok, shorts, reels)

19. Maps js-api på siden (f.eks. Google Maps) er en rankingfaktor

I Google (f.eks. inden for rejseniche) fungerer det også at tilføje kort med nyttige oplysninger/funktioner.

Maps js-api on page (for example Google Maps) is a ranking factor

20. Nøgleord i URL er rankingfaktorer

Som vi kan se af beskrivelsen - det optimale ville omfatte op til 3 ord fra søgeforespørgslen.

Keywords in URL are ranking factors

21. Tilbagevendende brugere er en rankingfaktor

Hvis du skaber produkter med god fastholdelse, vil det gavne din SEO (der er mange rankingfaktorer til at måle det).

Returning users is a ranking factor

22. Procentdelen af STORE bogstaver i <title> er en rankingfaktor

Percentage of CAPITAL LETTERS in title> is a ranking factor

23. Procentdel af direkte trafik er en rankingfaktor

Aka. Hvis al din trafik kommer fra organisk søgning - er det mistænkeligt + dårligt for placeringerne.

Percentage of direct traffic is a ranking factor

24. Endnu en rankingfaktor for indholdskvalitet - ødelagt indlejret video på siden

  • Indlejrer videoer - godt for placeringerne.
  • Defekte indlejrede videoer - dårligt.

One more ranking factor for content quality - broken embedded video on the page

25. Verificerede konti på sociale netværk rangerer anderledes end andre urls

Vigtigt for søgninger efter dit brand - ideelt set bør der kun være dine domæner + verificerede sociale netværk i top 10, når du søger efter dit brand

Verified accounts on social networks ranks differently as other urls

26. Hvis dine backlinks ankre indeholder alle ord fra nøgleordene - er det godt for SEO

Hvis det er i ét link - er det mere fordelagtigt. Især hvis rækkefølgen af ordene er den samme.

If your backlinks anchors contain all words from the keywords - it's good for SEO

27. Forholdet "gode" vs "dårlige" backlinks er en rankingfaktor

![Forholdet mellem "gode" og "dårlige" backlinks er en rankingfaktor](https://www.ranktracker.com/media/yandex-leaked-code-containing-search-ranking-factors-ranktracker-explains-all-ranking-factors/images/i84.png "Forholdet mellem "gode" og "dårlige" backlinks er en rankingfaktor")

28. Kvalitetsrang af tekster på domænet er en rankingfaktor

Sider med indhold af lav kvalitet påvirker hele domænet.

The quality rank of texts on the domain is a ranking factor

29. Mængden af reklamer på en side er en rankingfaktor

Amount of advertisements on a page is a ranking factor

30. Der er tilfældighed som en særskilt rankingfaktor

Når du ikke forstår, hvorfor nogle af siderne ligger øverst - det kan være tilfældigt (for at teste adfærdsfaktorer).

There is a random as a separate ranking factor

31. JS fra Google Analytics er en rankingfaktor

Forudsigeligt nok. Gode websteder bruger GA / Google Analytics oftere end dårlige websteder.

JS from Google Analytics is a ranking factor

32. Backlinks fra de 100 bedste websteder efter PageRank har indflydelse på placeringerne

Backlinks from the top 100 best websites by PageRank impacts on rankings

33. URL har ingen cifre

/100-bedste-kreditkort

/best-credit-cards

URL has no digits

34. Antal skråstreger i URL-adressen

/finance/articles/2023/investment-advices

/investment-advices

Number of slashes in URL

35. Antal ikke-bogstaver i URL

/pet-toys&all$currency=dollar#mobile

/pet-toys

Number of non-letters in URL

36. '?'-symbolet i URL'en er en rankingfaktor

/movies?genre=action

/action-movies

'?' symbol in the URL is a ranking factor

37. Søgeforespørgsel = URL, inklusive punkter og mellemrum (??)

Søgeforespørgsel er "Franklin D. Roosevelt":

/roosevelt

/Franklin_D._Roosevelt

Search query = URL, including dots and spaces (??)

38. Gammel dato i URL-adressen

/2009/12/01/hvordan man binder et slips

/how-to-tie-a-tie

Old date in the URL

39. Nøgleord er i URL, ikke i sidens tekst

/videospil & siden handler om musik

/videospil & siden handler om videospil

Keywords is in URL, not in the text of the page

40. URL-dækning med trigrammer fra søgeforespørgslen

/hotels-new-zealand

/nz

/billige-hoteller-i-nye-zealand-bedste-tilbud

URL coverage with trigrams from the search query

  • Medtag 1-3 af de vigtigste ord i URL'en;
  • Færre skråstreger/tal/ikke-bogstaver, hvis det ikke er en del af dit søgeord

41. oprindelige vægte af Yandex-ranglistefaktorer

De endelige vægte er beregnet af AI(matrixnet), men de oprindelige værdier er også nyttige.

initial weights of Yandex ranking factors

Konklusion

Det er alt, hvad vi deler for nu. Vi er kun lige begyndt. Dette giver dig et groft overblik over, hvad der er derinde.

Vi har kun skrabet på overfladen her, og der er mange flere værdifulde indsigter i vente.

Men vi havde ret i mange antagelser og fortolkninger udefra om, hvordan en så omfattende søgemaskine ville fungere, i hvert fald hvad angår links.

Alt i alt giver Yandex' kodelækage et fascinerende indblik i det indre arbejde i en moderne søgemaskine.

Mød Ranktracker

Alt-i-en-platformen til effektiv SEO

Bag enhver succesfuld virksomhed ligger en stærk SEO-kampagne. Men med utallige optimeringsværktøjer og -teknikker at vælge imellem kan det være svært at vide, hvor man skal starte. Nå, frygt ikke mere, for jeg har lige det, der kan hjælpe dig. Jeg præsenterer Ranktracker alt-i-en platformen til effektiv SEO

Vi har endelig åbnet for gratis registrering til Ranktracker!

Opret en gratis konto

Eller logge ind med dine legitimationsoplysninger

Selv om ikke alle resultaterne kan anvendes direkte på Google, bekræftes mange af de antagelser, der er fremsat i de seneste år om, hvordan store søgemaskiner på internettet generelt fungerer.

Jeg går ud fra, at SEO-branchen stadig har et par interessante måneder foran sig med ny indsigt fra denne lækage.

Hold øje med denne side, da vi vil fortsætte med at tilføje rankingfaktorer i de kommende uger og måneder.

Særlige kreditter til https://twitter.com/alex_buraks

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Begynd at bruge Ranktracker... Gratis!

Find ud af, hvad der forhindrer dit websted i at blive placeret på ranglisten.

Opret en gratis konto

Eller logge ind med dine legitimationsoplysninger

Different views of Ranktracker app