• Teknologi

Yandex lekket kode som inneholder 1,922 søkerangeringsfaktorer Ranktracker forklarer alle rangeringsfaktorer

  • Felix Rose-Collins
  • 7 min read
Yandex lekket kode som inneholder 1,922 søkerangeringsfaktorer Ranktracker forklarer alle rangeringsfaktorer

Introduksjon

Du har sikkert hørt om Yandex, det er den fjerde største søkemotoren etter markedsandel på verdensbasis. I går ble proprietær kildekode til Yandex lekket.

Den mest interessante delen for SEO-fellesskapet er: listen over alle 1922 rangeringsfaktorer som brukes i søkealgoritmen

Vi har lastet ned koden, analysert den og her presenteres den på en nyttig måte.

Yandex leak

Hendelsen bør ikke komme som en overraskelse, siden Yandex eller dets produkter ofte er under cyberangrep. I 2016 rapporterte Hackread.com eksklusivt om hvordan en leverandør på det mørke nettet solgte 6,3 millioner Yandex-brukerkontodata.

I september 2021 ble den russiske søkemotorgiganten rammet av et av de største DDoS-angrepene drevet av 200 000 kompromitterte IoT-enheter.

Møt Ranktracker

Alt-i-ett-plattformen for effektiv søkemotoroptimalisering

Bak enhver vellykket bedrift ligger en sterk SEO-kampanje. Men med utallige optimaliseringsverktøy og teknikker der ute å velge mellom, kan det være vanskelig å vite hvor du skal begynne. Vel, frykt ikke mer, for jeg har akkurat det som kan hjelpe deg. Vi presenterer Ranktracker alt-i-ett-plattformen for effektiv SEO.

Vi har endelig åpnet registreringen til Ranktracker helt gratis!

Opprett en gratis konto

Eller logg inn med påloggingsinformasjonen din

Yandex git sources

Hvorfor er dette stort?

Yandex er et av de største IT-selskapene i Russland. I landet tilbyr det et bredere spekter av tjenester enn Google. Tenk deg ett selskap som erstatter Google, Uber, Amazon, Netflix og Spotify.

Er denne lekkasjen ekte?

Personlig har jeg aldri jobbet i Yandex, men jeg kjenner flere personer som har jobbet der på forskjellige tidspunkter eller fortsatt jobber der. Jeg bekreftet at i det minste noen av arkivene helt sikkert inneholder moderne kildekode for selskapets tjenester samt dokumentasjon som peker til ekte intranett-URL-er.

Hva er inni?

Lekkasjen har delt en magnetlenke som inneholder 44,7 GB med filer knyttet til Yandex git-kilder. Filene skal ha blitt stjålet fra Yandex i juli 2022. Bortsett fra å inneholde anti-spam-retningslinjer, antas kodelagrene å inneholde Yandex' kildekode.

Lekkasjen avslørte rundt 1 922 rangeringsfaktorer som søkemotoren bruker i sin søkealgoritme. Koden ble lekket som en torrent. Ifølge analysen som ble lagt ut av Twitter-brukeren Alex Buraks, inkluderer de lekkede dataene en rekke rangeringsfaktorer, inkludert tekstrelevans, PageRank, innholdets alder, ferskhet osv.

I tillegg finnes det flere sluttbrukeratferdsfaktorer, lenkerelaterte faktorer og vertspålitelighet. SEO-er finner noen uvanlige rangeringsfaktorer, for eksempel antall unike besøkende, gjennomsnittlig domenerangering på tvers av søk og prosent av organisk trafikk.

Det ser ut til at i det minste kildekoden for alle de viktigste tjenestene til Yandex har blitt lekket:

  • Søkemotor og indekseringsrobot
  • Kart - som Google Maps og Street View
  • Alice - AI-assistent som Siri / Alexa
  • Taxi - Uber-lignende drosjetjeneste
  • Direkte - annonsetjeneste som Google Ads / Adwords
  • Mail - E-posttjeneste som GMail
  • Disk - fillagringstjeneste som Google-stasjon
  • Marked - Markedsplass som Amazon
  • Reise - Som en Booking.com pluss fly-, tog- og bussbilletter
  • Yandex360 - Som Google Workspaces for tjenester på ditt eget domene
  • Cloud - Sannsynligvis ble ikke all infrastrukturkode lekket.
  • Betal - Betalingsbehandling som Stripe, men med et begrenset sett med funksjoner.
  • Metrika - Som Google Analytics
  • Og i det minste er backend-delen av de fleste andre selskapstjenester der. Det største arkivet kalt "frontend" er ennå ikke utforsket.

Shestakov bemerket videre noen API-nøkler, som mest sannsynlig har blitt brukt til å teste distribusjon.

Detaljer om denne lekkasjen finner du her:

https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/

Yandex benekter forsøk på hacking

Yandex hevder at de er klar over lekkasjen og allerede har satt i gang en etterforskning for å sjekke hvordan "fragmenter" av kildekoden ble eksponert for offentligheten. Det er verdt å merke seg at lekkasjen ikke omfatter personopplysninger om brukere eller ansatte.

Tatt i betraktning Yandex' betydning i Russlands IT-infrastruktur og lekkede data, kan det imidlertid antas at angrepet var motivert av landets invasjon av Ukraina. Så pro-ukrainske hackere kan være involvert.

Møt Ranktracker

Alt-i-ett-plattformen for effektiv søkemotoroptimalisering

Bak enhver vellykket bedrift ligger en sterk SEO-kampanje. Men med utallige optimaliseringsverktøy og teknikker der ute å velge mellom, kan det være vanskelig å vite hvor du skal begynne. Vel, frykt ikke mer, for jeg har akkurat det som kan hjelpe deg. Vi presenterer Ranktracker alt-i-ett-plattformen for effektiv SEO.

Vi har endelig åpnet registreringen til Ranktracker helt gratis!

Opprett en gratis konto

Eller logg inn med påloggingsinformasjonen din

I sin offisielle uttalelse presiserte Yandex at selskapet ikke ble hacket, og at en tidligere ansatt kunne være involvert i å lekke kildekoden i det offentlige området. Russlands ledende IT-firma bemerket at det lekkede arkivet inneholder kodefragmenter som er en del av et internt arkiv, hvis data er forskjellig fra det som brukes i den nyeste versjonen av arkivet.

"Yandex ble ikke hacket. Vår sikkerhetstjeneste fant kodefragmenter fra et internt depot i det offentlige domenet, men innholdet skiller seg fra den nåværende versjonen av depotet som brukes i Yandex-tjenester", heter det i selskapets uttalelse.

Ikke desto mindre er lekkasjer av kildekode farlige fordi de kan utgjøre alvorlige sikkerhetsproblemer for organisasjoner, siden trusselaktører kan observere virksomhetens immaterielle rettigheter og systemdata. Lekkasje av kildekode vil hjelpe angripere med å lage målrettede sikkerhetsutnyttelser.

Teoretisk sett, hva er forskjellen mellom algoritmer som brukes i Google og i Yandex?

De er ganske like:

Yandex vs Google

  • Det er mange eks-googlere i Yandex
  • Yanex ble bygget som en Google-klone;
  • SEO-spesialister i Russland bruker nesten samme hvite hatt SEO-taktikk for Yandex og for Google

Selvfølgelig er det mange forskjeller, men tilnærmingen og de fleste rangeringsfaktorene ser ut til å være like.

I praksis: Hvis man sammenligner søkeresultatene fra Google og Yandex, er det ca. 70 % samsvar.

Ifølge Statcounter ligger Yandex nær Yahoo og Bing etter markedsandel:

search engine market share worldwide

Filen med rangeringsfaktorer: https://dropbox.com/s/toyehkkfduogbwk/factors_gen.txt?dl=0

Struktur for hver faktor:

  1. navn
  2. lenke til intern wiki (begrenset)
  3. AntiSeoUpperBound (haha)
  4. beskrivelse (det er på russisk, jeg oversatte det for deg)
  5. osv.

1. Første faktor i listen - PageRank.

First factor in the list - PageRank

De viktigste innsiktene etter å ha analysert denne listen: Koblingenes alder er en rangeringsfaktor.

Age of links is a ranking factor.

2. Trafikk og % av organisk trafikk er rangeringsfaktorer.

Kjøp av PPC påvirker rangeringen.

Traffic and % of organic traffic are ranking factors

3. Tall i nettadresser er dårlig for rangeringen

Numbers in URLs is bad for rankings

4. For mange skråstreker i nettadresser er ikke bra for rangeringen.

Too many slashes in URLs is bad for ranking

5. Hard pessimisering lik PR=0

Hard pessimization equal PR=0

6. Vertspålitelighet er en rangeringsfaktor

Jo færre 40x/50x feil du har, jo bedre er det for den organiske trafikken din.

Host reliability is a ranking factor

7. Det er en egen rangeringsfaktor for å løfte Wikipedia.

there is a separate ranking factor for uplifting Wikipedia

8. Mange rangeringsfaktorer knyttet til brukeratferd - CTR, siste klikk, tid på nettstedet, fluktfrekvens.

Merk: Vi er nesten sikre på at i Yandex påvirker disse faktorene mye mer enn i Google.

A lot of ranking factors connected with user behaviour - CTR, last-click, time on site, bounce rate

9. Dokumentets alder og siste oppdatering er begge rangeringsfaktorer.

Document age and last update both are ranking factors

10. Gjennomsnittlig domeneposisjon på tvers av alle søk er en rangeringsfaktor.

Average domain position across all queries is a ranking factor

11. Krypedybde er en rangeringsfaktor

Hold viktige sider nærmere hovedsiden:

  • toppsider: 1 klikk fra hovedsiden
  • viktige sider: <3 klikk

Crawl depth is a ranking factor

12. I tillegg: rangeringsfaktor for foreldreløse sider

Du finner dette via revisjonsverktøyet på nettstedet vårt

Additionally: ranking factor for orphan pages

13. Tilbakekoblinger fra hovedsider er viktigere enn fra interne sider.

Backlinks from main pages are more important than from internal pages

14. Antall søk på nettstedet/url-en din er en rangeringsfaktor.

Jo flere, jo bedre

Number of search queries of your site/url is a ranking factor

15. Trafikk fra Wikipedia er en rangeringsfaktor

Traffic from Wikipedia is a ranking factor

16. Hvis nettadressen din er den siste for søkeøkten (brukeren vil finne det han trenger) - vil det påvirke rangeringen.

Det finnes strenge faktorer for dette og også forutsigbare faktorer.

If your url would be the last for search session (user will find what he needs) - it would impact rankings

17. Bokmerker rangeringsfaktor

Jo flere brukere som legger til en nettadresse i bokmerker, jo større faktorverdi har den.

Bookmarks ranking factor

18. Spesielle rangeringsfaktorer for korte videoer (tiktok, shorts, reels)

Special ranking factors for short videos (tiktok, shorts, reels)

19. Maps js-api på siden (for eksempel Google Maps) er en rangeringsfaktor.

I Google (for eksempel i reisenisjen) fungerer det også å legge til kart med nyttig informasjon/funksjonalitet.

Maps js-api on page (for example Google Maps) is a ranking factor

20. Nøkkelord i URL er rangeringsfaktorer

Som vi kan se fra beskrivelsen - det optimale ville inkludere opptil 3 ord fra søket.

Keywords in URL are ranking factors

21. Tilbakevendende brukere er en rangeringsfaktor

Bygg produkter med god oppbevaring, og det vil være til fordel for SEO (det er mange rangeringsfaktorer for å måle det).

Returning users is a ranking factor

22. Prosentandel av STORE BOKSTAVER i <tittel> er en rangeringsfaktor.

Percentage of CAPITAL LETTERS in title> is a ranking factor

23. Prosentandel av direkte trafikk er en rangeringsfaktor

Aka. Hvis all trafikken din kom fra organisk søk - det er mistenkelig + dårlig for rangeringen.

Percentage of direct traffic is a ranking factor

24. Ytterligere en rangeringsfaktor for innholdskvalitet - ødelagt innebygd video på siden

  • Legg inn videoer - bra for rangeringer.
  • Ødelagte innebygde videoer - dårlig.

One more ranking factor for content quality - broken embedded video on the page

25. Verifiserte kontoer på sosiale nettverk rangeres annerledes enn andre nettadresser.

Viktig for merkevaresøk - ideelt sett bør det bare være dine domener + verifiserte sosiale nettverk blant de 10 beste.

Verified accounts on social networks ranks differently as other urls

26. Hvis tilbakekoblingsankrene dine inneholder alle ordene fra søkeordene - er det bra for SEO

Hvis det er i en lenke - det er mer fordelaktig. Spesielt hvis rekkefølgen på ordene er den samme.

If your backlinks anchors contain all words from the keywords - it's good for SEO

27. Forholdet mellom "gode" og "dårlige" tilbakekoblinger er en rangeringsfaktor

Forholdet mellom "gode" og "dårlige" tilbakekoblinger er en rangeringsfaktor](/images/i84.png "Forholdet mellom "gode" og "dårlige" tilbakekoblinger er en rangeringsfaktor")

28. Kvalitetsrangeringen av tekster på domenet er en rangeringsfaktor.

Sider med innhold av lav kvalitet påvirker hele domenet.

The quality rank of texts on the domain is a ranking factor

29. Mengden annonser på en side er en rangeringsfaktor

Amount of advertisements on a page is a ranking factor

30. Det er tilfeldighet som en egen rangeringsfaktor.

Når du ikke forstår hvorfor noen av sidene ligger øverst - det kan være tilfeldig (for å teste atferdsfaktorer).

There is a random as a separate ranking factor

31. JS fra Google Analytics er en rangeringsfaktor

Forutsigbart. Gode nettsteder bruker GA / Google analytics oftere enn dårlige nettsteder.

JS from Google Analytics is a ranking factor

32. Tilbakekoblinger fra de 100 beste nettstedene etter PageRank påvirker rangeringene

Backlinks from the top 100 best websites by PageRank impacts on rankings

33. URL har ingen sifre

/100-beste-kredittkort

/best-kredittkort

URL has no digits

34. Antall skråstreker i URL

/finance/articles/2023/investment-advices (på engelsk)

/investeringsrådgivning

Number of slashes in URL

35. Antall ikke-bokstaver i URL

/pet-toys&all$currency=dollar#mobile

/pet-toys

Number of non-letters in URL

36. '?'-symbolet i nettadressen er en rangeringsfaktor.

/movies?genre=action

/action-filmer

'?' symbol in the URL is a ranking factor

37. Søkeord = URL, inkludert punkter og mellomrom (??).

Søkeordet er "Franklin D. Roosevelt":

/roosevelt

✅ ✅ /Franklin_D._Roosevelt

Search query = URL, including dots and spaces (??)

38. Gammel dato i nettadressen

/2009/12/01/hvordan-binde-et-slips

/how-to-tie-a-tie

Old date in the URL

39. Nøkkelord er i URL, ikke i teksten på siden.

/videospill og siden handler om musikk

/videospill & siden handler om videospill

Keywords is in URL, not in the text of the page

40. URL-dekning med trigrammer fra søkesøket

/hotels-new-zealand

/nz

/ cheap-hotels-in-new-zealand-best-deals

URL coverage with trigrams from the search query

  • Ta med de 1-3 viktigste ordene i nettadressen;
  • Færre skråstreker/siffer/ikke-bokstaver, hvis det ikke er en del av søkeordet.

41. innledende vekter for Yandex-rangering av faktorer

Sluttvekter beregnet av AI(matrixnet), men startverdier er også nyttige.

initial weights of Yandex ranking factors

Konklusjon

Der har vi det, dette er alt vi deler foreløpig. Vi har så vidt begynt. Dette gir deg en grov oversikt over hva som er der inne.

Vi har bare skrapt i overflaten her, og det ligger mye mer verdifull innsikt foran oss.

Men vi hadde helt rett i mange antagelser og tolkninger fra utsiden av hvordan en så omfattende søkemotor ville fungere, i det minste når det gjelder lenker.

Alt i alt gir Yandex-kodelekkasjen et fascinerende innblikk i hvordan en moderne søkemotor fungerer.

Møt Ranktracker

Alt-i-ett-plattformen for effektiv søkemotoroptimalisering

Bak enhver vellykket bedrift ligger en sterk SEO-kampanje. Men med utallige optimaliseringsverktøy og teknikker der ute å velge mellom, kan det være vanskelig å vite hvor du skal begynne. Vel, frykt ikke mer, for jeg har akkurat det som kan hjelpe deg. Vi presenterer Ranktracker alt-i-ett-plattformen for effektiv SEO.

Vi har endelig åpnet registreringen til Ranktracker helt gratis!

Opprett en gratis konto

Eller logg inn med påloggingsinformasjonen din

Selv om ikke alle funnene kan overføres direkte til Google, bekreftes mange antakelser som er gjort de siste årene om hvordan store søkemotorer på Internett generelt fungerer.

Jeg antar at SEO-bransjen fortsatt har noen interessante måneder foran seg med ny innsikt fra denne lekkasjen.

Følg med på denne siden ettersom vi vil fortsette å legge til rangeringsfaktorer i løpet av de kommende ukene og månedene.

Spesielle kreditter til https://twitter.com/alex_buraks

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Begynn å bruke Ranktracker... Gratis!

Finn ut hva som hindrer nettstedet ditt i å bli rangert.

Opprett en gratis konto

Eller logg inn med påloggingsinformasjonen din

Different views of Ranktracker app