Intro
Du har sikkert hørt om Yandex, som er den 4. største søgemaskine på verdensplan målt på markedsandel. I går blev Yandex' kildekode lækket.
Den mest interessante del for SEO-fællesskabet er: listen over alle 1922 rankingfaktorer, der anvendes i søgealgoritmen
Vi har downloadet koden, analyseret den og præsenterer den her på en nyttig måde.
Hændelsen bør ikke komme som en overraskelse, da Yandex eller dets produkter ofte udsættes for cyberangreb. I 2016 rapporterede Hackread.com eksklusivt om, hvordan en sælger på det mørke net solgte 6,3 millioner Yandex-brugerkontodata.
I september 2021 blev den russiske søgemaskinegigant ramt af et af de største DDoS-angreb, der blev drevet af 200.000 kompromitterede IoT-enheder.
Alt-i-en-platformen til effektiv SEO
Bag enhver succesfuld virksomhed ligger en stærk SEO-kampagne. Men med utallige optimeringsværktøjer og -teknikker at vælge imellem kan det være svært at vide, hvor man skal starte. Nå, frygt ikke mere, for jeg har lige det, der kan hjælpe dig. Jeg præsenterer Ranktracker alt-i-en platformen til effektiv SEO
Vi har endelig åbnet for gratis registrering til Ranktracker!
Opret en gratis kontoEller logge ind med dine legitimationsoplysninger
Hvorfor er det så stort?
Yandex er en af de største it-virksomheder i Rusland. I landet tilbyder det en bredere vifte af tjenester end Google. Forestil dig en virksomhed, der erstatter Google, Uber, Amazon, Netflix og Spotify.
Er denne lækage reel?
Jeg har aldrig personligt arbejdet hos Yandex, men jeg kender flere personer, der har arbejdet der på forskellige tidspunkter eller stadig arbejder der. Jeg har bekræftet, at i hvert fald nogle af arkiverne helt sikkert indeholder moderne kildekode til virksomhedens tjenester samt dokumentation, der peger på rigtige intranet-URL'er.
Hvad er der indeni
Lækkeren har delt et magnetlink, der indeholder 44,7 GB filer knyttet til Yandex git-kilder. Filerne blev angiveligt stjålet fra Yandex i juli 2022. Ud over at indeholde retningslinjer mod spam menes kodeoplagene at indeholde Yandex' kildekode.
Lækket afslørede omkring 1.922 rankingfaktorer, som søgemaskinen bruger i sin søgealgoritme. Koden blev lækket som en torrent. Ifølge analysen, der er offentliggjort af Twitter-brugeren Alex Buraks, omfatter de lækkede data adskillige rankingfaktorer, herunder tekstrelevans, PageRank, indholdets alder, friskhed osv.
Du har sikkert hørt om Yandex, som er den 4. største søgemaskine på verdensplan målt på markedsandel. I går blev Yandex' kildekode lækket.
- Alex Buraks (@alex_buraks) January 27, 2023
Den mest interessante del for SEO-fællesskabet er: listen over alle 1922 rankingfaktorer, der anvendes i søgealgoritmen
[🧵THREAD] pic.twitter.com/6x82AAmbON
Desuden findes der adskillige faktorer vedrørende slutbrugerens adfærd, linkrelaterede faktorer og værtspålidelighed. SEO'er finder nogle usædvanlige rankingfaktorer som f.eks. antallet af unikke besøgende, den gennemsnitlige domænerangering på tværs af forespørgsler og procentdelen af organisk trafik.
Det ser ud til, at i det mindste kildekoden til alle Yandex' store tjenester er blevet lækket:
- Søgemaskine og indekseringsbot
- Kort - som Google Maps og Street View
- Alice - AI-assistent som Siri / Alexa
- Taxi - Uber-lignende taxitjeneste
- Direkte - Annonceringstjeneste som Google Ads / Adwords
- Mail - Mailtjeneste som GMail
- Disk - Fillagringstjeneste som Google Drev
- Marked - Markedsplads som Amazon
- Rejser - som Booking.com plus fly-, tog- og busbilletter
- Yandex360 - Ligesom Google Workspaces for tjenester på dit eget domæne
- Cloud - Det er sandsynligvis ikke al infrastrukturkode, der blev lækket.
- Pay - Betalingsbehandling som Stripe, men med et begrænset antal funktioner
- Metrika - Ligesom Google Analytics
- Og i det mindste backend-delen af de fleste andre virksomhedstjenester er der. Det største arkiv kaldet "frontend" er endnu ikke blevet udforsket.
Shestakov bemærkede desuden nogle API-nøgler, som sandsynligvis er blevet brugt til at teste implementeringen.
Nærmere oplysninger om denne lækage: kan findes her:
https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/
Yandex benægter forsøg på hacking
Yandex hævder, at selskabet er bekendt med lækagen og har allerede indledt en undersøgelse for at undersøge, hvordan "fragmenter" af kildekoden blev offentliggjort. Det er værd at bemærke, at lækagen ikke omfatter brugernes eller medarbejdernes personlige data.
I betragtning af Yandex' betydning for Ruslands it-infrastruktur og lækkede data kan det dog antages, at angrebet var motiveret af landets invasion af Ukraine. Så pro-ukrainske hackere kunne være involveret.
Alt-i-en-platformen til effektiv SEO
Bag enhver succesfuld virksomhed ligger en stærk SEO-kampagne. Men med utallige optimeringsværktøjer og -teknikker at vælge imellem kan det være svært at vide, hvor man skal starte. Nå, frygt ikke mere, for jeg har lige det, der kan hjælpe dig. Jeg præsenterer Ranktracker alt-i-en platformen til effektiv SEO
Vi har endelig åbnet for gratis registrering til Ranktracker!
Opret en gratis kontoEller logge ind med dine legitimationsoplysninger
I sin officielle erklæring præciserede Yandex, at virksomheden ikke blev hacket, og at en tidligere medarbejder kunne være involveret i at lække virksomhedens kildekode til det offentlige område. Ruslands førende it-virksomhed bemærkede, at det lækkede arkiv indeholder kodefragmenter, der er en del af et internt arkiv, hvis data er forskellige fra dem, der anvendes i den seneste version af arkivet.
"Yandex blev ikke hacket. Vores sikkerhedstjeneste fandt kodefragmenter fra et internt arkiv i det offentlige domæne, men indholdet adskiller sig fra den aktuelle version af det arkiv, der anvendes i Yandex-tjenester," hedder det i virksomhedens erklæring.
Ikke desto mindre er kildekodelækager farlige, fordi de udgør alvorlige sikkerhedsproblemer for organisationer, da trusselsaktører kan få adgang til virksomhedens intellektuelle ejendom og systemdata. Lækage af kildekoder vil hjælpe angribere med at skabe målrettede sikkerhedsudnyttelser.
Hvad er forskellen mellem algoritmer, der anvendes i Google og Yandex?
De er ret ens:
- der findes en analog til RankBrain- MatrixNet
- de bruger PageRank (næsten det samme som i Google);
- mange tekstalgoritmer er de samme.
- Der er mange tidligere Google-folk i Yandex
- Yanex blev bygget som en Google-klon;
- SEO-specialister i Rusland bruger næsten de samme white hat SEO-taktikker til Yandex og Google
Der er naturligvis mange forskelle, men fremgangsmåden og de fleste rankingfaktorer synes at være ens.
I praksis: Sammenligner man Google og Yandex-søgeresultater, er de ~70 % ens.
Ifølge Statcounter er Yandex tæt på Yahoo og Bing med hensyn til markedsandel:
Filen med rankingfaktorer: https://dropbox.com/s/toyehkkfduogbwk/factors_gen.txt?dl=0
Struktur for hver enkelt faktor:
- navn
- link til intern wiki (begrænset)
- AntiSeoUpperBound (haha)
- beskrivelse (den er på russisk, jeg har oversat den for dig)
- osv.
1. Første faktor på listen - PageRank.
De vigtigste indsigter efter at have analyseret denne liste: Alder af links er en rankingfaktor.
2. Trafik og % af organisk trafik er rankingfaktorer.
Køb af PPC påvirker placeringen.
3. Tal i URL'er er dårligt for placeringerne
4. For mange skråstreger i URL'er er dårligt for placeringen
5. Hård pessimisering lig med PR=0
6. Værtens pålidelighed er en rangordningsfaktor
Jo færre 40x/50x-fejl du har, jo bedre for din organiske trafik
7. Der er en separat rankingfaktor for opløftende Wikipedia
8. En masse rankingfaktorer, der er forbundet med brugeradfærd - CTR, sidste klik, tid på webstedet, afvisningsprocent
Bemærk: Vi er næsten sikre på, at disse faktorer har langt større betydning for Yandex end for Google.
9. Dokumentets alder og sidste opdatering er begge rankingfaktorer
10. Gennemsnitlig domæneposition på tværs af alle forespørgsler er en rankingfaktor
11. Crawldybde er en rankingfaktor
Hold dine vigtige sider tættere på hovedsiden:
- øverste sider: 1 klik fra hovedsiden
- vigtige sider: <3 klik
12. Derudover: rankingfaktor for forældreløse sider
Du kan finde dette via vores værktøj til revision af webstedet
13. Backlinks fra hovedsider er vigtigere end fra interne sider
14. Antallet af søgeforespørgsler på dit websted/din URL er en rankingfaktor
Jo flere, jo bedre
15. Trafik fra Wikipedia er en rankingfaktor
16. Hvis din url ville være den sidste for søgesessionen (brugeren vil finde det, han har brug for) - ville det påvirke placeringer
Der er strenge faktorer for dette, men også forudsigelige faktorer.
17. Bogmærker ranking faktor
Jo flere brugere tilføjer en url til bogmærker, jo større faktorværdi har den
18. Særlige rankingfaktorer for korte videoer (tiktok, shorts, reels)
19. Maps js-api på siden (f.eks. Google Maps) er en rankingfaktor
I Google (f.eks. inden for rejseniche) fungerer det også at tilføje kort med nyttige oplysninger/funktioner.
20. Nøgleord i URL er rankingfaktorer
Som vi kan se af beskrivelsen - det optimale ville omfatte op til 3 ord fra søgeforespørgslen.
21. Tilbagevendende brugere er en rankingfaktor
Hvis du skaber produkter med god fastholdelse, vil det gavne din SEO (der er mange rankingfaktorer til at måle det).
22. Procentdelen af STORE bogstaver i <title> er en rankingfaktor
23. Procentdel af direkte trafik er en rankingfaktor
Aka. Hvis al din trafik kommer fra organisk søgning - er det mistænkeligt + dårligt for placeringerne.
24. Endnu en rankingfaktor for indholdskvalitet - ødelagt indlejret video på siden
- Indlejrer videoer - godt for placeringerne.
- Defekte indlejrede videoer - dårligt.
25. Verificerede konti på sociale netværk rangerer anderledes end andre urls
Vigtigt for søgninger efter dit brand - ideelt set bør der kun være dine domæner + verificerede sociale netværk i top 10, når du søger efter dit brand
26. Hvis dine backlinks ankre indeholder alle ord fra nøgleordene - er det godt for SEO
Hvis det er i ét link - er det mere fordelagtigt. Især hvis rækkefølgen af ordene er den samme.
27. Forholdet "gode" vs "dårlige" backlinks er en rankingfaktor
![Forholdet mellem "gode" og "dårlige" backlinks er en rankingfaktor](https://www.ranktracker.com/media/yandex-leaked-code-containing-search-ranking-factors-ranktracker-explains-all-ranking-factors/images/i84.png "Forholdet mellem "gode" og "dårlige" backlinks er en rankingfaktor")
28. Kvalitetsrang af tekster på domænet er en rankingfaktor
Sider med indhold af lav kvalitet påvirker hele domænet.
29. Mængden af reklamer på en side er en rankingfaktor
30. Der er tilfældighed som en særskilt rankingfaktor
Når du ikke forstår, hvorfor nogle af siderne ligger øverst - det kan være tilfældigt (for at teste adfærdsfaktorer).
31. JS fra Google Analytics er en rankingfaktor
Forudsigeligt nok. Gode websteder bruger GA / Google Analytics oftere end dårlige websteder.
32. Backlinks fra de 100 bedste websteder efter PageRank har indflydelse på placeringerne
33. URL har ingen cifre
❌ /100-bedste-kreditkort
✅ /best-credit-cards
34. Antal skråstreger i URL-adressen
❌ /finance/articles/2023/investment-advices
✅ /investment-advices
35. Antal ikke-bogstaver i URL
❌ /pet-toys&all$currency=dollar#mobile
✅ /pet-toys
36. '?'-symbolet i URL'en er en rankingfaktor
❌ /movies?genre=action
✅ /action-movies
37. Søgeforespørgsel = URL, inklusive punkter og mellemrum (??)
Søgeforespørgsel er "Franklin D. Roosevelt":
❌ /roosevelt
✅ /Franklin_D._Roosevelt
38. Gammel dato i URL-adressen
❌ /2009/12/01/hvordan man binder et slips
✅ /how-to-tie-a-tie
39. Nøgleord er i URL, ikke i sidens tekst
❌ /videospil & siden handler om musik
✅ /videospil & siden handler om videospil
40. URL-dækning med trigrammer fra søgeforespørgslen
✅ /hotels-new-zealand
❌ /nz
❌ /billige-hoteller-i-nye-zealand-bedste-tilbud
- Medtag 1-3 af de vigtigste ord i URL'en;
- Færre skråstreger/tal/ikke-bogstaver, hvis det ikke er en del af dit søgeord
41. oprindelige vægte af Yandex-ranglistefaktorer
De endelige vægte er beregnet af AI(matrixnet), men de oprindelige værdier er også nyttige.
Konklusion
Det er alt, hvad vi deler for nu. Vi er kun lige begyndt. Dette giver dig et groft overblik over, hvad der er derinde.
Vi har kun skrabet på overfladen her, og der er mange flere værdifulde indsigter i vente.
Men vi havde ret i mange antagelser og fortolkninger udefra om, hvordan en så omfattende søgemaskine ville fungere, i hvert fald hvad angår links.
Alt i alt giver Yandex' kodelækage et fascinerende indblik i det indre arbejde i en moderne søgemaskine.
Alt-i-en-platformen til effektiv SEO
Bag enhver succesfuld virksomhed ligger en stærk SEO-kampagne. Men med utallige optimeringsværktøjer og -teknikker at vælge imellem kan det være svært at vide, hvor man skal starte. Nå, frygt ikke mere, for jeg har lige det, der kan hjælpe dig. Jeg præsenterer Ranktracker alt-i-en platformen til effektiv SEO
Vi har endelig åbnet for gratis registrering til Ranktracker!
Opret en gratis kontoEller logge ind med dine legitimationsoplysninger
Selv om ikke alle resultaterne kan anvendes direkte på Google, bekræftes mange af de antagelser, der er fremsat i de seneste år om, hvordan store søgemaskiner på internettet generelt fungerer.
Jeg går ud fra, at SEO-branchen stadig har et par interessante måneder foran sig med ny indsigt fra denne lækage.
Hold øje med denne side, da vi vil fortsætte med at tilføje rankingfaktorer i de kommende uger og måneder.
Særlige kreditter til https://twitter.com/alex_buraks