• Technologijos

'Yandex' nutekino kodą, kuriame yra 1922 paieškos reitingavimo veiksniai 'Ranktracker' paaiškina visus reitingavimo veiksnius

  • Felix Rose-Collins
  • 6 min read
'Yandex' nutekino kodą, kuriame yra 1922 paieškos reitingavimo veiksniai 'Ranktracker' paaiškina visus reitingavimo veiksnius

Įvadas

Tikriausiai girdėjote apie "Yandex"- tai ketvirta pagal rinkos dalį paieškos sistema pasaulyje. Vakar buvo nutekintas nuosavas " Yandex" išeities kodas.

SEO bendruomenei įdomiausia dalis: visų 1922 paieškos algoritme naudojamų reitingavimo veiksnių sąrašas.

Atsisiuntėme kodą, jį išanalizavome ir čia jis pateikiamas naudingai.

Yandex leak

Incidentas neturėtų stebinti, nes "Yandex" ar jos produktai dažnai patiria kibernetines atakas. 2016 m. portalas Hackread.com išskirtinai pranešė apie tai, kaip tamsiojo interneto pardavėjas pardavinėjo 6,3 mln. "Yandex" naudotojų paskyrų duomenis.

2021 m. rugsėjį Rusijos paieškos sistemos milžinė patyrė vieną didžiausių DDoS atakų, kurią sukėlė 200 000 užkrėstų daiktų interneto įrenginių.

Susipažinkite su "Ranktracker

Efektyvaus SEO "viskas viename" platforma

Už kiekvieno sėkmingo verslo slypi stipri SEO kampanija. Tačiau turint daugybę optimizavimo priemonių ir metodų, iš kurių galima rinktis, gali būti sunku žinoti, nuo ko pradėti. Na, nebijokite, nes turiu ką padėti. Pristatome "Ranktracker" "viskas viename" platformą, skirtą efektyviam SEO

Pagaliau pradėjome registruotis į "Ranktracker" visiškai nemokamai!

Sukurti nemokamą paskyrą

Arba Prisijunkite naudodami savo įgaliojimus

Yandex git sources

Kodėl tai yra didelis?

"Yandex" yra viena didžiausių IT bendrovių Rusijoje. Šalyje ji teikia daugiau paslaugų nei "Google". Įsivaizduokite vieną įmonę, kuri pakeistų "Google", "Uber", "Amazon", "Netflix" ir "Spotify".

Ar šis nutekėjimas tikras?

Aš asmeniškai niekada nedirbau "Yandex", bet pažįstu keletą žmonių, kurie įvairiais laikotarpiais ten dirbo arba tebedirba. Įsitikinau, kad bent jau kai kuriuose archyvuose tikrai yra šiuolaikinių bendrovės paslaugų išeities kodų ir dokumentacijos, nukreipiančios į tikrus intraneto URL.

Kas yra viduje

Nutekintojas pasidalijo magnetine nuoroda, kurioje yra 44,7 GB failų, susietų su "Yandex git" šaltiniais. Teigiama, kad failai iš "Yandex" buvo pavogti 2022 m. liepos mėn. Manoma, kad kodų saugyklose yra ne tik kovos su šlamštu gairės, bet ir "Yandex" išeities kodas.

Nutekėjus informacijai paaiškėjo, kad paieškos sistema savo paieškos algoritme naudoja apie 1922 reitingavimo veiksnius. Kodas buvo nutekintas kaip torrentas. Remiantis "Twitter" naudotojo Alexo Burakso paskelbta analize, nutekintuose duomenyse yra daugybė reitingavimo veiksnių, įskaitant teksto tinkamumą, PageRank, turinio amžių, šviežumą ir kt.

Be to, egzistuoja keletas galutinio vartotojo elgsenos veiksnių, su ryšiu susijusių veiksnių ir kompiuterio patikimumo. SEO specialistai randa keletą neįprastų reitingavimo veiksnių, tokių kaip unikalių lankytojų skaičius, vidutinis domeno reitingas pagal užklausas ir organinio srauto procentinė dalis.

Atrodo, kad nutekėjo bent jau visų pagrindinių "Yandex" paslaugų išeities kodas:

  • Paieškos sistema ir indeksavimo botas
  • Žemėlapiai - kaip "Google" žemėlapiai ir "Street View
  • "Alice" - dirbtinio intelekto asistentas, panašus į "Siri" / "Alexa
  • Taksi - į "Uber" panaši taksi paslauga
  • Tiesioginė - skelbimų paslauga, pvz., "Google Ads" / "Adwords
  • Paštas - Pašto paslauga, pavyzdžiui, GMail
  • Diskas - failų saugojimo paslauga, pvz., "Google drive
  • Rinka - "Marketplace", pvz., "Amazon
  • Kelionės - kaip "Booking.com" ir lėktuvų, traukinių bei autobusų bilietai
  • "Yandex360" - kaip "Google Workspaces", skirta paslaugoms savo domene
  • Debesis - Tikriausiai nutekėjo ne visas infrastruktūros kodas.
  • "Pay" - Mokėjimų apdorojimas kaip "Stripe", tačiau su ribotu funkcijų rinkiniu
  • "Metrika" - kaip "Google Analytics
  • Ir bent jau yra daugumos kitų įmonės paslaugų galinė dalis. Didžiausias archyvas, vadinamas "frontend", dar neištirtas.

Šestakovas taip pat pastebėjo keletą API raktų, kurie greičiausiai buvo naudojami diegimui išbandyti.

Išsamią informaciją apie šį nutekėjimą rasite čia:

https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/

"Yandex" neigia bandymą įsilaužti

"Yandex" teigia žinanti apie nutekėjimą ir jau pradėjo tyrimą, kad patikrintų, kaip šaltinio kodo "fragmentai" buvo paviešinti. Verta pažymėti, kad nutekėjusioje medžiagoje nėra naudotojų ar darbuotojų asmeninių duomenų.

Tačiau atsižvelgiant į "Yandex" svarbą Rusijos IT infrastruktūrai ir nutekintus duomenis, galima daryti prielaidą, kad ataka buvo motyvuota šios šalies invazija į Ukrainą. Taigi, prie atakos galėjo prisidėti proukrainietiškai nusiteikę įsilaužėliai.

Susipažinkite su "Ranktracker

Efektyvaus SEO "viskas viename" platforma

Už kiekvieno sėkmingo verslo slypi stipri SEO kampanija. Tačiau turint daugybę optimizavimo priemonių ir metodų, iš kurių galima rinktis, gali būti sunku žinoti, nuo ko pradėti. Na, nebijokite, nes turiu ką padėti. Pristatome "Ranktracker" "viskas viename" platformą, skirtą efektyviam SEO

Pagaliau pradėjome registruotis į "Ranktracker" visiškai nemokamai!

Sukurti nemokamą paskyrą

Arba Prisijunkite naudodami savo įgaliojimus

Savo oficialiame pareiškime"Yandex" paaiškino, kad į bendrovę nebuvo įsilaužta, o buvęs darbuotojas galėjo būti susijęs su jos išeities kodo nutekinimu į viešąją erdvę. Pagrindinė Rusijos IT įmonė pažymėjo, kad nutekintame archyve yra kodo fragmentų, priklausančių vidinei saugyklai, kurios duomenys skiriasi nuo naudojamų naujausioje saugyklos versijoje.

"Į "Yandex" nebuvo įsilaužta. Mūsų saugumo tarnyba rado viešai prieinamų vidinės saugyklos kodo fragmentų, tačiau jų turinys skiriasi nuo dabartinės saugyklos versijos, naudojamos "Yandex" paslaugose", - rašoma bendrovės pranešime.

Nepaisant to, pirminio kodo nutekėjimas yra pavojingas, nes kelia rimtų saugumo problemų organizacijoms, nes grėsmių sukėlėjai gali stebėti įmonės intelektinę nuosavybę ir sistemos duomenis. Pirminio kodo nutekinimas padėtų įsilaužėliams sukurti tikslingus saugumo išnaudojimo būdus.

Kuo teoriškai skiriasi "Google" ir "Yandex" naudojami algoritmai?

Jie gana panašūs:

Yandex vs Google

  • " Yandex" yra daug buvusių "Google" darbuotojų
  • "Yanex" buvo sukurta kaip "Google" klonas;
  • SEO specialistai Rusijoje naudoja beveik tokią pačią "white hat" SEO taktiką "Yandex" ir "Google".

Žinoma, yra nemažai skirtumų, tačiau požiūris ir dauguma reitingavimo veiksnių atrodo panašūs.

Praktiškai: lyginant "Google" ir "Yandex" paieškos rezultatus, jie sutampa ~ 70 %.

" Statcounter" duomenimis, "Yandex" pagal rinkos dalį yra arti "Yahoo" ir "Bing":

search engine market share worldwide

Failas su reitingavimo veiksniais: https: //dropbox.com/s/toyehkkfduogbwk/factors_gen.txt?dl=0

Kiekvieno veiksnio struktūra:

  1. pavadinimas
  2. nuoroda į vidinę wiki (riboto naudojimo)
  3. AntiSeoUpperBound (haha)
  4. aprašymas (jis yra rusų kalba, aš jį išverčiau jums)
  5. ir t. t.

1. Pirmasis sąrašo veiksnys - PageRank.

First factor in the list - PageRank

Pagrindinės įžvalgos išanalizavus šį sąrašą: Nuorodų amžius yra reitingavimo veiksnys.

Age of links is a ranking factor.

2. Srautas ir organinio srauto procentinė dalis yra reitingo veiksniai.

PPC pirkimas turi įtakos pozicijoms.

Traffic and % of organic traffic are ranking factors

3. Skaičiai URL adresuose blogai veikia reitingus

Numbers in URLs is bad for rankings

4. Per daug brūkšnelių URL adresuose kenkia reitingavimui

Too many slashes in URLs is bad for ranking

5. Kietasis pesimizavimas lygus PR=0

Hard pessimization equal PR=0

6. Priimtuvo patikimumas yra reitingavimo veiksnys

Kuo mažiau 40x/50x klaidų, tuo geriau jūsų organiniam srautui

Host reliability is a ranking factor

7. Yra atskiras reitingo veiksnys, skirtas Vikipedijos pakėlimui

there is a separate ranking factor for uplifting Wikipedia

8. Daug reitingavimo veiksnių, susijusių su naudotojų elgsena - CTR, paskutinis paspaudimas, buvimo svetainėje laikas, atmetimo rodiklis.

Pastaba: Esame beveik tikri, kad "Yandex" šie veiksniai daro daug didesnę įtaką nei "Google".

A lot of ranking factors connected with user behaviour - CTR, last-click, time on site, bounce rate

9. Dokumento amžius ir paskutinis atnaujinimas yra reitingavimo veiksniai

Document age and last update both are ranking factors

10. Vidutinė domeno pozicija visose užklausose yra reitingavimo veiksnys

Average domain position across all queries is a ranking factor

11. Naršymo gylis yra reitingavimo veiksnys

Svarbius puslapius laikykite arčiau pagrindinio puslapio:

  • viršutiniai puslapiai: 1 paspaudimas iš pagrindinio puslapio
  • svarbūs puslapiai: <3 paspaudimai

Crawl depth is a ranking factor

12. Papildomai: našlaičių puslapių reitingavimo veiksnys

Tai galite sužinoti naudodamiesi mūsų svetainės audito įrankiu

Additionally: ranking factor for orphan pages

13. Atgalinės nuorodos iš pagrindinių puslapių yra svarbesnės nei iš vidinių puslapių

Backlinks from main pages are more important than from internal pages

14. Jūsų svetainės/url paieškos užklausų skaičius yra reitingavimo veiksnys

Kuo daugiau, tuo geriau

Number of search queries of your site/url is a ranking factor

15. Vikipedijos lankomumas yra reitingavimo veiksnys

Traffic from Wikipedia is a ranking factor

16. Jei jūsų url adresas būtų paskutinis paieškos sesijoje (vartotojas ras tai, ko jam reikia) - tai turėtų įtakos reitingams.

Tai lemia griežti ir nuspėjami veiksniai.

If your url would be the last for search session (user will find what he needs) - it would impact rankings

17. Žymos reitingo veiksnys

Kuo daugiau naudotojų prideda url adresą prie žymų, tuo didesnė jo faktoriaus vertė.

Bookmarks ranking factor

18. Specialūs reitingavimo veiksniai trumpiems vaizdo įrašams (tiktok, trumpametražiams vaizdo įrašams, ritinėliams)

Special ranking factors for short videos (tiktok, shorts, reels)

19. Žemėlapiai js-api puslapyje (pvz., "Google Maps") yra reitingavimo veiksnys

"Google" (pavyzdžiui, kelionių nišoje) žemėlapių su naudinga informacija ir (arba) funkcijomis pridėjimas taip pat veikia.

Maps js-api on page (for example Google Maps) is a ranking factor

20. URL esantys raktiniai žodžiai yra reitingavimo veiksniai

Kaip matome iš aprašymo, optimalus variantas apima iki 3 žodžių iš paieškos užklausos.

Keywords in URL are ranking factors

21. Grįžtantys naudotojai yra reitingavimo veiksnys

Sukurkite produktus, kurie pasižymi geru išlaikymu, ir tai bus naudinga jūsų SEO (tam įvertinti yra daug reitingavimo veiksnių).

Returning users is a ranking factor

22. Didžiųjų raidžių procentinė dalis <title> yra reitingavimo veiksnys

Percentage of CAPITAL LETTERS in title> is a ranking factor

23. Tiesioginio srauto procentinė dalis yra reitingavimo veiksnys

Aka. Jei visas jūsų srautas atėjo iš organinės paieškos - tai įtartina + blogai vertinama.

Percentage of direct traffic is a ranking factor

24. Dar vienas turinio kokybės reitingavimo veiksnys - sugadintas puslapyje įterptas vaizdo įrašas

  • Įterpti vaizdo įrašai - naudinga reitingams.
  • Sulaužyti įterpti vaizdo įrašai - blogai.

One more ranking factor for content quality - broken embedded video on the page

25. Patvirtintos paskyros socialiniuose tinkluose vertinamos skirtingai nei kiti urlai

Svarbu prekės ženklo paieškoms - idealiu atveju, ieškant jūsų prekės ženklo, tarp 10 populiariausių turėtų būti tik jūsų domenai + patikrinti socialiniai tinklai.

Verified accounts on social networks ranks differently as other urls

26. Jei jūsų atgalinių nuorodų inkaruose yra visi raktažodžių žodžiai - tai naudinga SEO.

Jei tai yra viena nuoroda - tai naudingiau. Ypač jei žodžių tvarka yra tokia pati.

If your backlinks anchors contain all words from the keywords - it's good for SEO

27. Gerų ir blogų atgalinių nuorodų santykis yra reitingavimo veiksnys

![Gerų ir blogų atgalinių nuorodų santykis yra reitingavimo veiksnys](https://www.ranktracker.com/media/yandex-leaked-code-containing-search-ranking-factors-ranktracker-explains-all-ranking-factors/images/i84.png "Gerų ir blogų atgalinių nuorodų santykis yra reitingavimo veiksnys")

28. Tekstų kokybės rangas domene yra reitingavimo veiksnys

Puslapiai su prastos kokybės turiniu turi įtakos visam domenui.

The quality rank of texts on the domain is a ranking factor

29. Reklamos kiekis puslapyje yra reitingavimo veiksnys

Amount of advertisements on a page is a ranking factor

30. Atsitiktinumas yra atskiras reitingavimo veiksnys

Kai nesuprantate, kodėl kai kurie puslapiai yra viršuje, tai gali būti atsitiktinis veiksnys (elgsenos veiksniams patikrinti).

There is a random as a separate ranking factor

31. JS iš "Google Analytics" yra reitingavimo veiksnys

Nuspėjamai. Geros svetainės GA / "Google analytics" naudoja dažniau nei blogos svetainės.

JS from Google Analytics is a ranking factor

32. Atgalinių nuorodų iš 100 geriausių svetainių pagal PageRank poveikis reitingams

Backlinks from the top 100 best websites by PageRank impacts on rankings

33. URL neturi skaitmenų

/100-best-credit-cards

/best-credit-cards

URL has no digits

34. Brūkšnelių skaičius URL adrese

/finance/articles/2023/investiciniai patarimai

/investiciniai patarimai

Number of slashes in URL

35. Ne raidžių skaičius URL adrese

/pet-toys&all$currency=dollar#mobile

/pet-toys

Number of non-letters in URL

36. "?" simbolis URL yra reitingavimo veiksnys

/movies?genre=action

/action-movies

'?' symbol in the URL is a ranking factor

37. Paieškos užklausa = URL, įskaitant taškus ir tarpus (??)

Paieškos užklausa yra "Franklin D. Roosevelt":

/rooseveltas

/Franklin_D._Roosevelt

Search query = URL, including dots and spaces (??)

38. Senoji data URL adrese

/2009/12/01/how-to-tie-a-tie

/kaip surišti kaklaraištį

Old date in the URL

39. Raktiniai žodžiai yra URL, o ne puslapio tekste

/video žaidimai ir puslapis apie muziką

/video-games & puslapis apie vaizdo žaidimus

Keywords is in URL, not in the text of the page

40. URL aprėptis su trigramomis iš paieškos užklausos

/hotels-new-zealand

/nz

/cheap-hotels-in-new-zealand-best-deals

URL coverage with trigrams from the search query

  • Į URL įtraukite 1-3 svarbiausius žodžius;
  • Mažiau brūkšnelių / skaitmenų / ne raidžių, jei tai nėra raktažodžio dalis.

41. pradiniai "Yandex" reitingavimo veiksnių svoriai

Galutinius svorius apskaičiuoja AI(matrixnet), tačiau pradinės vertės taip pat naudingos.

initial weights of Yandex ranking factors

Išvada

Štai ir viskas, kuo dabar dalijamės. Mes tik pradedame. Tai apytikslė apžvalga, kas čia yra.

Čia tik praskleidžiame paviršių, o ateityje laukia dar daug vertingų įžvalgų.

Tačiau mes buvome visiškai teisūs darydami daugybę prielaidų ir interpretacijų apie tai, kaip veiktų tokia plati paieškos sistema, bent jau kalbant apie nuorodas.

Apskritai "Yandex" kodo nutekėjimas suteikia įdomių žinių apie šiuolaikinės paieškos sistemos vidinį veikimą.

Susipažinkite su "Ranktracker

Efektyvaus SEO "viskas viename" platforma

Už kiekvieno sėkmingo verslo slypi stipri SEO kampanija. Tačiau turint daugybę optimizavimo priemonių ir metodų, iš kurių galima rinktis, gali būti sunku žinoti, nuo ko pradėti. Na, nebijokite, nes turiu ką padėti. Pristatome "Ranktracker" "viskas viename" platformą, skirtą efektyviam SEO

Pagaliau pradėjome registruotis į "Ranktracker" visiškai nemokamai!

Sukurti nemokamą paskyrą

Arba Prisijunkite naudodami savo įgaliojimus

Nors ne visas išvadas galima tiesiogiai pritaikyti "Google", pasitvirtino daugelis pastaraisiais metais padarytų prielaidų apie bendrą didelių interneto paieškos sistemų veikimą.

Manau, kad SEO pramonės dar laukia keli įdomūs mėnesiai, kai bus gauta naujų įžvalgų dėl šio nutekėjimo.

Sekite šį puslapį, nes per ateinančias savaites ir mėnesius toliau papildysime reitingavimo veiksnius.

Specialūs kreditai https://twitter.com/alex_buraks

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Pradėkite naudoti "Ranktracker"... nemokamai!

Sužinokite, kas trukdo jūsų svetainei užimti aukštesnes pozicijas.

Sukurti nemokamą paskyrą

Arba Prisijunkite naudodami savo įgaliojimus

Different views of Ranktracker app