• Tehnoloģija

Yandex noplūdis kods, kas satur 1922 meklēšanas ranga faktorus Ranktracker izskaidro visus ranga faktorus

  • Felix Rose-Collins
  • 6 min read
Yandex noplūdis kods, kas satur 1922 meklēšanas ranga faktorus Ranktracker izskaidro visus ranga faktorus

Ievads

Iespējams, esat dzirdējuši par Yandex, tā ir ceturtā lielākā meklētājprogramma pasaulē pēc tirgus daļas. Vakar tika nopludināts Yandex patentētais pirmkods.

SEO kopienai interesantākā daļa ir: visu 1922 meklēšanas algoritmā izmantoto ranga faktoru saraksts.

Mēs esam lejupielādējuši kodu, analizējuši to un šeit tas ir sniegts noderīgā veidā.

Yandex leak

Incidentam nevajadzētu būt pārsteigumam, jo Yandex vai tās produkti bieži tiek pakļauti kiberuzbrukumiem. 2016. gadā portāls Hackread.com ekskluzīvi ziņoja par to, kā kāds tumšā tīmekļa pārdevējs pārdeva 6,3 miljonu Yandex lietotāju kontu datus.

2021. gada septembrī Krievijas meklētājprogrammu gigantu skāra viens no lielākajiem DDoS uzbrukumiem, ko izraisīja 200 000 kompromitētu IoT ierīču.

Iepazīstieties ar Ranktracker

"Viss vienā" platforma efektīvai SEO optimizācijai

Katra veiksmīga uzņēmuma pamatā ir spēcīga SEO kampaņa. Taču, ņemot vērā neskaitāmos optimizācijas rīkus un paņēmienus, var būt grūti saprast, ar ko sākt. Nu, nebaidieties, jo man ir tieši tas, kas jums palīdzēs. Iepazīstinu ar Ranktracker "viss vienā" platformu efektīvai SEO optimizācijai.

Mēs beidzot esam atvēruši reģistrāciju Ranktracker pilnīgi bez maksas!

Izveidot bezmaksas kontu

Vai Pierakstīties, izmantojot savus akreditācijas datus

Yandex git sources

Kāpēc tas ir liels?

Yandex ir viens no lielākajiem IT uzņēmumiem Krievijā. Valstī tas sniedz plašāku pakalpojumu klāstu nekā Google. Iedomājieties vienu uzņēmumu, kas aizstāj Google, Uber, Amazon, Netflix un Spotify.

Vai šī noplūde ir īsta?

Es personīgi nekad neesmu strādājis uzņēmumā Yandex, taču pazīstu vairākus cilvēkus, kuri dažādos laikos tur strādāja vai joprojām strādā. Es pārliecinājos, ka vismaz dažos arhīvos noteikti ir mūsdienu uzņēmuma pakalpojumu avota kods, kā arī dokumentācija, kas norāda uz īstiem intraneta URL.

Kas ir iekšpusē

Informācijas noplūdinātājs ir dalījies ar magnēta saiti, kurā ir 44,7 GB failu, kas saistīti ar Yandex git avotiem. Faili, iespējams, tika nozagti no Yandex 2022. gada jūlijā. Tiek uzskatīts, ka koda repozitorijos ir ne tikai ietvertas pretspiegošanas vadlīnijas, bet arī Yandex avota kods.

Informācijas noplūde atklāja, ka meklētājprogramma savā meklēšanas algoritmā izmanto aptuveni 1922 ranžēšanas faktorus. Kods tika noplūdināts kā torrent. Saskaņā ar analīzi, ko publicēja Twitter lietotājs Alex Buraks, noplūdušajos datos ir iekļauti daudzi ranga faktori, tostarp teksta atbilstība, PageRank, satura vecums, svaigums utt.

Turklāt pastāv vairāki galalietotāja uzvedības faktori, ar saiti saistīti faktori un hostu uzticamība. SEO speciālisti atrod dažus neparastus ranga faktorus, piemēram, unikālo apmeklētāju skaitu, vidējo domēna rangu pēc visiem pieprasījumiem un organiskās datplūsmas procentuālo daļu.

Izskatās, ka vismaz visu galveno Yandex pakalpojumu pirmkods ir noplūdis:

  • Meklētājprogramma un indeksēšanas robots
  • Kartes - piemēram, Google Maps un Street View
  • Alise - mākslīgā intelekta asistents, piemēram, Siri / Alexa
  • Taksometri - Uber līdzīgs taksometru pakalpojums
  • Tiešais - reklāmu pakalpojums, piemēram, Google Ads / Adwords
  • Pasts - Pasta pakalpojums, piemēram, GMail
  • Disks - Failu glabāšanas pakalpojums, piemēram, Google disks
  • Tirgus - Marketplace, piemēram, Amazon
  • Ceļojumi - tāpat kā Booking.com plus lidmašīnu, vilcienu un autobusu biļetes
  • Yandex360 - tāpat kā Google darbvietas pakalpojumiem savā domēnā.
  • Mākonis - Iespējams, ne viss infrastruktūras kods tika noplūdināts.
  • Maksāt - maksājumu apstrāde, piemēram, Stripe, taču ar ierobežotu funkciju kopumu.
  • Metrika - Līdzīgi kā Google Analytics
  • Un vismaz lielākajai daļai citu uzņēmuma pakalpojumu ir pieejama backend daļa. Lielākais arhīvs ar nosaukumu "frontend" vēl nav izpētīts.

Šestakovs arī atzīmēja dažas API atslēgas, kas, visticamāk, tika izmantotas izvietošanas testēšanai.

Sīkāka informācija par šo noplūdi ir pieejama šeit:

https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/

Yandex noliedz hakeru mēģinājumu

Uzņēmums Yandex apgalvo, ka ir informēts par noplūdi un jau ir uzsācis izmeklēšanu, lai pārbaudītu, kā avota koda "fragmenti" tika publiskoti. Jāatzīmē, ka noplūde neietver lietotāju vai darbinieku personas datus.

Tomēr, ņemot vērā Yandex nozīmi Krievijas IT infrastruktūrā un noplūdušos datus, varēja pieņemt, ka uzbrukums tika motivēts ar valsts iebrukumu Ukrainā. Tātad tajā varētu būt iesaistīti Ukrainu atbalstoši hakeri.

Iepazīstieties ar Ranktracker

"Viss vienā" platforma efektīvai SEO optimizācijai

Katra veiksmīga uzņēmuma pamatā ir spēcīga SEO kampaņa. Taču, ņemot vērā neskaitāmos optimizācijas rīkus un paņēmienus, var būt grūti saprast, ar ko sākt. Nu, nebaidieties, jo man ir tieši tas, kas jums palīdzēs. Iepazīstinu ar Ranktracker "viss vienā" platformu efektīvai SEO optimizācijai.

Mēs beidzot esam atvēruši reģistrāciju Ranktracker pilnīgi bez maksas!

Izveidot bezmaksas kontu

Vai Pierakstīties, izmantojot savus akreditācijas datus

Savā oficiālajā paziņojumā Yandex precizēja, ka uzņēmums nav ticis uzlauzts un tā pirmkoda noplūdē publiskajā telpā varētu būt iesaistīts kāds bijušais darbinieks. Krievijas vadošais IT uzņēmums norādīja, ka nopludinātajā arhīvā ir iekļauti koda fragmenti, kas ir daļa no iekšējā repozitorija, kura dati atšķiras no tiem, kas tiek izmantoti jaunākajā repozitorija versijā.

"UzņēmumsYandex netika uzlauzts. Mūsu drošības dienests atrada publiski pieejamus koda fragmentus no iekšējās krātuves, taču saturs atšķiras no pašreizējās krātuves versijas, kas tiek izmantota Yandex pakalpojumos," teikts uzņēmuma paziņojumā.

Tomēr pirmkoda noplūde ir bīstama, jo rada nopietnas drošības problēmas organizācijām, jo apdraudējuma dalībnieki var novērot uzņēmuma intelektuālo īpašumu un sistēmas datus. Avota koda noplūde palīdzētu uzbrucējiem izveidot mērķtiecīgus drošības uzbrukumus.

Kāda ir teorētiskā atšķirība starp Google un Yandex izmantotajiem algoritmiem?

Tie ir diezgan līdzīgi:

Yandex vs Google

  • Uzņēmumā Yandex ir daudz bijušo Google darbinieku.
  • Yanex tika izveidots kā Google klons;
  • SEO speciālisti Krievijā izmanto gandrīz tādu pašu "balto cepuru" SEO taktiku gan Yandex, gan Google.

Protams, ir daudz atšķirību, taču pieeja un lielākā daļa klasifikācijas faktoru šķiet līdzīgi.

Praksē: salīdzinot Google un Yandex meklēšanas rezultātus, tie ir ~ 70 % vienādi.

Saskaņā ar Statcounter datiem Yandex pēc tirgus daļas ir tuvu Yahoo un Bing:

search engine market share worldwide

Datne ar ranga faktoriem: https: //dropbox.com/s/toyehkkfduogbwk/factors_gen.txt?dl=0

Katra faktora struktūra:

  1. nosaukums
  2. saite uz iekšējo wiki (ierobežots)
  3. AntiSeoUpperBound (haha)
  4. apraksts (tas ir krievu valodā, es jums to iztulkoju)
  5. utt.

1. Pirmais faktors sarakstā - PageRank.

First factor in the list - PageRank

Galvenās atziņas pēc šī saraksta analīzes: Saites vecums ir ranga faktors.

Age of links is a ranking factor.

2. Ranga faktori ir datplūsma un organiskās datplūsmas %.

PPC pirkšana ietekmē klasifikāciju.

Traffic and % of organic traffic are ranking factors

3. Skaitļi URL adresēs ir slikti vērtējumam

Numbers in URLs is bad for rankings

4. Pārāk daudz slīpsvītru URL adresēs ir slikti vērtējams

Too many slashes in URLs is bad for ranking

5. Cietā pesimizācija vienāda ar PR=0

Hard pessimization equal PR=0

6. Uzņēmēja uzticamība ir vērtēšanas faktors

Jo mazāk 40x/50x kļūdu, jo labāk jūsu organiskajai datplūsmai.

Host reliability is a ranking factor

7. Ir atsevišķs ranga faktors Vikipēdijas pacelšanai.

there is a separate ranking factor for uplifting Wikipedia

8. Daudzi ranga faktori, kas saistīti ar lietotāju uzvedību - CTR, pēdējais klikšķis, laiks, kas pavadīts vietnē, bounce rate.

Piezīme: Mēs esam gandrīz pārliecināti, ka Yandex šie faktori ietekmē daudz vairāk nekā Google.

A lot of ranking factors connected with user behaviour - CTR, last-click, time on site, bounce rate

9. Dokumenta vecums un pēdējais atjauninājums ir ranga faktori

Document age and last update both are ranking factors

10. Vidējā domēna pozīcija visos pieprasījumos ir ranga faktors

Average domain position across all queries is a ranking factor

11. Pārmeklēšanas dziļums ir ranga faktors

Svarīgākās lapas turiet tuvāk galvenajai lapai:

  • augšējās lappuses: 1 klikšķis no galvenās lapas
  • svarīgas lapas: <3 klikšķi

Crawl depth is a ranking factor

12. Papildus: reitinga faktors bāreņu lapām

To varat noskaidrot, izmantojot mūsu vietnes audita rīku

Additionally: ranking factor for orphan pages

13. Atpakaļsaites no galvenajām lapām ir svarīgākas nekā no iekšējām lapām

Backlinks from main pages are more important than from internal pages

14. Jūsu vietnes/vietnes URL meklēšanas pieprasījumu skaits ir ranga faktors

Jo vairāk, jo labāk

Number of search queries of your site/url is a ranking factor

15. Vikipēdijas datplūsma ir ranga faktors

Traffic from Wikipedia is a ranking factor

16. Ja jūsu url būtu pēdējais meklēšanas sesijā (lietotājs atradīs to, kas viņam nepieciešams) - tas ietekmētu klasifikāciju.

Tam ir gan stingri faktori, gan arī paredzami faktori.

If your url would be the last for search session (user will find what he needs) - it would impact rankings

17. Grāmatzīmes ranga faktors

Jo vairāk lietotāju pievieno url adresi grāmatzīmēm, jo lielāka ir tā faktora vērtība.

Bookmarks ranking factor

18. Īpaši reitinga faktori īsiem videoklipiem (tiktok, īsfilmas, rullīši)

Special ranking factors for short videos (tiktok, shorts, reels)

19. Kartes js-api lapā (piemēram, Google Maps) ir ranga faktors

Google (piemēram, ceļojumu nišā) darbojas arī karšu pievienošana ar noderīgu informāciju/funkcijām.

Maps js-api on page (for example Google Maps) is a ranking factor

20. Rādītāji URL adresē ir ranga faktori

Kā redzams no apraksta, optimālais variants ietver līdz 3 vārdiem no meklēšanas vaicājuma.

Keywords in URL are ranking factors

21. Atgriezušies lietotāji ir ranga faktors

Izveidojiet produktus ar labu saglabāšanu, un tas būs izdevīgi jūsu SEO (ir daudz ranga faktoru, lai to novērtētu).

Returning users is a ranking factor

22. Skaitļo burtu īpatsvars <title> ir ranga faktors

Percentage of CAPITAL LETTERS in title> is a ranking factor

23. Tiešās satiksmes procentuālais īpatsvars ir ranga faktors

Aka. Ja visa jūsu datplūsma nāk no organiskās meklēšanas - tas ir aizdomīgi + slikti rangiem.

Percentage of direct traffic is a ranking factor

24. Vēl viens satura kvalitātes ranga faktors - lauzts lapā iestrādātais videoklips.

  • Iebildējiet videoklipus - tas ir labi vērtējumam.
  • Broken embed video - slikti.

One more ranking factor for content quality - broken embedded video on the page

25. Pārbaudīti konti sociālajos tīklos ierindojas citādāk nekā citi urls

Svarīgi zīmola meklēšanai - ideālā gadījumā, meklējot jūsu zīmolu, 10 populārākajos meklētājos būtu jābūt tikai jūsu domēniem + pārbaudītiem sociālajiem tīkliem.

Verified accounts on social networks ranks differently as other urls

26. Ja jūsu atpakaļsaites enkuros ir visi atslēgas vārdu vārdi - tas ir labi SEO optimizācijai.

Ja tas ir vienā saitē - tas ir izdevīgāk. Īpaši, ja vārdu secība ir vienāda.

If your backlinks anchors contain all words from the keywords - it's good for SEO

27. "Labo" un "slikto" atpakaļsaitņu attiecība ir ranga faktors

![Attiecība "labas" vs "sliktas" backlink ir ranga faktors](https://www.ranktracker.com/media/yandex-leaked-code-containing-search-ranking-factors-ranktracker-explains-all-ranking-factors/images/i84.png "Attiecība "labas" vs "sliktas" backlink ir ranga faktors")

28. Domēnā esošo tekstu kvalitātes rangs ir ranga faktors.

Lapas ar zemas kvalitātes saturu ietekmē visu domēnu.

The quality rank of texts on the domain is a ranking factor

29. Reklāmu daudzums lapā ir ranga faktors

Amount of advertisements on a page is a ranking factor

30. Ir nejaušība kā atsevišķs ranga faktors

Ja nesaprotat, kāpēc dažas lapas ir augšpusē - iespējams, ka tas ir nejaušs iemesls (lai pārbaudītu uzvedības faktorus).

There is a random as a separate ranking factor

31. JS no Google Analytics ir ranga faktors

Paredzami. Labas tīmekļa vietnes biežāk izmanto GA / Google analytics nekā sliktas tīmekļa vietnes.

JS from Google Analytics is a ranking factor

32. Atpakaļsaites no 100 labākajām tīmekļa vietnēm pēc PageRank ietekmes uz klasifikāciju

Backlinks from the top 100 best websites by PageRank impacts on rankings

33. URL nav ciparu

/100-best-credit-cards

/best-credit-cards

URL has no digits

34. Svītrkarpu skaits URL adresē

/finance/articles/2023/investīciju padomi

/investīciju padomi

Number of slashes in URL

35. Rindkopas, kas nav burti, skaits URL adresē

/pet-toys&all$currency=dollar#mobile

/pet-toys

Number of non-letters in URL

36. "?" simbols URL adresē ir vērtēšanas faktors

/movies?genre=action

/action-movies

'?' symbol in the URL is a ranking factor

37. Meklēšanas vaicājums = URL, ieskaitot punktus un atstarpes (??)

Meklēšanas vaicājums ir "Franklin D. Roosevelt":

/roosevelt

/Franklin_D._Roosevelt

Search query = URL, including dots and spaces (??)

38. Vecais datums URL adresē

/2009/12/01/how-to-tie-a-tie

/how-to-tie-a-tie

Old date in the URL

39. Atslēgas vārdi ir URL, nevis lapas tekstā.

/video-spēles & lapa ir par mūziku

/video-spēles & lapa ir par videospēlēm

Keywords is in URL, not in the text of the page

40. URL pārklājums ar meklēšanas vaicājuma trigrammām

/hotels-new-zealand

/nz

/cheap-hotels-in-new-zealand-best-deals

URL coverage with trigrams from the search query

  • URL iekļaujiet 1-3 svarīgākos vārdus;
  • Mazāk slīpsvītru/ciparu/burtu, ja tie nav daļa no atslēgvārda.

41. Yandex ranga faktoru sākotnējie svari

Galīgos svarus aprēķina AI(matrixnet), taču noderīgas ir arī sākotnējās vērtības.

initial weights of Yandex ranking factors

Secinājums

Tas ir viss, ko mēs šobrīd dalāmies. Mēs tikai sākam. Tas sniedz aptuvenu pārskatu par to, kas tur ir.

Mēs šeit tikai ieskicējam virsmu, jo priekšā ir vēl daudz vērtīgu atziņu.

Taču mums bija taisnība daudzos pieņēmumos un interpretācijās no malas par to, kā darbosies šāda plaša meklēšanas sistēma, vismaz attiecībā uz saitēm.

Kopumā Yandex koda noplūde sniedz aizraujošu ieskatu mūsdienu meklētājprogrammas iekšējā darbībā.

Iepazīstieties ar Ranktracker

"Viss vienā" platforma efektīvai SEO optimizācijai

Katra veiksmīga uzņēmuma pamatā ir spēcīga SEO kampaņa. Taču, ņemot vērā neskaitāmos optimizācijas rīkus un paņēmienus, var būt grūti saprast, ar ko sākt. Nu, nebaidieties, jo man ir tieši tas, kas jums palīdzēs. Iepazīstinu ar Ranktracker "viss vienā" platformu efektīvai SEO optimizācijai.

Mēs beidzot esam atvēruši reģistrāciju Ranktracker pilnīgi bez maksas!

Izveidot bezmaksas kontu

Vai Pierakstīties, izmantojot savus akreditācijas datus

Lai gan ne visus secinājumus var tieši attiecināt uz Google, daudzi pieņēmumi par lielo interneta meklētājprogrammu darbību ir apstiprinājušies, kas izteikti pēdējos gados.

Es pieņemu, ka SEO nozarei vēl ir priekšā daži interesanti mēneši, kuros tā varēs gūt jaunas atziņas no šīs noplūdes.

Turpiniet sekot līdzi šai lapai, jo turpmāko nedēļu un mēnešu laikā mēs turpināsim pievienot ranga faktorus.

Īpaši kredīti https://twitter.com/alex_buraks

Felix Rose-Collins

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Felix Rose-Collins is the Co-founder and CEO/CMO of Ranktracker. With over 15 years of SEO experience, he has single-handedly scaled the Ranktracker site to over 500,000 monthly visits, with 390,000 of these stemming from organic searches each month.

Sāciet izmantot Ranktracker... Bez maksas!

Noskaidrojiet, kas kavē jūsu vietnes ranga saglabāšanu.

Izveidot bezmaksas kontu

Vai Pierakstīties, izmantojot savus akreditācijas datus

Different views of Ranktracker app