Intro
Valószínűleg hallottál már a Yandexről, amely piaci részesedése alapján a 4. legnagyobb keresőmotor világszerte. Tegnap kiszivárgott a Yandex saját forráskódja.
A SEO közösség számára a legérdekesebb rész: a keresési algoritmusban használt 1922 rangsorolási tényező listája.
Letöltöttük a kódot, elemeztük, és itt hasznos módon mutatjuk be.
Az incidens nem meglepő, mivel a Yandexet vagy annak termékeit gyakran érik kibertámadások. 2016-ban a Hackread.com exkluzívan számolt be arról, hogy egy dark webes kereskedő 6,3 millió Yandex-felhasználói fiók adatait árulta.
2021 szeptemberében az orosz keresőóriást az egyik legnagyobb DDoS-támadás érte, amelyet 200 000 kompromittált IoT-eszköz hajtott végre.
Az All-in-One platform a hatékony SEO-hoz
Minden sikeres vállalkozás mögött egy erős SEO kampány áll. De a számtalan optimalizálási eszköz és technika közül lehet választani, ezért nehéz lehet tudni, hol kezdjük. Nos, ne félj tovább, mert van egy ötletem, ami segíthet. Bemutatom a Ranktracker all-in-one platformot a hatékony SEO-ért.
Végre megnyitottuk a Ranktracker regisztrációt teljesen ingyenesen!
Ingyenes fiók létrehozásaVagy Jelentkezzen be a hitelesítő adatokkal
Miért olyan nagy ez?
A Yandex Oroszország egyik legnagyobb informatikai vállalata. Az országon belül szélesebb körű szolgáltatásokat nyújt, mint a Google. Képzeljünk el egy olyan vállalatot, amely a Google, az Uber, az Amazon, a Netflix és a Spotify helyébe lép.
Valódi ez a szivárgás?
Én személy szerint soha nem dolgoztam a Yandexnél, de több olyan embert ismerek, akik különböző időszakokban dolgoztak ott, vagy még mindig ott dolgoznak. Meggyőződtem róla, hogy legalább néhány archívum biztosan tartalmazza a cég szolgáltatásainak modern forráskódját, valamint a valódi intranetes URL-ekre mutató dokumentációt.
Mi van benne
A kiszivárogtató megosztott egy mágneses linket, amely 44,7 GB Yandex git forrásokhoz kapcsolódó fájlokat tartalmaz. A fájlokat állítólag 2022 júliusában lopták el a Yandex-től. A spamellenes irányelvek mellett a kódtárak vélhetően a Yandex forráskódját is tartalmazzák.
A kiszivárgott információkból kiderült, hogy a keresőmotor mintegy 1922 rangsorolási tényezőt használ a keresési algoritmusában. A kód torrentként szivárgott ki. Az Alex Buraks Twitter-felhasználó által közzétett elemzés szerint a kiszivárgott adatok számos rangsorolási tényezőt tartalmaznak, köztük a szöveg relevanciáját, a PageRanket, a tartalom korát, frissességét stb.
Valószínűleg hallottál már a Yandexről, amely piaci részesedése alapján a 4. legnagyobb keresőmotor világszerte. Tegnap kiszivárgott a Yandex saját forráskódja.
- Alex Buraks (@alex_buraks) January 27, 2023
A SEO közösség számára a legérdekesebb rész: a keresési algoritmusban használt 1922 rangsorolási tényező listája.
[🧵THREAD] pic.twitter.com/6x82AAmbON
Ezenkívül számos végfelhasználói viselkedési tényező, a linkkel kapcsolatos tényezők és a hoszt megbízhatósága is létezik. A SEO-k találnak néhány szokatlan rangsorolási tényezőt, mint például az egyedi látogatók száma, a domainek átlagos rangsorolása a lekérdezések között és az organikus forgalom százalékos aránya.
Úgy néz ki, hogy legalábbis a Yandex minden fontosabb szolgáltatásának forráskódja kiszivárgott:
- Keresőmotor és indexelő bot
- Térképek - Mint például a Google Maps és a Street View
- Alice - AI asszisztens, mint Siri / Alexa
- Taxi - Uber-szerű taxi szolgáltatás
- Közvetlen - Hirdetési szolgáltatás, mint a Google Ads / Adwords
- Mail - Mail szolgáltatás, mint a GMail
- Lemez - Fájltároló szolgáltatás, mint a Google drive
- Market - Piactér, mint az Amazon
- Utazás - Mint a Booking.com plusz repülő-, vonat- és buszjegyek
- Yandex360 - Mint a Google munkaterületek a saját domainjén lévő szolgáltatásokhoz
- Felhő - Valószínűleg nem minden infrastrukturális kód szivárgott ki.
- Pay - Fizetésfeldolgozás, mint a Stripe, de korlátozott funkciókkal.
- Metrika - Mint a Google Analytics
- És legalább a többi vállalati szolgáltatás többségének backend része is ott van. A legnagyobb, "frontend" nevű archívum még feltárásra vár.
Shestakov megjegyezte továbbá néhány API-kulcsot, amelyeket valószínűleg a telepítés tesztelésére használtak.
Részletek erről a szivárgásról: itt találhatók:
https://arseniyshestakov.com/2023/01/26/yandex-services-source-code-leak/
A Yandex tagadja a hacker kísérletet
A Yandex azt állítja, hogy tud a kiszivárgásról, és már vizsgálatot indított annak ellenőrzésére, hogy a forráskód "töredékei" hogyan kerültek nyilvánosságra. Érdemes megjegyezni, hogy a szivárgás nem tartalmaz felhasználói vagy alkalmazotti személyes adatokat.
Tekintettel azonban a Yandex jelentőségére Oroszország informatikai infrastruktúrájában és a kiszivárgott adatokra, feltételezhető, hogy a támadást az ország ukrajnai inváziója motiválta. Tehát Ukrajna-párti hackerek is érintettek lehettek.
Az All-in-One platform a hatékony SEO-hoz
Minden sikeres vállalkozás mögött egy erős SEO kampány áll. De a számtalan optimalizálási eszköz és technika közül lehet választani, ezért nehéz lehet tudni, hol kezdjük. Nos, ne félj tovább, mert van egy ötletem, ami segíthet. Bemutatom a Ranktracker all-in-one platformot a hatékony SEO-ért.
Végre megnyitottuk a Ranktracker regisztrációt teljesen ingyenesen!
Ingyenes fiók létrehozásaVagy Jelentkezzen be a hitelesítő adatokkal
A Yandex hivatalos közleményében tisztázta, hogy a vállalatot nem hackelték meg, és egy korábbi alkalmazottja lehet érintett abban, hogy a forráskódja kiszivárgott a nyilvánosságra. Oroszország vezető informatikai cége megjegyezte, hogy a kiszivárgott archívum olyan kódrészleteket tartalmaz, amelyek egy belső adattár részét képezik, és amelyek adatai eltérnek attól, amit az adattár legújabb verziójában használnak.
"A Yandexet nem hackelték meg. Biztonsági szolgálatunk egy belső adattárból származó kódrészleteket talált a nyilvánosság számára, de a tartalom eltér a Yandex szolgáltatásaiban használt adattár jelenlegi verziójától" - áll a vállalat közleményében.
Mindazonáltal a forráskód-szivárgások azért veszélyesek, mert komoly biztonsági problémákat vetnek fel a szervezetek számára, mivel a fenyegető szereplők megfigyelhetik a vállalat szellemi tulajdonát és rendszeradatait. A forráskód kiszivárgása segítené a támadókat abban, hogy célzott biztonsági kihasználásokat hozzanak létre.
Elméletileg mi a különbség a Google és a Yandex által használt algoritmusok között?
Ezek nagyon hasonlóak:
- van RankBrainanalóg - MatrixNet
- PageRanket használnak (majdnem ugyanazt, mint a Google);
- sok szöveges algoritmus ugyanaz.
- A Yandexben sok volt guglizó dolgozik.
- A Yanex a Google klónjaként épült;
- Az oroszországi SEO szakemberek szinte ugyanazt a fehér kalapos SEO taktikát használják a Yandex és a Google számára.
Természetesen sok különbség van, de a megközelítés és a rangsorolási tényezők többsége hasonlónak tűnik.
A gyakorlatban: a Google vs. Yandex keresési eredmények összehasonlítása ~70%-os egyezést mutat.
A Statcounter szerint a Yandex piaci részesedését tekintve közel áll a Yahoo és a Bing eredményeihez:
A rangsorolási tényezőket tartalmazó fájl: https://dropbox.com/s/toyehkkfduogbwk/factors_gen.txt?dl=0
Az egyes faktorok szerkezete:
- név
- link a belső wikire (korlátozott)
- AntiSeoUpperBound (haha)
- leírás (oroszul van, lefordítottam neked)
- stb.
1. A lista első tényezője - PageRank.
A lista elemzése utáni főbb felismerések: A linkek kora rangsorolási tényező.
2. A forgalom és az organikus forgalom %-a rangsorolási tényező.
A PPC megvásárlása befolyásolja a rangsorolást.
3. A számok az URL-ekben rossz hatással vannak a rangsorolásra
4. A túl sok ferdehajlat az URL címekben rossz hatással van a rangsorolásra
5. Kemény pesszimizáció egyenlő PR=0
6. A fogadó megbízhatósága rangsoroló tényező
Minél kevesebb 40x/50x hiba van, annál jobb az organikus forgalma számára.
7. Külön rangsorolási tényező van a Wikipédia felemeléséhez.
8. Számos rangsorolási tényező kapcsolódik a felhasználói viselkedéshez - CTR, utolsó kattintás, webhelyen töltött idő, visszalépési arány.
Megjegyzés: Szinte biztosak vagyunk benne, hogy a Yandexben ezek a tényezők sokkal nagyobb hatással vannak, mint a Google-ban.
9. A dokumentum kora és az utolsó frissítés egyaránt rangsorolási tényező.
10. Az összes lekérdezésre vonatkozó átlagos domain pozíció egy rangsorolási tényező.
11. A kúszás mélysége rangsorolási tényező
Tartsa a fontos oldalakat közelebb a főoldalhoz:
- felső oldalak: 1 kattintás a főoldalról
- fontos oldalak: <3 kattintás
12. Továbbá: az árva oldalak rangsorolási tényezője
Ezt a weboldal auditáló eszközünk segítségével találhatja meg
13. A főoldalakról származó backlinkek fontosabbak, mint a belső oldalakról származóak.
14. A webhelye/url keresési lekérdezéseinek száma rangsorolási tényező
Minél több, annál jobb
15. A Wikipédia forgalma rangsorolási tényező
16. Ha az url lenne az utolsó a keresési munkamenet (a felhasználó megtalálja, amire szüksége van) - ez hatással lenne a rangsorolásra.
Ennek vannak szigorú és kiszámítható tényezői is.
17. Könyvjelzők rangsorolási tényező
Minél több felhasználó ad hozzá könyvjelzőkhöz egy url-t, annál nagyobb tényező értéke van.
18. Speciális rangsorolási tényezők rövid videókra (tiktok, rövidfilmek, tekercsek)
19. Térképek js-api az oldalon (például Google Maps) egy rangsorolási tényező
A Google-ban (például az utazás területén) a hasznos információkkal/funkciókkal ellátott térképek hozzáadása szintén működik.
20. Az URL-ben szereplő kulcsszavak rangsorolási tényezők
Amint a leírásból láthatjuk - az optimális legfeljebb 3 szót tartalmazhat a keresési lekérdezésből.
21. A visszatérő felhasználók rangsorolási tényező
Építsen jó megtartású termékeket, és ez jótékony hatással lesz a SEO-jára (ennek mérésére számos rangsorolási tényező van).
22. A nagybetűk aránya a <title>-ben rangsoroló tényező
23. A közvetlen forgalom százalékos aránya rangsoroló tényező
Aka. Ha az összes forgalma az organikus keresésből származik - ez gyanús + rossz a rangsorolás szempontjából.
24. Még egy rangsorolási tényező a tartalom minőségére - törött beágyazott videó az oldalon
- Beágyazott videók - jó a rangsoroláshoz.
- Törött beágyazott videók - rossz.
25. Ellenőrzött fiókok a közösségi hálózatokon másképp rangsorolnak, mint más url-ok.
Fontos a márkakereséseknél - ideális esetben a márkájára keresve csak az Ön domainjei + ellenőrzött közösségi hálózatok szerepelnek a top 10-ben.
26. Ha a backlinkek horgonyai tartalmazzák a kulcsszavak összes szavát - ez jó a SEO számára.
Ha ez egy linkben van - ez előnyösebb. Különösen, ha a szavak sorrendje ugyanaz.
27. A "jó" vs. "rossz" backlinkek aránya rangsorolási tényező
![A "jó" vs. "rossz" backlinkek aránya rangsorolási tényező](https://www.ranktracker.com/media/yandex-leaked-code-containing-search-ranking-factors-ranktracker-explains-all-ranking-factors/images/i84.png "A "jó" vs. "rossz" backlinkek aránya rangsorolási tényező"))
28. A domain szövegek minőségi rangsora rangsorolási tényező
Az alacsony minőségű tartalommal rendelkező oldalak az egész domainre hatással vannak.
29. A hirdetések mennyisége egy oldalon rangsorolási tényező
30. Van véletlenszerűség, mint külön rangsorolási tényező.
Ha nem érti, hogy miért vannak egyes oldalak a tetején - ez lehet, hogy csak véletlenszerű (a viselkedési tényezők tesztelésére).
31. A Google Analyticsből származó JS rangsorolási tényező
Kiszámíthatóan. A jó webhelyek gyakrabban használják a GA / Google Analytics-et, mint a rossz webhelyek.
32. A PageRank szerint a 100 legjobb weboldalról származó backlinkek hatása a rangsorolásra
33. Az URL nem tartalmaz számjegyeket
❌ /100-legjobb-hitelkártyák
✅ /best-credit-cards
34. Az URL-ben lévő írásjelek száma
❌ /finance/articles/2023/investment-advices
✅ /befektetési tanácsok
35. A nem betűk száma az URL-ben
❌ /pet-toys&all$currency=dollar#mobile
✅ /pet-toys
36. '?' szimbólum az URL-ben rangsorolási tényező
❌ /movies?genre=action
✅ /action-movies
37. Keresőkérdés = URL, pontokkal és szóközökkel (??)
A keresési lekérdezés "Franklin D. Roosevelt":
❌ /roosevelt
✅ /Franklin_D._Roosevelt
38. Régi dátum az URL-ben
❌ /2009/12/01/how-to-tie-a-tie-a-tie
✅ /how-to-tie-a-tie-a-tie
39. A kulcsszavak az URL-ben vannak, nem az oldal szövegében.
❌ /video-játékok & az oldal a zenéről szól
✅ /video-games & oldal a videojátékokról szól
40. URL lefedettség a keresési lekérdezésből származó trigrammákkal
✅ /hotelek-új-zéland
❌ /nz
❌ /olcsó-hotelek-új-zélandon-legjobb-ajánlatok
- Az URL-címben szerepeljen 1-3 legfontosabb szó;
- Kevesebb ferde betű/számjegy/nem betű, ha nem része a kulcsszónak.
41. a Yandex rangsorolási tényezők kezdeti súlyai
Az AI(mátrixnet) által kiszámított végső súlyok, de a kezdeti értékek is hasznosak.
Következtetés
Nos, ez minden, amit egyelőre megosztunk. Még csak most kezdtük el. Ez egy durva áttekintést nyújt az önök számára arról, hogy mi van benne.
Itt még csak a felszínt kapargatjuk, és még sok értékes betekintés vár ránk.
De sok feltételezésünk és kívülről jövő értelmezésünk, hogy egy ilyen kiterjedt keresőmotor hogyan fog működni, legalábbis a linkek tekintetében, teljesen igaz volt.
Mindent egybevetve, a Yandex kódszivárgás lenyűgöző betekintést nyújt egy modern keresőmotor belső működésébe.
Az All-in-One platform a hatékony SEO-hoz
Minden sikeres vállalkozás mögött egy erős SEO kampány áll. De a számtalan optimalizálási eszköz és technika közül lehet választani, ezért nehéz lehet tudni, hol kezdjük. Nos, ne félj tovább, mert van egy ötletem, ami segíthet. Bemutatom a Ranktracker all-in-one platformot a hatékony SEO-ért.
Végre megnyitottuk a Ranktracker regisztrációt teljesen ingyenesen!
Ingyenes fiók létrehozásaVagy Jelentkezzen be a hitelesítő adatokkal
Bár nem minden megállapítás alkalmazható közvetlenül a Google-ra, számos, az elmúlt években a nagy internetes keresőmotorok általános működésével kapcsolatban megfogalmazott feltételezés megerősítést nyert.
Feltételezem, hogy a SEO-iparágnak még néhány érdekes hónap áll előttünk a kiszivárgásból származó új ismeretekkel.
Tartsa szemmel ezt az oldalt, mivel az elkövetkező hetekben és hónapokban folyamatosan bővítjük a rangsorolási tényezőket.
Különleges kreditpontok a https://twitter.com/alex_buraks címre