Úvod
Počas nedávnych sviatkov sa na sociálnych sieťach objavili príspevky týkajúce sa údajného úniku údajov s úvisiacich s algoritmami hodnotenia spoločnosti Google. Prvotné diskusie okolo týchto únikov sa zameriavali na "potvrdenie" dlhodobých názorov osobností, ako je Rand Fishkin, ale chýbal kontext skutočnej povahy údajov.
Na kontexte záleží: Sklad AI dokumentov
Zdá sa, že uniknuté údaje súvisia s Document AI Warehouse spoločnosti Google, verejnou platformou Google Cloud, ktorá sa používa na analýzu, organizovanie, vyhľadávanie a ukladanie údajov. Táto verejná dokumentácia má názov "Prehľad Document AI Warehouse". Príspevky na platformách ako Facebook naznačujú, že uniknuté údaje sú "internou verziou" tejto verejne dostupnej dokumentácie, čo naznačuje, že sa nemusia týkať výlučne operácií vyhľadávania Google.
Únik údajov z interného vyhľadávania?
V pôvodnom príspevku na SparkToro sa netvrdilo, že údaje pochádzajú z vyhľadávača Google, ale uviedol sa zdroj, ktorý údaje poskytol Randovi Fishkinovi. Fishkin, známy svojím puntičkárskym prístupom, poznamenal, že tvrdenie o údajoch pochádzajúcich z vyhľadávača Google pochádza od osoby, ktorá mu poslala e-mail, a nie z overených zdrojov.
Fishkin citoval e-mail:
"Dostal som e-mail od osoby, ktorá tvrdí, že má prístup k rozsiahlemu úniku dokumentácie API z divízie vyhľadávania spoločnosti Google."
Napriek tomu bývalí pracovníci spoločnosti Google, ktorých Fishkin oslovil, mohli len potvrdiť, že údaje sa podobajú interným informáciám spoločnosti Google, ale výslovne neoverili, že pochádzajú z vyhľadávania Google.
Poznatky od bývalých používateľov služby Google
Bývalí Google komentovali:
-
"Keď som tam pracoval, nemal som prístup k tomuto kódu. Ale určite to vyzerá dôveryhodne."
-
"Má všetky znaky interného rozhrania API spoločnosti Google."
-
"Je to rozhranie API založené na jazyku Java. A niekto strávil veľa času dodržiavaním interných štandardov spoločnosti Google pre dokumentáciu a pomenovanie."
-
"Potreboval by som viac času, aby som si bol istý, ale toto zodpovedá internej dokumentácii, ktorú poznám."
-
"Nič, čo som videl v krátkom prehľade, nenaznačuje, že by to bolo niečo iné ako legitímne."
Tieto vyhlásenia zdôrazňujú, že hoci údaje vyzerajú pravé, neexistuje jednoznačný dôkaz, že pochádzajú z vyhľadávania Google.
Otvorená myseľ
Je veľmi dôležité, aby sme boli voči týmto údajom otvorení, pretože mnohé z nich nie sú overené. Unáhlený záver alebo použitie údajov na potvrdenie už existujúcich presvedčení môže viesť k potvrdzujúcemu skresleniu, keď človek interpretuje informácie spôsobom, ktorý posilňuje jeho existujúce názory.
Definícia konfirmačného skreslenia:
"Potvrdzovacia predpojatosť je tendencia vyhľadávať, interpretovať, uprednostňovať a pripomínať si informácie spôsobom, ktorý potvrdzuje alebo podporuje naše predchádzajúce presvedčenie alebo hodnoty."
Kľúčové otázky týkajúce sa úniku údajov spoločnosti Google
-
Kontext uniknutých informácií: Súvisia tieto údaje s vyhľadávaním Google alebo s inými účelmi?
-
Účel údajov: Boli použité na skutočné výsledky vyhľadávania alebo na internú správu údajov či manipuláciu s nimi?
-
Potvrdenie od bývalých Google: Ex-Googleri nepotvrdili, že tieto údaje sú špecifické pre vyhľadávanie Google, iba to, že zrejme pochádzajú od spoločnosti Google.
-
Otvorená analýza: Vyhnite sa používaniu údajov na potvrdenie dlhodobých presvedčení, aby ste predišli konfirmačnému skresleniu.
-
Vzťah k úložisku AI dokumentov: Dôkazy naznačujú, že údaje sa môžu týkať skôr externého rozhrania API na vytvorenie skladu dokumentov než vyhľadávania Google.
Názory odborníkov na "uniknuté" údaje
Expert na SEO Ryan Jones sa podelil o:
-
Neistota, či sú údaje určené na výrobu alebo testovanie.
-
Nie je jasné, či ide o webové vyhľadávanie alebo iné vertikály, ako napríklad Google Home alebo News.
-
Špekulácie, že niektoré polia sa vzťahujú len na tréningové súbory údajov, nie na všetky lokality.
DavidGQuaid tweetoval:
Platforma "všetko v jednom" pre efektívne SEO
Za každým úspešným podnikaním stojí silná kampaň SEO. Pri nespočetnom množstve optimalizačných nástrojov a techník, z ktorých si môžete vybrať, však môže byť ťažké zistiť, kde začať. No už sa nemusíte báť, pretože mám pre vás presne to, čo vám pomôže. Predstavujem komplexnú platformu Ranktracker na efektívne SEO
Konečne sme otvorili registráciu do nástroja Ranktracker úplne zadarmo!
Vytvorenie bezplatného kontaAlebo sa pri hláste pomocou svojich poverení
"Nevieme, či ide o vyhľadávanie Google alebo vyhľadávanie dokumentov v cloude Google. Zdá sa, že API si vyberá - takto neočakávam, že algoritmus bude prebiehať - čo ak chce inžinier preskočiť všetky tie kontroly kvality - toto vyzerá, že chcem vytvoriť aplikáciu skladu obsahu pre svoju podnikovú znalostnú databázu."
Záver
V súčasnosti neexistujú žiadne konkrétne dôkazy o tom, že "uniknuté" údaje pochádzajú z vyhľadávania Google. Kontext a účel týchto údajov zostáva nejednoznačný, pričom náznaky naznačujú, že ide skôr o externé rozhranie API na správu dokumentov než o základnú zložku vyhľadávacieho algoritmu spoločnosti Google. Je nevyhnutné pristupovať k týmto informáciám opatrne a bez ďalšieho overenia nevyvodzovať definitívne závery.