Intro
I løpet av den siste ferieperioden dukket det opp innlegg på sosiale medier angående en påstått lekkasje av data relatert til Googles rangeringsalgoritmer. De første diskusjonene rundt disse lekkasjene fokuserte på å "bekrefte" langvarige oppfatninger fra personer som Rand Fishkin, men manglet kontekst om dataenes sanne natur.
Konteksten er viktig: Dokument AI Warehouse
De lekkede dataene ser ut til å være relatert til Googles Document AI Warehouse, en offentlig Google Cloud-plattform som brukes til å analysere, organisere, søke og lagre data. Denne offentlige dokumentasjonen har tittelen "Document AI Warehouse overview". Innlegg på plattformer som Facebook antyder at de lekkede dataene er en "intern versjon" av denne offentlig tilgjengelige dokumentasjonen, noe som indikerer at de kanskje ikke er eksklusive for Googles søkeoperasjoner.
Lekkasje av interne søkedata?
Det opprinnelige innlegget på SparkToro hevdet ikke at dataene var fra Google Søk, men uttalte at kilden som leverte dataene til Rand Fishkin kom med denne påstanden. Fishkin, kjent for sin grundige tilnærming, bemerket at påstanden om at dataene stammet fra Google Søk kom fra personen som sendte ham en e-post, ikke fra verifiserte kilder.
Fishkin siterte e-posten:
"Jeg mottok en e-post fra en person som hevdet å ha tilgang til en massiv lekkasje av API-dokumentasjon fra Googles søkeavdeling."
Til tross for dette kunne eks-Googlere som Fishkin konsulterte, bare bekrefte at dataene lignet på intern Google-informasjon, men ikke eksplisitt bekrefte at de kom fra Google Søk.
Innsikt fra tidligere googlere
Ex-Googlers kommenterte:
-
"Jeg hadde ikke tilgang til denne koden da jeg jobbet der. Men dette ser absolutt legitimt ut."
-
"Det har alle kjennetegnene til et internt Google API."
-
"Det er et Java-basert API. Og noen har brukt mye tid på å følge Googles egne interne standarder for dokumentasjon og navngivning."
-
"Jeg trenger mer tid for å være sikker, men dette stemmer overens med den interne dokumentasjonen jeg er kjent med."
-
"Ingenting jeg så i en kort gjennomgang tyder på at dette er noe annet enn legitimt."
Disse uttalelsene understreker at selv om dataene ser ekte ut, er det ikke noe definitivt bevis på at de kommer fra Google Søk.
Å ha et åpent sinn
Det er viktig å ha et åpent sinn når det gjelder disse dataene, siden mye av dem fortsatt er ubekreftet. Hvis man trekker forhastede konklusjoner eller bruker dataene til å bekrefte allerede eksisterende oppfatninger, kan det føre til bekreftelsesskjevhet, der man tolker informasjon på en måte som styrker eksisterende oppfatninger.
Definisjon av bekreftelsesskjevhet:
"Bekreftelsesskjevhet er tendensen til å søke etter, tolke, favorisere og huske informasjon på en måte som bekrefter eller støtter ens tidligere oppfatninger eller verdier."
Viktige spørsmål om datalekkasjen fra Google
-
Konteksten til den lekkede informasjonen: Er dataene relatert til Google Søk eller andre formål?
-
Formålet med dataene: Ble de brukt til faktiske søkeresultater, eller til intern datahåndtering eller -manipulering?
-
Bekreftelse fra eks-googlere: Eks-googlerne bekreftet ikke at dataene er spesifikke for Google Søk, bare at de ser ut til å komme fra Google.
-
Analyse med åpent sinn: Unngå å bruke dataene til å bekrefte oppfatninger du har hatt lenge, for å unngå bekreftelsesskjevhet.
-
Relasjon til Document AI Warehouse: Mye tyder på at dataene kan være relatert til et eksternt API for å bygge et dokumentlager i stedet for Google Søk.
Ekspertuttalelser om de "lekkede" dataene
SEO-ekspert Ryan Jones delte:
-
Usikkerhet om dataene er for produksjon eller testing.
-
Uklarhet om det er for nettsøk eller andre vertikaler som Google Home eller News.
-
Spekulasjoner om at noen felter bare gjelder for treningsdatasett, ikke for alle områder.
DavidGQuaid twitret:
Alt-i-ett-plattformen for effektiv søkemotoroptimalisering
Bak enhver vellykket bedrift ligger en sterk SEO-kampanje. Men med utallige optimaliseringsverktøy og teknikker der ute å velge mellom, kan det være vanskelig å vite hvor du skal begynne. Vel, frykt ikke mer, for jeg har akkurat det som kan hjelpe deg. Vi presenterer Ranktracker alt-i-ett-plattformen for effektiv SEO.
Vi har endelig åpnet registreringen til Ranktracker helt gratis!
Opprett en gratis kontoEller logg inn med påloggingsinformasjonen din
"Vi vet ikke om dette er for Google-søk eller Google Cloud Document Retrieval. API-er virker valgfrie - det er ikke slik jeg forventer at algoritmen skal kjøres - hva om en ingeniør ønsker å hoppe over alle disse kvalitetskontrollene - dette ser ut som om jeg ønsker å bygge en innholdslager-app for bedriftens kunnskapsbase."
Konklusjon
Foreløpig finnes det ingen konkrete bevis for at de "lekkede" dataene kommer fra Google Søk. Konteksten og formålet med dataene er fortsatt tvetydig, og mye tyder på at det dreier seg om et eksternt API for dokumenthåndtering snarere enn en kjernekomponent i Googles søkealgoritme. Det er viktig å nærme seg denne informasjonen med forsiktighet og unngå å trekke definitive konklusjoner uten ytterligere verifisering.