Introduzione
Durante le recenti festività natalizie, sono emersi post sui social media riguardanti una presunta fuga di dati relativi agli algoritmi di ranking di Google. Le discussioni iniziali su questa fuga di notizie si sono concentrate sulla "conferma" di convinzioni sostenute da tempo da personaggi come Rand Fishkin, ma non hanno contestualizzato la vera natura dei dati.
Il contesto conta: Magazzino di intelligenza artificiale dei documenti
I dati trapelati sembrano riguardare il Document AI Warehouse di Google, una piattaforma pubblica di Google Cloud utilizzata per analizzare, organizzare, cercare e archiviare i dati. La documentazione pubblica è intitolata "Document AI Warehouse overview". I post su piattaforme come Facebook suggeriscono che i dati trapelati sono una "versione interna" di questa documentazione disponibile pubblicamente, indicando che potrebbero non essere esclusivi delle operazioni di Google Search.
Perdita di dati di ricerca interni?
Il post originale su SparkToro non sosteneva che i dati provenissero da Google Search, ma affermava che la fonte che aveva fornito i dati a Rand Fishkin aveva fatto questa affermazione. Fishkin, noto per il suo approccio meticoloso, ha fatto notare che l'affermazione sulla provenienza dei dati da Google Search proveniva dalla persona che gli aveva inviato un'e-mail, non da fonti verificate.
Fishkin ha citato l'e-mail:
"Ho ricevuto un'e-mail da una persona che sostiene di avere accesso a una massiccia fuga di documenti API dall'interno della divisione Search di Google".
Ciononostante, gli ex-Googlers consultati da Fishkin hanno potuto solo confermare che i dati assomigliavano alle informazioni interne di Google, ma non hanno verificato esplicitamente che provenissero da Google Search.
Approfondimenti da parte di ex-giocatori
Gli ex-giocatori hanno commentato:
-
"Non avevo accesso a questo codice quando lavoravo lì. Ma questo sembra certamente legittimo".
-
"Ha tutte le caratteristiche di un'API interna di Google".
-
"È un'API basata su Java. E qualcuno ha dedicato molto tempo a rispettare gli standard interni di Google per la documentazione e la denominazione".
-
"Avrei bisogno di più tempo per esserne sicuro, ma questo corrisponde alla documentazione interna che conosco".
-
"Nulla di ciò che ho visto in una breve recensione suggerisce che si tratti di qualcosa di diverso dalla legittimità".
Queste dichiarazioni evidenziano che, sebbene i dati sembrino autentici, non vi è alcuna prova definitiva che provengano da Google Search.
Mantenere una mentalità aperta
È fondamentale mantenere una mentalità aperta su questi dati, poiché molti di essi non sono ancora stati verificati. Saltare alle conclusioni o usare i dati per confermare convinzioni preesistenti può portare a pregiudizi di conferma, quando si interpretano le informazioni in modo da rafforzare le proprie opinioni.
Definizione di bias di conferma:
"Il bias di conferma è la tendenza a cercare, interpretare, favorire e ricordare le informazioni in modo da confermare o sostenere le proprie convinzioni o valori precedenti".
Domande chiave sulla fuga di dati di Google
-
Contesto delle informazioni trapelate: I dati sono legati alla ricerca di Google o ad altri scopi?
-
Scopo dei dati: Sono stati utilizzati per ottenere risultati di ricerca effettivi o per la gestione o la manipolazione interna dei dati?
-
Conferma da parte degli ex-googler: Gli ex-Googlers non hanno confermato che i dati siano specifici di Google Search, ma solo che sembrano provenire da Google.
-
Analisi a mente aperta: Evitare di utilizzare i dati per confermare le convinzioni di lunga data, per evitare pregiudizi di conferma.
-
Relazione con il Document AI Warehouse: Le prove suggeriscono che i dati possono riguardare un'API esterna per la creazione di un magazzino di documenti piuttosto che Google Search.
Opinioni degli esperti sui dati "trapelati
L'esperto SEO Ryan Jones ha condiviso:
-
Incertezza se i dati sono per la produzione o per i test.
-
Manca la chiarezza se si tratta di ricerca web o di altri verticali come Google Home o News.
-
Si ipotizza che alcuni campi si applichino solo ai set di dati di formazione e non a tutti i siti.
DavidGQuaid ha twittato:
La piattaforma all-in-one per un SEO efficace
Dietro ogni azienda di successo c'è una forte campagna SEO. Ma con innumerevoli strumenti e tecniche di ottimizzazione tra cui scegliere, può essere difficile sapere da dove iniziare. Ebbene, non temete più, perché ho quello che fa per voi. Vi presento la piattaforma Ranktracker all-in-one per una SEO efficace.
Abbiamo finalmente aperto la registrazione a Ranktracker in modo assolutamente gratuito!
Creare un account gratuitoOppure accedi con le tue credenziali
"Non sappiamo se è per la ricerca di Google o per il recupero di documenti nel cloud di Google. Le API sembrano scegliere - non è così che mi aspetto che venga eseguito l'algoritmo - e se un ingegnere volesse saltare tutti i controlli di qualità - sembra che io voglia costruire un'applicazione di content warehouse per la mia knowledge base aziendale".
Conclusione
Al momento non ci sono prove concrete che i dati "trapelati" provengano da Google Search. Il contesto e lo scopo dei dati rimangono ambigui, con indicazioni che indicano che si tratta di un'API esterna per la gestione dei documenti piuttosto che di un componente centrale dell'algoritmo di ricerca di Google. È essenziale affrontare queste informazioni con cautela ed evitare di trarre conclusioni definitive senza ulteriori verifiche.