Wprowadzenie
W ostatnim okresie świątecznym w mediach społecznościowych pojawiły się posty dotyczące rzekomego wycieku danych związanych z algorytmami rankingowymi Google. Początkowe dyskusje wokół tych wycieków koncentrowały się na "potwierdzeniu" od dawna utrzymywanych przekonań takich postaci jak Rand Fishkin, ale brakowało im kontekstu na temat prawdziwej natury danych.
Kontekst ma znaczenie: Magazyn AI dokumentów
Dane, które wyciekły, wydają się być związane z Google Document AI Warehouse, publiczną platformą Google Cloud używaną do analizowania, organizowania, wyszukiwania i przechowywania danych. Ta publiczna dokumentacja nosi tytuł "Document AI Warehouse overview". Posty na platformach takich jak Facebook sugerują, że wyciekłe dane są "wewnętrzną wersją" tej publicznie dostępnej dokumentacji, co wskazuje, że mogą one nie dotyczyć wyłącznie operacji w wyszukiwarce Google.
Wyciek wewnętrznych danych wyszukiwania?
W oryginalnym poście na SparkToro nie twierdzono, że dane pochodzą z wyszukiwarki Google, ale podano, że źródło, które dostarczyło dane Randowi Fishkinowi, złożyło takie oświadczenie. Fishkin, znany ze swojej skrupulatności, zauważył, że twierdzenie o danych pochodzących z wyszukiwarki Google pochodziło od osoby, która wysłała mu e-mail, a nie ze zweryfikowanych źródeł.
Fishkin zacytował e-mail:
"Otrzymałem wiadomość e-mail od osoby twierdzącej, że ma dostęp do ogromnego wycieku dokumentacji API z działu wyszukiwania Google".
Pomimo tego, byli Googlersi, z którymi konsultował się Fishkin, mogli jedynie potwierdzić, że dane przypominają wewnętrzne informacje Google, ale nie zweryfikowali jednoznacznie, że pochodzą one z wyszukiwarki Google.
Spostrzeżenia byłych użytkowników Google
Ex-Googlers skomentował:
-
"Nie miałem dostępu do tego kodu, kiedy tam pracowałem. Ale z pewnością wygląda to legalnie".
-
"Ma wszystkie cechy wewnętrznego interfejsu API Google".
-
"To API oparte na Javie. Ktoś poświęcił dużo czasu na przestrzeganie wewnętrznych standardów Google dotyczących dokumentacji i nazewnictwa".
-
"Potrzebowałbym więcej czasu, aby mieć pewność, ale jest to zgodne z wewnętrzną dokumentacją, którą znam".
-
"Nic, co widziałem w krótkim przeglądzie, nie sugeruje, że jest to coś innego niż legalne".
Oświadczenia te podkreślają, że chociaż dane wyglądają na autentyczne, nie ma ostatecznego dowodu na to, że pochodzą z wyszukiwarki Google.
Zachowanie otwartego umysłu
Kluczowe jest zachowanie otwartego umysłu w odniesieniu do tych danych, ponieważ wiele z nich pozostaje niezweryfikowanych. Wyciąganie pochopnych wniosków lub wykorzystywanie danych do potwierdzenia wcześniejszych przekonań może prowadzić do błędu systematycznego potwierdzania, w którym interpretuje się informacje w sposób, który wzmacnia ich istniejące poglądy.
Definicja błędu systematycznego:
"Uprzedzenie potwierdzające to tendencja do wyszukiwania, interpretowania, faworyzowania i przywoływania informacji w sposób, który potwierdza lub wspiera wcześniejsze przekonania lub wartości".
Kluczowe pytania dotyczące wycieku danych Google
-
Kontekst wycieku informacji: Czy dane są związane z wyszukiwarką Google lub innymi celami?
-
Cel danych: Czy były one wykorzystywane do rzeczywistych wyników wyszukiwania, czy do wewnętrznego zarządzania danymi lub manipulacji nimi?
-
Potwierdzenie od byłych Google'owców: Ex-Googlersi nie potwierdzili, że dane są specyficzne dla wyszukiwarki Google, a jedynie, że wydają się pochodzić od Google.
-
Otwarta analiza: Unikaj wykorzystywania danych do potwierdzania od dawna utrzymywanych przekonań, aby zapobiec tendencyjności.
-
Związek z hurtownią dokumentów AI: Dowody sugerują, że dane mogą odnosić się do zewnętrznego interfejsu API do tworzenia magazynu dokumentów, a nie do wyszukiwarki Google.
Opinie ekspertów na temat "wyciekłych" danych
Ekspert SEO Ryan Jones podzielił się tą informacją:
-
Niepewność, czy dane są przeznaczone do produkcji czy testów.
-
Brak jasności, czy chodzi o wyszukiwanie w sieci, czy o inne branże, takie jak Google Home lub Wiadomości.
-
Spekulacje, że niektóre pola mają zastosowanie tylko do zestawów danych szkoleniowych, a nie do wszystkich witryn.
DavidGQuaid napisał na Twitterze:
Platforma "wszystko w jednym" dla skutecznego SEO
Za każdym udanym biznesem stoi silna kampania SEO. Ale z niezliczonych narzędzi optymalizacji i technik tam do wyboru, może być trudno wiedzieć, gdzie zacząć. Cóż, nie obawiaj się więcej, ponieważ mam właśnie coś, co może pomóc. Przedstawiamy Ranktracker - platformę all-in-one dla skutecznego SEO.
W końcu otworzyliśmy rejestrację do Ranktrackera całkowicie za darmo!
Załóż darmowe kontoLub Zaloguj się używając swoich danych uwierzytelniających
"Nie wiemy, czy jest to aplikacja do wyszukiwania w Google, czy do wyszukiwania dokumentów w chmurze Google. Interfejsy API wydają się wybierać i wybierać - nie tego oczekuję od algorytmu - co jeśli inżynier chce pominąć wszystkie te kontrole jakości - wygląda na to, że chcę zbudować aplikację magazynu treści dla mojej bazy wiedzy przedsiębiorstwa".
Wnioski
Obecnie nie ma konkretnych dowodów na to, że "wyciekłe" dane pochodzą z wyszukiwarki Google. Kontekst i cel danych pozostają niejednoznaczne, a wskazówki wskazują, że jest to zewnętrzny interfejs API do zarządzania dokumentami, a nie podstawowy składnik algorytmu wyszukiwania Google. Ważne jest, aby podchodzić do tych informacji z ostrożnością i unikać wyciągania ostatecznych wniosków bez dalszej weryfikacji.