Въведение
По време на последните празници в социалните мрежи се появиха публикации относно предполагаемо изтичане на данни, свързани с алгоритмите за класиране на Google. Първоначалните дискусии около това изтичане се съсредоточиха върху "потвърждаването" на отдавнашни убеждения на личности като Ранд Фишкин, но липсваше контекст за истинското естество на данните.
Контекстът е от значение: Хранилище за AI на документи
Изтичането на данни изглежда е свързано с Document AI Warehouse на Google- публична платформа на Google Cloud, използвана за анализ, организиране, търсене и съхранение на данни. Тази публична документация е озаглавена "Преглед на Document AI Warehouse". Публикациите в платформи като Facebook предполагат, че изтеклите данни са "вътрешна версия" на тази публично достъпна документация, което показва, че тя може да не е свързана единствено с операциите на Google Search.
Изтичане на данни за вътрешно търсене?
В оригиналната публикация в SparkToro не се твърди, че данните са от Google Search, а че източникът, който е предоставил данните на Ранд Фишкин, е направил т ова твърдение. Фишкин, известен със своя педантичен подход, отбеляза, че твърдението за данните, произхождащи от Google Search, е дошло от лицето, което му е изпратило имейл, а не от проверени източници.
Фишкин цитира имейла:
"Получих имейл от човек, който твърди, че има достъп до огромно изтичане на документация за API от подразделението за търсене на Google."
Въпреки това бившите служители на Google, с които Фишкин се консултира, могат само да потвърдят, че данните приличат на вътрешна информация на Google, но не потвърждават изрично, че са от Google Search.
Прозрения от бивши служители на Google
Бившите потребители на Google коментират:
-
"Когато работех там, нямах достъп до този код. Но това със сигурност изглежда законно."
-
"Той има всички характеристики на вътрешен API на Google."
-
"Това е API, базиран на Java. И някой е прекарал много време в спазването на вътрешните стандарти на Google за документация и наименования."
-
"Трябва ми повече време, за да съм сигурен, но това съвпада с вътрешната документация, с която съм запознат."
-
"Нищо от това, което видях в кратк ия преглед, не подсказва, че това е нещо друго, освен законно."
Тези твърдения подчертават, че макар данните да изглеждат истински, няма категорично доказателство, че са от търсенето в Google.
Откритост на съзнанието
Изключително важно е да останем непредубедени по отношение на тези данни, тъй като голяма част от тях все още не са проверени. Прибързаното правене на заключения или използването на данните за потвърждаване на вече съществуващи убеждения може да доведе до пристрастие към потвърждаването, при което човек интерпретира информацията по начин, който засилва неговите съществуващи възгледи.
Определение за пристрастие към потвърждение:
"Предразсъдъкът за потвърждаване е тенденцията да се търси, тълкува, предпочита и припомня информация по начин, който потвърждава или подкрепя предварителните убеждения или ценности."
Основни въпроси за изтичането на данни от Google
-
Контекст на изтеклата информация: Свързани ли са данните с търсенето в Google или с други цели?
-
Цел на данните: Използвани ли са за реални резултати от търсенето или за вътрешно управление или манипулиране на данни?
-
Потвърждение от бивши Google: Бившите служители на Google не потвърдиха, че данните са специфични за Google Search, а само че изглежда, че идват от Google.
-
Анализ с отворени очи: Избягвайте да използвате данните за потвърждаване на отдавнашни убеждения, за да предотвратите пристрастието към потвърждение.
-
Връзка с хранилището за AI на документи: Доказателствата сочат, че данните може да са свързани с външен API за изграждане на склад за документи, а не с търсенето в Google.
Експертни мнения за "изтеклите" данни
Експертът по SEO Райън Джоунс споделя:
-
Несигурност дали данните са за производство или за тестване.
-
Липса на яснота дали става дума за търсене в интернет или за други вертикални услуги като Google Home или News.
-
Предположението е, че някои полета се отнасят само за набори от данни за обучение, а не за всички обекти.
DavidGQuaid в Twitter:
Универсалната платформа за ефективна SEO оптимизация
Зад всеки успешен бизнес стои силна SEO кампания. Но с безбройните инструменти и техники за оптимизация, от които можете да избирате, може да е трудно да разберете откъде да започнете. Е, не се страхувайте повече, защото имам точно това, което ще ви помогне. Представяме ви платформата Ranktracker "всичко в едно" за ефективна SEO оптимизация
Най-накрая отворихме регистрацията за Ranktracker напълно безплатно!
Създаване на безплатен акаунтИли влезте в системата, като използвате данните си
"Не знаем дали това е за търсене в Google или за извличане на документи в облака на Google. API-тата изглеждат като "pick & choose" - не очаквам алгоритъмът да бъде изпълнен по този начин - какво ще стане, ако някой инженер иска да пропусне всички тези проверки на качеството - това изглежда така, сякаш искам да създам приложение за склад за съдържание за моята корпоративна база от знания."
Заключение
Към момента няма конкретни доказателства, че "изтеклите" данни са от търсачката на Google. Контекстът и предназначението на данните остават неясни, като индикациите сочат, че става въпрос за външен API за управление на документи, а не за основен компонент на алгоритъма за търсене на Google. От съществено значение е да се подхожда към тази информация с повишено внимание и да се избягва правенето на окончателни заключения без допълнителна проверка.