介绍
在最近的假期期间,社交媒体上出现了一些关于谷歌排名算法数据泄露的帖子。最初围绕这些泄露事件的讨论主要集中在 "证实 "兰德-菲什金(Rand Fishkin)等人长期以来的观点,但缺乏有关数据真实性质的背景资料。
语境至关重要:文档 AI 仓库
泄露的数据似乎与谷歌的文档人工智能仓库(Document AI Warehouse)有关,这是一个用于分析、组织、搜索和存储数据的谷歌云公共平台。这份公开文档的标题是 "Document AI Warehouse overview"。Facebook 等平台上的帖子显示,泄露的数据是这份公开文档的 "内部版本",这表明它可能不是谷歌搜索业务的专属数据。
内部搜索数据泄露?
SparkToro 上的原始帖子并未声称这些数据来自谷歌搜索,而是说向兰德-菲什金提供数据的消息来源做出了这一断言。以一丝不苟著称的 Fishkin 指出,关于数据来自谷歌搜索的说法来自给他发电子邮件的人,而不是经过核实的消息来源。
菲什金引用了这封电子邮件:
"我收到了一封来自一个人的电子邮件,他声称可以从谷歌搜索部门内部获得大量泄漏的 API 文档"。
尽管如此,Fishkin 咨询的前谷歌人员只能确认这些数据与谷歌内部信息相似,但并未明确证实这些数据来自谷歌搜索。
前 Googlers 的见解
前 Googlers 评论说:
-
"我在那里工作的时候没有机会接触到这个代码。但这看起来肯定是合法的。"
-
"它具有谷歌内部应用程序接口的所有特征"。
-
"这是一个基于 Java 的 API。有人花了很多时间来遵守谷歌内部的文档和命名标准"。
-
"我需要更多时间才能确定" "但这与我熟悉的内部文件相符"
-
"我在简短的评论中没有看到任何迹象表明这不是合法的"。
这些声明强调,虽然这些数据看起来是真实的,但并没有确凿证据证明它们来自谷歌搜索。
保持开放的心态
关键是要对这些数据保持开放的态度,因为其中许多数据仍未得到证实。匆忙下结论或利用数据来证实已有的信念可能会导致证实偏见,即人们在解释信息时会强化自己已有的观点。
确认偏见的定义:
"证实性偏见是一种以证实或支持自己先前的信念或价值观的方式搜索、解释、偏爱和回忆信息的倾向"。
关于谷歌数据泄露的关键问题
-
泄露信息的背景:数据与谷歌搜索有关还是有其他用途?
-
数据的目的:是用于实际搜索结果,还是用于内部数据管理或操作?
-
前谷歌人确认:前谷歌人并没有确认这些数据是专门针对谷歌搜索的,只是说这些数据似乎来自谷歌。
-
开明分析:避免用数据来证实长期持有的信念,以防止证实偏见。
-
与文档 AI 仓库的关系:有证据表明,这些数据可能与建立文档仓库的对外 API 有关,而不是与谷歌搜索有关。
专家对 "泄露 "数据的看法
搜索引擎优化专家 Ryan Jones 分享道:
-
不确定数据是用于生产还是测试。
-
不清楚是针对网络搜索还是 Google Home 或新闻等其他垂直领域。
-
推测某些字段只适用于训练数据集,而不是所有站点。
大卫-奎德在推特上写道:
有效SEO的一体化平台
每个成功的企业背后都有一个强大的SEO活动。但是,有无数的优化工具和技术可供选择,很难知道从哪里开始。好了,不要再害怕了,因为我已经得到了可以帮助的东西。介绍一下Ranktracker有效的SEO一体化平台
"我们不知道这是用于 Google 搜索还是 Google 云文档检索。应用程序接口似乎挑三拣四--这不是我期望的算法运行方式--如果工程师想跳过所有这些质量检查怎么办--这看起来像是我想为我的企业知识库建立一个内容仓库应用程序。"
结论
目前,还没有具体证据表明 "泄露 "的数据来自谷歌搜索。数据的背景和目的仍然模糊不清,有迹象表明它是一个面向外部的文档管理 API,而不是谷歌搜索算法的核心组件。在没有进一步核实之前,必须谨慎对待这些信息,避免得出明确的结论。