介绍
谷歌搜索内部排名文档的大规模泄露在搜索引擎优化界引起了震动。这次泄露暴露了超过 14,000 项潜在的排名功能,让人们前 所未有地看到了谷歌严密保护的搜索排名系统的秘密。
泄漏背后的故事
Erfan Azimi与SparkToro的Rand Fishkin分享了谷歌API文件泄露事件,后者随后邀请iPullRank的Michael King帮助传播该信息。泄露的文件来自名为 "yoshi-code-bot /elixer-google-api "的谷歌 API 文档提交,并非黑客或告密者所为,而是一次内部文档发布。
泄漏概述
这次泄露提供了谷歌排名因素的全面视图,揭示了 PageRank 变化、网站权威度量等方面的见解。以下是详细分析:
谷歌搜索文档泄露事件的重要启示
页面排名及其变化
-
PageRank_NS:现已弃用,该算法与文档理解相关,修改了传统的 PageRank,将重点放在种子节点周围网络的局部子集上。
-
PageRank 的七种类型:谷歌提到了七种不同类型的 PageRank,其中包括著名的 ToolBarPageRank。这些变化表明,谷歌采用了多种方法来评估页面的重要性。
商业模式识别
谷歌的算法可以识别各种商业模式,包括新闻网站、YMYL(Your Money or Your Life)网站、个人博客、电子商务和视频网站。专门对个人博客进行过滤的原因尚不清楚,这也让人对谷歌更广泛的意图产生了疑问。
算法组件
-
NavBoost:基于用户行为和点击日志的重新排名机制,深受 Chrome 浏览器数据的影响。
-
NSR(归一化网站排名):用于计算主机级网站块的网站排名。
-
ChardScores:根据内容预测网站/网页质量的网站级分数。