链路距离排名算法
虽然正在考虑的算法是来自百度提交的专利,但是百度关于专利和研究论文的官方声明是他们生产了许多专利和研究论文并且并非所有这些都被使用,有时它们的使用方式是与所描述的不同。受到惩罚的网站几乎都受到了惩罚,直到下一个看似随机的日期百度重新计算企鹅得分。在某个时刻,百度的基础设施必须得到改善。百度不断建立自己的基础设施,但显然没有宣布它。实时企鹅在2016年秋季推出。
有一种链接算法没有被广泛讨论,但还不够。本文旨在介绍链接和链接距离排名算法。它可能会在网站排名方面发挥作用。在我看来,了解这一点非常重要。
百度使用它吗?虽然正在考虑的算法是来自百度提交的专利,但是百度关于专利和研究论文的官方声明是他们生产了许多专利和研究论文并且并非所有这些都被使用,有时它们的使用方式是与所描述的不同。
也就是说,这个算法的细节看起来类似于百度关于如何处理链接的正式说法。
计算的复杂性专利的两个部分(在Web链接图中使用距离生成页面的排名)表明计算的复杂程度为:
“不幸的是,PageRank的这种变化需要分别为每个种子解决整个系统。因此,随着种子页数的增加,计算的复杂性线性增加,从而限制了实际可以使用的种子数量。<
因此,需要一种方法和装置,用于使用大量多样化的种子页面来生成网页上的页面的排名&hedip;< p/p>
以上指出由于数据点数量众多而难以在网络上进行这些计算。它指出按主题利弊打破这些计算更容易计算。
该声明的有趣之处在于原始企鹅算法每年计算一次或更长时间。受到惩罚的网站几乎都受到了惩罚,直到下一个看似随机的日期百度重新计算企鹅得分。
在某个时刻,百度的基础设施必须得到改善。百度不断建立自己的基础设施,但显然没有宣布它。 Caffeine Web索引系统是例外之一。
实时企鹅在2016年秋季推出。
值得注意的是,这些计算很困难。它指出百度可能会对整个Web进行定期计算,然后根据从受信任站点到所有其他站点的距离来分配分数。因此,一个巨大的计算,做了一年。
因此,当通过PageRank计算SERP时,也会计算距离分数。这听起来很像我们称为企鹅算法的过程。
“系统然后根据链接的属性和链接所附页面的属性为链接分配长度。系统接下来基于页面之间的链接的长度来计算从种子页面集合到页面集合中的每个页面的Zui短距离。接下来,系统基于计算出的Zui短距离确定页面集中每个页面的排名分数。”
系统在做什么?系统创建基于种子集与建议的排名页面之间的Zui短距离的分数。该分数用于对这些页面进行排名。
所以它基本上是在PageRank评分之上的叠加,以帮助清除被操纵的链接,基于这样的理论,操纵链接自然会在垃圾邮件页面和可信集之间建立更长的链接连接。
对网页进行排名可以说包含三个过程。
IndexingRankingRanking修改(通常与个性化有关)这是排名过程的极端缩减。还有很多事情要发生。
有趣的是,这个距离排名过程发生在过程的排名部分。在此算法下,除非页面与种子集相关联,否则没有机会对有意义的短语进行排名。
这就是它所说的:
“ PageRank的一种可能的变体会减少这些技术的影响,就是选择一些“可信赖的””页面(也称为种子页面)并通过跟踪来自可信页面的链接发现可能是好的其他页面。“
这是一个重要的区别,要知道种子集计算在排名过程的哪个部分发生,因为它有助于我们制定我们的排名策略。
这与Yahoo TrustRank不同。 YTR显示有偏见。
Majestic的主题TrustFlow可以说是一个改进版本,类似于一篇研究论文,证明通过使用由利基主题组织的种子集更准确。研究还表明,按主题组织种子集算法比不这样做要好几个。
因此,有意义的是,百度的距离排名算法还组织了由小众主题桶设置的种子。
据我了解,这个百度专利计算种子集之间的距离并指定距离分数。
缩减链接图“在该实施例的变型中,与计算的Zui短距离相关联的链接构成简化的链接图。”
这意味着有一个互联网地图,通常称为链接图,然后是一个较小的版本,链接图由填充了垃圾邮件页面的网页填充。主要获取简化链接图之外的链接的网站可能永远不会进入。因此,脏链接没有牵引力。
什么是简化链接图?我会保持这简短而甜蜜。该文件的链接如下。
你真正需要知道的是这部分:
“基于链接的排名算法的早期成功是基于链接意味着目标页面的优点的假设。但是,今天存在许多链接而不是赋予权力。这些链接会将噪声带入链接分析并损害检索质量。
为了提供高质量的搜索结果,检测它们并降低它们的影响力是非常重要的。在分类器的帮助下,检测并丢弃这些噪声链路。之后,在简化链接图上执行链接分析算法。
有关精简链接图的更多信息,请阅读此PDF文档。
如果您从新闻机构等网站获取链接,可以公平地假设它们位于简化链接图的内部。但它们是种子集的一部分吗?也许我们应该对此感到困惑。
这是为什么百度说负面的SEO不存在?“…与计算出的Zui短距离相关联的链接构成了一个简化的链接图”
简化链接图与链接图不同。链接图可以说是整个互联网的地图,由站点,页面甚至部分页面之间的链接关系组织。
然后是一个简化的链接图,它是一个地图,减去某些不符合特定标准的网站。
缩小的链接图可以是网络地图减去非垃圾网站。简化链接图之外的网站对链接图中的网站没有任何影响,因为它们是在外面的。
这可能是为什么链接到普通网站的垃圾网站不会对非垃圾网站造成负面影响的原因。由于垃圾网站位于简化链接图之外,因此无效。该链接被忽略。
难道这就是为什么百度如此自信以至于它捕获链接垃圾邮件并且不存在负面搜索引擎优化?
种子集的距离等于排名较低的能力?我并不认为有必要尝试绘制种子集的内容。 在我看来,更重要的是要了解主题社区以及这与您获取链接的方式有关。
曾经有一次百度用于公开显示每个页面的PageRank分数,因此我记得哪些类型的网站往往得分较低。有一类网站具有较低的PageRank和较低的Moz DA,但它们与我认为可能只需点击几次点击种子集的网站密切相关。
Moz DA测量的是网站权威的近似值。它是一个很好的工具。但是,Moz DA正在测量的内容可能与种子集的距离不大,因为它不是已知的,因为它是一个百度秘密。
所以我没有放下Moz DA工具,继续使用它。我只是建议您可能希望扩展您的标准和有用链接的定义。
接近种子集意味着什么?从斯坦福大学的课堂文件,第17页询问,接近的好概念是什么?答案是:
多个连接connectionDirect&间接连接长度,度,重量这是一个有趣的考虑因素。
外卖有很多人担心锚文本比率,入站链接的DA/PA,但我认为这些考虑因素有点旧。
对DA/PA的关注是对于从PageRank为4或更高的页面获取链接的一种扭曲,这是一种从随机选择的PageRank得分开始的做法,即第四种。
当我们在排名的背景下讨论或考虑链接时,将距离排名视为该对话的一部分可能是有用的。
在此阅读专利https://www.百度.com/专利/US9165040
Shutterstock的图片,作者修改
CategoryLink BuildingNews