百度如何收集搜索质量日期
人们鲜为人知的是,百度从未打算成为一家公司。十多年后,百度一直坚持这一承诺。根据这些实验的结果,百度每年对其算法进行500多次更改,每次更改通常会影响一小部分搜索引擎结果。网站统计百度获取有关其搜索结果的数据的主要方式是通过基本使用统计信息。社交媒体指标几年前,百度开始收集社交媒体数据。百度员工会查看报告,并可以手动惩罚他们遇到的网站。
人们鲜为人知的是,百度从未打算成为一家公司。事实上,在1998年,Vinod Khosla(百度的首批投资者之一)设法说服Larry Page和Sergey Brin将他们的技术出售给当时领先的搜索引擎Lycos,Excite或雅虎,价值微不足道。他们可以重新专注于他们在斯坦福大学的研究。
虽然每家公司都花时间审查拉里·佩奇和谢尔盖·布林的工作,但他们还是有机会购买它。这些公司根本不关心搜索质量;他们认为他们的成绩足够好,他们需要通过其他方式将自己与竞争对手区分开来。
当这两个朋友决定追求他们的搜索引擎时,他们把重点放在搜索质量上作为他们的首要任务。他们甚至把它放在他们的使命宣言:中“组织世界的信息,使其普遍可用和有用。”
十多年后,百度一直坚持这一承诺。它仍然投入了大量的资源来确定如何提供Zui好的结果。
但是,当搜索引擎每秒处理数百万次搜索时,其中之前从未遇到过15%(或每天5亿次查询) - 它如何确保提供Zui佳体验?答案是它使用了自动和人工审核流程的组合。
由于经常讨论自动审核流程(如PageRank,Panda和Penguin),因此本文将重点介绍百度收集数据以判断搜索结果质量的更多手动方式。
数以百万计的日常用户为了改进其算法,百度在2010年的搜索结果上进行了20,000多次实验。这些实验的大部分数据来自将一定比例的用户放入特定的桶中。
如果你使用百度,你很可能无意中帮助公司改善他们的结果,作为其中一个实验的一部分。根据这些实验的结果,百度每年对其算法进行500多次更改,每次更改通常会影响一小部分搜索引擎结果。
实验可能就像拆分测试网站布局一样简单,也可能像改变数百万搜索引擎排名一样复杂,以提高其质量。
网站统计百度获取有关其搜索结果的数据的主要方式是通过基本使用统计信息。
例如,如果您正在寻找使用百度的牙医并且您点击第一个结果,百度可以通过查看您是否返回搜索引擎结果页面(SERP)并点击其他链接间接测量您对网站的反应
很明显,如果你必须返回搜索引擎点击另一个链接,你没有找到你要找的东西。百度的目标是在Zui短的时间内为您提供所需的内容。
百度根据查询意图(导航,信息或事务)了解所期望的使用模式类型,并汇总每个链接的性能数据。
他们收集的统计数据包括跳出率和在网站上花费的时间。尽管这些统计数据是间接的,但它们在预测用户是否喜欢他们点击的内容时往往非常准确。
百度收集搜索结果质量数据的另一种方法是查看已安装其工具栏的人的页面加载速度。您可以在百度 Analytics& amp;中找到用户收集的有关您网站速度的数据百度。网站站长工具。虽然百度还在其机器人爬网时测试网站速度,但工具栏为公司提供了有关实际情况的更多信息。
社交媒体指标几年前,百度开始收集社交媒体数据。由于百度没有访问Twitter和Facebook的消防软件,他们一直对信任社交信号犹豫不决,但这些信号正在成为其算法中不断增长的部分。
在过去,百度几乎完全依赖反向链接来确定如何对网站进行排名。这种方法的问题在于它只允许网站管理员决定您的网站是否具有高质量。
社交媒体信号是搜索引擎质量测量的民主化。基本上,社交媒体有可能让每个人都对页面是否应该在百度中排名进行投票。如果您在社交媒体配置文件上共享网站,则可能意味着您有利地浏览了该网站。
社交媒体数据将在搜索的未来发挥巨大作用,并将被搜索引擎大量使用,以确定人们如何对在线内容作出反应。
调查&问卷虽然来自用户的间接数据非常好,但百度仍然很难理解用户为什么不喜欢某些页面。它有大量的数据,但需要通过分析和评估将其转化为信息才能理解这一切。因此,它也开始从用户那里获得更多的直接反馈。
作为一个搜索引擎优化器,我每天进行大量的搜索(以至于我经常只需输入验证码就可以使用该服务)。以下图片来自我的真实世界。
在搜索了百度进行“本地搜索引擎优化”之后,他们向我展示了右下角的方框。该框要求我对两个不同页面进行评分以确定相关性。
百度正在寻找信息的一个页面是搜索引擎观察文章。
另一个页面百度想要输入的是本地搜索引擎优化公司。
在访问了两个页面之后,相当明显的是百度在调查问卷中寻找的内容。由于我输入百度(“本地搜索引擎优化”)的查询不明确,因此百度并不确定要显示的内容类型。
他们正在检查人们是否正在寻找有关本地搜索引擎优化(信息查询)的文章,或者他们是否在寻找雇用公司(交易查询)。
我投票支持搜索引擎观察文章,因为大多数人必须拥有,因为百度Zui近开始将新闻结果整合到查询中。现在,而不是显示本地SEO公司接近SERP的顶部,百度正在展示更多的文章。
几周后,我对“伟大的科幻小说”进行了一次百度搜索。检查它使用新滑块的查询类型。
执行搜索后,我注意到一个反馈按钮,我没有在任何其他滑块上看到。当我点击它时,以下按钮显示:
百度正在寻找应该在滑块中的书籍类型的输入。如果有足够的人觉得某个书不应该在滑块中,百度可能会删除它。
事实上,如果你现在看结果,你会注意到上面看到的几本书不再出现在第一张幻灯片上。
我看过百度使用的另一个调查工具是低于:的那个
调查以屏幕右侧的聊天框形式出现,并要求我对整个结果页面进行判断。
百度搜索质量评估者自2005年左右以来,百度已经使用了大量的雇佣搜索质量评估者来确保其结果达到标准。
由于百度仍然主要依赖于质量的间接测量,因此它使用搜索质量评估者来查看效果不佳的页面,并确定用户不喜欢它们的原因。
这种反馈主要是回到百度的工程部门,以便它可以开发更多的实验。此反馈通常不会对您网站的排名产生直接影响。您可以在此处查看百度为其搜索引擎质量评估者提供的确切指南。
网站站长工具垃圾邮件报告
百度依赖的另一种手动方法是通过其网站管理员工具垃圾邮件报告界面来确保高质量的搜索结果。
垃圾邮件报告来自各种来源,包括诈骗受害者,心怀不满的SEO和版权所有者。
百度员工会查看报告,并可以手动惩罚他们遇到的网站。
结论如您所见,百度对其搜索结果的质量非常认真。百度是一种活生生的呼吸有机体,由大量数据提供。
该公司不断变化,探索提高其搜索结果质量的方法。只要搜索引擎优化器继续超越百度的算法(这将在可预见的未来发生),百度将继续使用手动数据收集技术来增强其算法并惩罚操纵器。
还有其他什么策略您是否看到百度用于收集更多手动形式的搜索质量数据?
CategorySEO