如何在百度数据集搜索中排名
百度已经显示了数据集丰富的结果,并且可能会在发布者添加Schema.org标记时开始显示更多内容。百度已经在丰富的结果中添加了数据集信息。sameAs属性旨在规范原始发布者。”在数据集结构化数据的上下文中,sameAs属性可用于将信息规范化为特定URL,该URL表示数据的原始发布者。百度的知识图提供了用于匹配各种实体的数据层。
百度的人工智能博客发表了一篇文章,讨论数据集搜索的工作原理以及它用于对数据集进行排名的信号。百度已经显示了数据集丰富的结果,并且可能会在发布者添加Schema.org标记时开始显示更多内容。了解哪些数据集以及如何对它们进行排名非常重要,因为它可以成为新的流量来源。
百度已经在丰富的结果中添加了数据集信息。百度的数据集开发者页面于2018年5月更新,注意到数据集丰富的数据将来到百度的搜索结果:
此功能处于试用阶段,您可能还没有看到数据集的丰富结果。但是,我们建议您将数据集结构化数据添加到站点,以便为搜索结果中的新数据集功能做准备。
每个发布商都应考虑添加数据集标记,以便为百度的搜索结果中更广泛地推出此功能做好准备。
数据集搜索数据集搜索依赖于使用Schema.org/Dataset标准的结构化数据元数据。
百度获取结构化数据并通过知识图将其链接到它所知道的内容,并考虑链接等其他排名信号,然后创建数据集搜索索引。
重复数据集百度表示它部分依赖于Schema.org sameAS属性。 sameAs属性旨在规范原始发布者。
这就是为sameAs属性的官方Schema.org规范定义为:
“参考网页的URL,明确指出项目的标识。例如。  维基百科页面,维基数据条目或官方网站的URL。”
在数据集结构化数据的上下文中,sameAs属性可用于将信息规范化为特定URL,该URL表示数据的原始发布者。
百度用于识别重复数据集的附加信号:
“其他信号包括指向同一规范页面的两个数据集描述,具有相同的数字对象标识符(DOI),共享用于下载数据集的链接,或在其他元数据字段中具有大的重叠。
这些信号都不是完全孤立的,因此我们将它们结合起来,以获得两个数据集何时相同的Zui强可能指示。”
百度知识图表学者和排名百度的知识图在数据集信息的排名中起作用。知识图帮助百度理解数据集的上下文,包括理解它的语言和理解首字母缩写词。
百度的知识图提供了用于匹配各种实体的数据层。因此,如果数据集包含品牌,货币或语言,则可以将其与数据集相匹配。
这里是关于百度的人工智能博客帖子关于它的内容:
“百度’知识图是一个功能强大的平台,它描述和链接有关许多实体的信息,包括出现在数据集元数据和hellip中的实体;这种类型的对帐为改善用户的搜索体验提供了很多可能性。
例如,数据集搜索可以通过以与页面其余部分相同的语言显示元数据的对帐值来本地化结果。此外,它可以依赖同义词,纠正拼写错误,扩展首字母缩略词,或使用知识图中的其他关系进行查询扩展。”
百度学者可能是排名信号根据百度,百度 Scholar可以提供数据集具有权威性的信号以及数据集的作者是谁。
这可以帮助数据集发布者更好地排名。但它也可以帮助打击刮刀使用其他人的数据。
百度的官方博客文章描述了这个像:
“了解哪些数据集在出版物中被引用和引用至少有两个目的:
它提供了关于数据集的重要性和突出性的有价值的信号。 2.它为数据集作者提供了一个容易查看其数据引用和获得信用的地方。“
百度如何对数据集进行排名百度没有大量数据可用于学习用户如何搜索数据。因此,百度正在使用常规排名算法为其数据集搜索的用户对数据集进行排名。
但是,一旦百度有足够的人们搜索数据,就会开始开发一个专门针对数据集搜索的单独算法。
也就是说,百度正在使用其他信号来更好地对数据集:进行排名
“…排名数据集与排名网页不同,我们添加一些额外的信号,考虑元数据质量,引用等。”
优化数据集您的网站可能已有数据集。现在是用适当的Schema.org结构化数据标记它们的时刻。
百度数据集的值可能在使用数据集搜索来查找数据和链接到您的站点的人中。但另一个值出现在百度的特定类型数据的丰富结果中。你比竞争对手更好吗?
阅读百度的人工智能博客帖子这里是https://ai.百度blog.com/2018/09/building-百度-dataset-search-and.html
更多ResourcesTop 7排名信号: 2018年真正重要的事情是你必须知道的11件事关于百度" 200排名因素分类新闻搜索引擎优化上一篇:百度增强用户安全性:发布新仪表板
下一篇:百度抓取和索引的频率