首页/ - 每日一评 - 文章正文

搜索引擎如何回答问题

时间:2019-06-26 19:56:31 作者:黑曼巴 分类:每日一评 浏览:130

有时,该任务可能涉及获取复杂信息。在第一个例子中,他们如何推断用户正在寻找有关他们所在位置天气的信息而不是一般情况。有许多系统连接并提供数据来创建此环境。百度概述了2016年授予的专利流程,该专利名为“评估搜索查询的语义解释”。神经匹配百度使用神经匹配来基本上确定同义词。该专利中包括创建模板的想法。为此,我建议您先阅读JohnMueller关于精选代码段的内容,并根据您的业务情况继续前进。

 

搜索引擎的主要目标是帮助用户完成任务(当然,还有销售广告)。

有时,该任务可能涉及获取复杂信息。有时用户只需要一个问题的答案。

在本文中,您将了解搜索引擎如何确定查询属于哪个类别,以及他们如何确定答案。

搜索引擎如何限定查询类型

整篇文章或可能的书籍都可以仅仅针对这个问题编写。但我们将尝试用几百个字来总结这一切。

为了解决这个问题,RankBrain在这里几乎没有任何作用。

那么’ s究竟是怎么回事?

从本质上讲,该过程的第一步是了解所请求的信息。也就是说,将查询分类为查询的人员,内容,地点,时间,原因或方式。

无论这些特定单词是否包含在查询中,如:

所示,都可以进行此分类

所以,我们在这里看到的是两件事:

百度已确定用户正在寻找问题的答案,因为可能的主要intent.百度已确定如果这不是用户的主要意图,则次要意图可能不同。

您可能想知道搜索引擎如何确定用户在上面的第二个示例中提出问题。毕竟,它并没有内置到查询中。

在第一个例子中,他们如何推断用户正在寻找有关他们所在位置天气的信息而不是一般情况。

有许多系统连接并提供数据来创建此环境。从本质上讲,它依赖于以下:

规范查询

我们倾向于将查询视为具有单个响应的单个请求。事实并非如此。

当运行查询时,如果没有已知良好的可能意图或者引擎可能想要测试他们的假设,他们可以使用的方法之一是创建规范查询。

百度概述了2016年授予的专利流程,该专利名为“评估搜索查询的语义解释”。 (链接是我的分析,以便于阅读)。

简而言之,问题总结在下图:

一个具有多种可能含义的查询。

在该专利中,他们概述了一个过程,通过该过程可以使用所有可能的解释来产生结果。简而言之,他们会为所有五个查询生成结果集。

他们会将查询204a,204b,204c和204d的结果与来自202的结果进行比较.204系列中与202Zui接近匹配的结果将被视为可能的意图。

从目前的结果来看,似乎204c赢了:

这将需要两轮这个过程。第一个选择电影,第二个选择哪部电影。

从该页面点击搜索结果的人越少,就会更加成功地考虑结果,这在声明中的专利中概述了:

“使用搜索结果来评估不同的语义解释,其他数据源(如点击数据,用户特定数据以及在生成搜索结果时使用的其他数据)将被考虑在内,而无需执行其他分析。&rdquo ;

相对于专利的背景,这并不是说CTR是直接指标。事实上,这句话更像是John Mueller在使用用户指标:回答有关百度的问题时的意思

“…这是我们在数以百万计的不同查询中看到的东西,以及数百万个不同的页面,并且通常会看到这种算法正确的方式,或者这种算法是否以正确的方式运行。”

基本上,他们没有将它用于单个结果的成功,他们用它们来判断整个SERP(包括布局)的成功。

神经匹配

百度使用神经匹配来基本上确定同义词。

基本上,神经匹配是一个AI驱动的过程,它允许百度(在这种情况下)从非常高的层次理解同义词。要使用它们的示例,它允许百度产生类似:

的结果

你可以看到这个查询是为了解答为什么我的电视看起来很奇怪,系统认为这是对“肥皂剧效果”的引用。”排名页面不包含“奇怪的”字样。

关键字密度非常多。

他们的人工智能系统正在寻找一个非常复杂的同义词来理解哪些信息会解决意图,即使它没有被特别要求。

情境相似性

有各种各样的例子和领域,其中情境背景发挥作用,但在其核心,我们需要考虑情境条件如何改变查询意图。

上面我们提到了一个关于创建规范查询的系统的专利。该专利中包括创建模板的想法。可用于其他类似查询的模板,以更快地启动该过程。

因此,如果需要资源来确定当某人输入一个往往具有广泛背景的单词时他们可能想要一个定义,那么他们可以应用更普遍产生的结果,如:

从那里开始寻找异常的模式,比如食物。

谈到食物,它是支持我的信念(我认为逻辑)的一个很好的例子,它也很可能是引擎使用搜索量。

如果有更多的人搜索餐馆而不是像“披萨”那样的食谱,我相信可以肯定地说,他们会将其用作衡量指标并知道食品是否不遵循这种模式,那么模板可能不会应用

种子集

基于模板,我相信很可能,如果不确定的话,使用种子数据集。

引擎根据对人们想要的内容,工程师编程和模板的真实理解来训练系统的场景。

Dave坐在百度plex,想要一些比萨饼,百度d [披萨],得到前十名,认为,这很愚蠢,并开始在模板上与团队合作。

在这种情况下,我实际上并没有读过有关种子集的任何内容,但它确实有意义并且肯定存在。

过去的相互作用

搜索引擎将通过将结果放在适用的布局中并查看用户的操作来测试他们对意图的理解是否正确。

在我们上面的上下文中,如果查询的可能意图是“什么样的天气”,那就是”我正在寻找一个问题的答案,他们将测试这个假设。

似乎在很大程度上,它是人们想要的答案。

那么,这与回答问题有什么关系?

好问题。

要了解百度如何回答问题,我们首先需要了解他们如何将数据汇总在一起以了解查询是否是一个问题。

当然,它是一个简单的,它是一个谁,什么,何地,何时,为什么或如何查询。但我们需要考虑他们如何知道像“天气”这样的查询。或者“meme”是对特定信息的查询。

这是一个五W的查询,没有任何W(或者就此而言是H)。

一旦确定使用上面讨论的技术的相互联系(并且我确信有一些我错过了),那么剩下的就是找到答案。

因此,用户输入了一个单词,并且引擎已经跳过了许多箍,以确定它可能是对特定答案的请求。他们现在留下来确定答案是什么。

为此,我建议您先阅读John Mueller关于精选代码段的内容,并根据您的业务情况继续前进。

更多资源:

搜索引擎如何显示搜索结果如何搜索引擎排名页面高级技术搜索引擎优化:完整指南

图像信用

特色图片: Adobe Stock。作者编辑。作者的截图。

CategorySEO

上一篇:百度,Overture和GO TOAST赞助SEMPO

下一篇:eBay的客户忠诚度

猜你喜欢
发布评论
登录后发表评论
登录后才能评论

AI 新用户?

免费使用内容重写服务

开始新的写作