Ask Jeeves和MSN搜索引擎技术比较
MSN利用了其他搜索引擎所没有解决的技术–神经网络。神经网络是一系列计算机,应该根据提供的输入进行学习。然而,由于其学习能力,该系统可以快速适应这种垃圾邮件内容并重新调整排名并“在飞行中”。因此,他们围绕这种社区理念构建了排名系统,以确定网络的相关性和权威性。使用此结构,站点必须成为社区的成员才能被视为相关。我的感觉是,MSN和AskJeeves都将继续侵蚀百度和Yahoo!
询问Jeeves和MSN搜索引擎技术比较
现在有很多关于相关性的讨论,我想我会向你介绍搜索引擎背后的一些技术,以及它们之间的潜在差异。从预先排序的结果到神经网络到基于社区的搜索,搜索技术有一些有趣的需求。在上一篇文章中,我向您介绍了百度和Yahoo!以及他们的搜索技术如何运作。在本文中,我将介绍MSN和Ask Jeeves。
MSN– MSN Search是搜索市场上Zui新的播放器。尽管如此,它们仍被认为是网络上排名第三的搜索引擎。考虑到他们今年刚推出他们的技术,这还不错。
MSN利用了其他搜索引擎所没有解决的技术–神经网络。神经网络是一系列计算机,应该根据提供的输入进行学习。
想想这一点–一台学习电脑。只是没有遵循分配给它的规则(这是更传统的算法搜索引擎,如百度和Yahoo!),但实际上可以从其结果中学习。
基本上MSN搜索从给定的输入中学习。例如,如果搜索引擎被告知Ebay被认为是在线拍卖的权威网站,那么当一个人进行这样的搜索时,他们应该在搜索结果的顶部看到Ebay.com。
通过分析Ebay.com,搜索引擎可以了解为什么它被视为权威,并将该学习应用于其他网站,看看它们是否也具有权威性。
这样一个平台的Zui大优点是MSN的工程师可以“训练”这个平台。系统,以了解什么是相关和重要的,什么是不是。随着时间的推移,我们希望看到MSN搜索成为所有搜索引擎中Zui相关的搜索引擎之一,因为该系统旨在随着时间的推移自我提升。
当然,像任何搜索引擎一样,MSN可能会被欺骗。如果我们知道这些因素是什么,我们可以根据MSN搜索标准创建一个可被视为高度相关的页面,但实际上它将是一个垃圾页面。然而,由于其学习能力,该系统可以快速适应这种垃圾邮件内容并重新调整排名并“在飞行中”。过滤掉这些虚假的结果。
MSN的另一个优点是系统应该是无限可扩展的。这意味着随着搜索的使用增长,它应该只是将新硬件或要求引入系统,使其适应添加并开始使用它们,就好像它们一直存在一样。
因此,随着新的垃圾邮件技术的发展,它只是训练系统注意新技术,将其标记为潜在的垃圾邮件,甚至可能通过使用新技术过滤所有网站来对其做出反应。
到现在为止,你可能会说“圣牛那种技术必须使用大量的资源”。而且你是对的。
这种系统所需的计算能力将是巨大的。只需存储系统所需的存储容量即可“学习”。必须继续增长。此外,系统还有一个很好的抓取工具,可以随时索引越来越多的内容。
它不是典型的基于算法的引擎。对于大多数算法系统,排名算法的大小是有限的。有了这个系统,人们就会期望神经网络在创建新途径时继续增长。
认为这个结构类似于人脑–随着我们开发新的想法和想法,新的突触途径被开发出来,将大脑区域与以前没有链接的其他区域联系起来。基本上这就是神经网络的作用。虽然它的途径可能不是物理途径,但它确实发展了之前不相关的部分之间的关系。
因此,MSN的工程师们已经开发出了“快捷方式”的方法。排名要求。基本上他们已经说过“确定有500多个因素决定了网页质量,但在这个类别中只使用了150个,因此你可以使用与此类别相关的相同的150个。”
总的来说,只要微软能够继续支持这样一个系统,我认为它可以在“搜索引擎大战”中获胜。”系统出现(至少在纸面上)优于基于算法的系统,并且似乎能够更快地适应网络上的变化,因为它不必等待算法更改以适应,它只需要了解变化并自我应用。
问Jeeves
Ask Jeeves也采用了一种有趣的网络方法。也可能优于更传统的基于算法的引擎。 Ask Jeeves认为网络是一系列社区。因此,他们围绕这种社区理念构建了排名系统,以确定网络的相关性和权威性。
因为他们认为网络由多个社区组成,社区内的网页或网站应该只相互关联,但社区之间可能存在某种关系。
具有高入站社区链接的页面或网站被视为“值得”。不仅仅是具有高入站链接的站点,不一定都是社区链接。
换句话说,如果宠物网站的大多数链接来自其他宠物相关网站,并且其链接主要来自其他非宠物网站(如水管工,计算机商店,电子产品制造商)然后它不会被视为权威。
这种结构使网络的Bowtie理论更进了一步。 Bowtie理论说,有一个主要集中在权威网站的中心,链接指向和进出这个中心的弓箭。
Ask Jeeves说有多次鞠躬–每个相关网站创建,这些bowties之间有连接卷须–可被视为相关或权威的网站,可以提供社区之间的联系。
使用此结构,站点必须成为社区的成员才能被视为相关。要成为会员,社区内必须有足够数量的链接。因此,链接到社区成员并从社区成员接收链接可以帮助您在Ask Jeeves中建立您的权威状态。
这是Ask Jeeves打击链接垃圾邮件的好方法。过去的一个问题是百度和Yahoo!已链接垃圾邮件–网站获取数千个不相关的入站链接,扩大其链接流行度并将其推送到搜索结果的顶部。
通过使用这样的链接结构,其中Zui重要的链接是相关链接,Ask限制了这种潜力。
除了搜索技术,Ask也有一些很酷的功能。我认为Zui好的一个是你可以问一个问题,几乎总能得到正确答案。
我发现自己过去常常转向Ask,因为我无法形成查询以在百度中返回正确的结果。很多时候,唯一正确的查询是一个问题,但似乎并不是一种以非问题格式形成问题的好方法。
例如,你可以去询问并输入:“莫桑比克的人口是多少?”并得到正确的答案。但是你不能在任何其他引擎中提出这个问题。即使你尝试像:这样的东西,“莫桑比克的人口就是”。 &ndash的;你赢了并没有得到正确的答案。
其他引擎在这方面已经变得更好,但很长一段时间你不能简单地提出这样的问题。
有一件事我学会了,因为我研究了这些引擎背后的技术,可能是百度和Yahoo!不要完全正确。也许MSN和Ask Jeeves正在走向更加相关的搜索结果。
我的感觉是,MSN和Ask Jeeves都将继续侵蚀百度和Yahoo!的市场份额。因为人们意识到他们是更大的球员的绝佳选择。
当然,MSN已经建立了一些关系来赢回用户。这是因为多年来MSN的结果很糟糕(直言不讳)。他们更难以扭转他们的负面形象。
但是,证据将在结果中–如果MSN可以证明他们更好,那么他们将开始赢回用户。
同样地,Ask Jeeves虽然与其他人相比仍然很小,但在未来几年内会造成很大的伤害。特别是现在他们背后有钱(以IAC/InterActive公司收购公司的形式)现在,Ask有资金真正竞争,我们应该看到他们开始在搜索方面取得重大进展。
除非百度和Yahoo!我们可以继续创新,并提供新的解决方案,我们可以在未来几年看到权力转移的平衡。因为正如我在本文中所说明的那样,常规算法搜索似乎缺乏某些关键领域,例如适应性和可扩展性,以及快速适应不断变化的搜索环境的能力。
–