开源搜索引擎提供非商业选择
开源活动家将Nutch搜索引擎技术整合在一起,这可能会成为常规搜索引擎领域的替代品。根据Nutch项目,他们提供了商业网络搜索引擎的透明替代方案。另一方面,Nutch没有什么可隐瞒的,除了试图给每个用户提供最好的结果之外,没有动机以任何方式偏向其结果或其爬虫。在进行“深度爬行”时,MozDex计划在未来几周内完成索引。
Zui近,随着商业搜索引擎如百度,雅虎,Ask Jeeves和MSN搜索正在逐步提升网络冲浪者的影响力,而目前正在变得越来越强大,“非商业”的反应已经引起了人们的反响。人群带来另类。开源活动家将Nutch搜索引擎技术整合在一起,这可能会成为常规搜索引擎领域的替代品。
根据Nutch项目,他们提供了商业网络搜索引擎的透明替代方案。只有开源搜索结果可以完全信任,没有偏见。 (或者至少他们的偏见是公开的。)所有现有的主要搜索引擎都有专有的排名公式,并且不会解释给定页面为什么排名的原因。此外,一些搜索引擎根据付款确定要索引的网站,而不是网站本身的优点。另一方面,Nutch没有什么可隐瞒的,除了试图给每个用户提供Zui好的结果之外,没有动机以任何方式偏向其结果或其爬虫。
在过去的一周里,三个开源搜索引擎引起了搜索社区的注意,其中两个正在使用Nutch,其中一个仍处于创意/开发阶段。
MozDex
本月MozDex是一个完全使用不同开源技术构建的开源搜索引擎,在beta测试期间一直在调整和改进搜索结果。在进行“深度爬行”时, MozDex计划在未来几周内完成索引。
Small Productions总裁Byron Miller表示,Mozdex.com提供了基于公开软件,API和算法的首批OPEN搜索系统之一。理解结果或排名并不保密,提供对公开指数的首次公开洞察。
对象搜索
Objects Search推出了基于开源技术Nutch(www.nutch.org)的集群搜索引擎。 Clustering Engine是一个用于聚类文本数据的系统。该引擎自动将搜索结果即时分类为分层聚类。
搜索结果聚类试图克服信息过载的问题,因为大多数搜索引擎都基于基于关键字的查询和无穷无尽的匹配文档列表。不幸的是,即使使用了特殊的排名算法,相关性排序也不可避免地会根据网络上可以找到的一些流行概念来提升质量。
一种方法是自动将搜索结果分组为专题类别,称为群集。假设群集描述是关于它们包含的文档的信息,则用户花费更少的时间来关注不相关的链接。
OpenIndex
根据Research Buzz的说法,OpenIndex并不是一个开放的搜索引擎项目,而是更多的索引(简称为简称)或社区构建的搜索引擎。声称他们没有硬件来支持庞大的网络索引(截至目前),OpenIndex对加入他们社区的用户的想法持开放态度。
OpenIndex提出了分散的,多计算机驱动的搜索索引的想法; “虽然我们不太可能拥有大型计算机,但我们可以拥有许多小型计算机,由感兴趣的志愿者提供,并在社区中分发–甚至遍布全球。也许它是拥有公开拥有和运营的索引的唯一方式.-它当然看起来合适。
分布式服务器系统将分配在其中运行索引的所有任务。这将创建一个并行运行的大型计算机系统,根据需要执行任务。成本将在服务器之间分配。<
CategorySEO上一篇:百度为IPO选择纳斯达克
下一篇:购物搜索引擎使用繁荣与假日购物