Xerox的FactSpotter:挖掘文本中的概念
Xerox的FactSpotter并不是一款主流搜索工具,它将作为当今搜索引擎的挑战而首次亮相。但其中的功能可能为理想的搜索工具铺平了道路,该工具建立在连接数据而非收集数据的概念之上。Xerox的人们打算将FactSpotter作为文本挖掘工具启动,它将在查询中捕获概念,上下文和关键字,以返回相关结果。
Xerox的FactSpotter并不是一款主流搜索工具,它将作为当今搜索引擎的挑战而首次亮相。但其中的功能可能为理想的搜索工具铺平了道路,该工具建立在连接数据而非收集数据的概念之上。
收集数据是主流引擎今天所做的事情–查找通过统计或数学模型排名的链接,并将其推送给用户。
Xerox的人们打算将FactSpotter作为文本挖掘工具启动,它将在查询中捕获概念,上下文和关键字,以返回相关结果。
例如,搜索“rdquo;史蒂夫·乔布斯昨天演讲“rdquo;将在昨天作为Zui高结果发表他的演讲,而不是在任何其他时间与他的录音或图像或任何其他数据的链接。它是从关键字中捕获概念(在本例中为时间概念)并将其与查询中的基础语法相匹配以返回接近完美结果的技术,这使得FactSpotter成为语义空间中的相关竞争者。
其他显着特征是:
识别诸如‘ buildings’等概念;和‘人物’。用多种语言搜索文件。前景
制造商已经提到引擎基于连接数据,这暗示了依赖于提供数据的Web的语义框架。
这就是为什么我认为FactSpotter可能不仅仅是一个非常相关的文档管理解决方案的原因(施乐公司计划首先为诉讼公司推出它来管理大量文档),但也可能开创本质上利用语义框架的技术。将为未来的网络提供动力。
语义Web是创建Web的概念,其中数据以机器可以理解的方式描述。结果将是设计网络软件的能力,该网络软件混合来自各种来源的各种格式的数据而没有任何障碍。 FactSpotter是下一代技术之一。
CategorySEO下一篇:雅虎搜索结果添加快速链接