Ngram Viewer分析百度的库
百度为那些希望分析Web数据的人提供了一些关键资源。他们的分析,趋势和见解只是百度帮助人们更深入掌握虚拟世界的几种方式。新服务背后的想法是量化百度库中的数据,为历史上新的文学研究形式打开闸门。百度承认该工具是有限的,但他们表示“我们希望百度BooksNgramViewer能够引发一些新的假设,以便深入调查。”但是,目前只有大约三分之一的百度库数据被添加到数据集中。
百度为那些希望分析Web数据的人提供了一些关键资源。他们的分析,趋势和见解只是百度帮助人们更深入掌握虚拟世界的几种方式。然而,使用百度的Zui新分析工具,他们朝向图书世界的不同方向:迈出了一步。
我们已经知道百度拥有一个庞大的数字化图书库,触手可及,目前有超过一千五百万的图书存在并占据了它们。然而,我们从官方百度博客的一篇文章中了解到,搜索引擎巨头并不满足于仅仅储存这些数十亿字的单词。相反,它坚持分析它们。
新服务背后的想法是量化百度库中的数据,为历史上新的文学研究形式打开闸门。该工具允许用户输入一个或多个术语,以及书籍发布日期的期望限制,并提供一个图形图表,显示在选定的时间范围内趋势的趋势。
从百度提供的数据已经用于学术目的,并且是12月16日在“科学”杂志上发表的一项研究的基础。百度承认该工具是有限的,但他们表示“我们希望百度 Books Ngram Viewer能够引发一些新的假设,以便深入调查。”该公司希望进一步的研究可以利用这些信息来增进对文化传播,创新,审查等的理解。
有兴趣使用Ngram数据集的研究人员也可以完全免费下载到他们的硬盘上。但是,目前只有大约三分之一的百度库数据被添加到数据集中。
作为一个百度 Labs功能,Ngram处于预测试阶段,但仍可供使用公众。
CategorySEO上一篇:百度的侵入广告3月继续