一切关于百度新闻技术
今天,百度新闻服务实时扫描4,500个不同的网站,确定哪些新闻报道是相关的,然后根据重要性对它们进行分组。并且没有任何记者参与该服务,百度新闻完全由计算机程序管理。百度新闻包括过去30天内出现的文章。百度首席科学家KrishnaBharat是百度News背后的大脑。政府组织,大学,知名公司。
看看百度新闻技术
Amit Agarwal在他的Digital Inspiration博客上汇总了对百度新闻技术的精彩概述。这里有一些片段:
第一个内部百度新闻演示出现在2001年12月。它只使用了100个来源。今天,百度新闻服务实时扫描4,500个不同的网站,确定哪些新闻报道是相关的,然后根据重要性对它们进行分组。并且没有任何记者参与该服务,百度新闻完全由计算机程序管理。百度新闻包括过去30天内出现的文章。百度首席科学家Krishna Bharat是百度 News背后的大脑。
Amit还会查看百度文件:
阅读以下有关使用TrustRank打击网络垃圾邮件的百度文件中提到的重点。
这个(TrustRank)与对PageRank应用加权有何不同?
它试图检测几乎没有入站链接的页面集群,这些页面也传播了“信任”链接。通过使用其链接结构分数到所有其他网站。对于具有许多入站链接的网站(页面浏览率较高),作者声称此修改倾向于以不同方式对垃圾邮件和信誉良好的网站进行分类。
被视为属于受信任种子网站的页面/网站的所有者是否会为所有辛勤工作(即手工维护的链接页面)获得任何资金?
不会。但是,他们会获得更好的搜索引擎可见性,这非常有价值。
如果这样的所有者决定链接到商业或垃圾链接的页面–他们会从链接网站的所有者那里获得任何资金吗?
该文件建议仅使用具有长期稳定性的种子页面的高信誉组织。政府组织,大学,知名公司。
NEXT:百度新闻如何运作
–
Amit Agarwal是桌面搜索爱好者和专注的博主&ndash ;阅读他的个人博客,Digital Inspiration
CategorySEO下一篇:百度 ITA收购 - 暂停