首页 - 每日一评 - 文章正文

百度强烈建议使用HTML快速获取内容索引

时间:2019-06-25 21:21:59 作者:黑曼巴 分类:每日一评 浏览:102

穆勒在推特上讨论了关于百度的两遍索引系统的问题,并提出了自己的建议。当百度抓取并索引内容时,它会执行两次传递。在第一次和第二次通过之间。因此,一段内容可能无法在百度Search中完全索引,直到它发布数周之后。百度bot在第一次传递时没有抓取并索引整个网页的原因归结为资源。因此百度bot可能会在渲染完成之前索引页面,然后需要一些时间完成渲染。当最终渲染到达时,百度将对客户端渲染内容执行第二波索引。

 

百度的John Mueller说内容需要用HTML格式才能快速编入索引。

对于经常生成新内容和/或更新内容的网站尤其如此。

穆勒在推特上讨论了关于百度的两遍索引系统的问题,并提出了自己的建议。

当百度抓取并索引内容时,它会执行两次传递。第一遍仅查看HTML。然后,过了一段时间,它会再次查看整个网站。

穆勒说,“没有固定的时间框架”。在第一次和第二次通过之间。

在某些情况下,它可能很快发生,在其他情况下可能需要几天或几周。

是的,没有固定的时间框架—在某些情况下,渲染可以相当快地进行,但通常情况下,它甚至可以达到几天到几周。如果您的网站经常生成新的/更新的内容,你希望它快速编入索引,你需要HTML中的内容。

— ?约翰?(@JohnMu)2018年9月13日

对于使用大量客户端JavaScript进行渲染的网页来说,这是一个大问题。

在JavaScript密集的网页的第一次传递过程中可能会遗漏一些细节,这意味着在第二次传递之前它不会被完整索引。

正如穆勒所说,这可能需要数周时间。

因此,一段内容可能无法在百度 Search中完全索引,直到它发布数周之后。

这显然不太理想,这就是为什么它对于百度bot在第一遍中看到主要内容至关重要。

经验丰富的SEO Alan Bleiweiss在讨论中加入了自己的专业知识,称他Zui近审核了一个在关键页面上进行所有客户端JavaScript渲染后受到重创的网站。

如果整个网站需要花费数周的时间来抓取,那么所有的时间都会被JavaScript所取代。刚刚在关键页面上进行了所有客户端JS渲染的网站上进行了审核审核。这是一团糟,他们受到重创。还有两个这样的审计。

— Alan Bleiweiss(@AlanBleiweiss)2018年9月14日

为什么不是百度bot一次抓取整个页面?

百度bot在第一次传递时没有抓取并索引整个网页的原因归结为资源。

渲染基于JavaScript的网页需要处理能力和内存,百度bot没有无限的资源。

当页面中包含JavaScript时,渲染将延迟到百度bot准备好呈现客户端内容的资源。

因此百度bot可能会在渲染完成之前索引页面,然后需要一些时间完成渲染。

当Zui终渲染到达时,百度将对客户端渲染内容执行第二波索引。

要更详细地讨论此主题,请参阅百度 I/O关于如何提供搜索友好的JavaScript驱动网站的40分钟讲话。

CategoryNewsSEO

上一篇:Facebook正在测试Upvotes和Downvotes for Comments

下一篇:让Jeeves用Tukaroo进行桌面搜索

猜你喜欢
发布评论
登录后发表评论
登录后才能评论

AI 新用户?

免费使用内容重写服务

开始新的写作