大量重复内容问题 - 揭示更多内容
我需要绘制修复–详细介绍SEO和信息架构的最佳实践。 在几个县设有多个办事处。 是的,我发现列出了100,000个404错误,全部来自5月份!事实证明,所有这些404错误有三个主要原因。首先,当该网站在去年首次重新设计和重建时,最初存在URL结构问题。然而,真正庞大的404计数来自现已解散的网站上的旧属性URL结构。
所以上个月,我在这里发表了一篇题为“你认为你有重复内容问题的文章”的文章吗?”在那里我描述了一个重复的内容噩梦的史诗比例。 基本上,我发现网站上每个页面都有数百个复制的网站,并概述了我需要向开发人员安排修复它的步骤。
从那时起,我又做了一些挖掘工作,以便为实施提供全面的任务计划。 并且发现问题比我Zui初的评估差得多。 愚蠢更糟。它看起来像是一场重大战斗,让它全部解决并且hellip;
当我第一次发现问题时,我估计应该只有大约15,000页,但发现百度显示的是86,000页。 从那里开始,我发现百度索引了一百万页,但是在他们内部的自动化工作中只显示了“正确的设置”,Zui终没有做出如此出色的工作。
当时,这意味着那些15,000页并没有获得他们应得的所有价值。
更多挖掘
所有这些我Zui初发现并弄清楚的信息纯粹基于中级审计工作。 然而,当我真正将这些调查结果写成一份清晰,简洁,简洁的英文文档提供给该网站的开发人员时,我需要更进一步。我需要真正检查,并展示存在问题的链接示例。
我需要绘制修复–详细介绍SEO和信息架构的Zui佳实践。 因为当你告诉开发人员“你花费数百小时建立这个网站造成了大量的问题,你现在需要修复”时,你Zui好是彻底的。 并准备好从情绪或心理上可能不愿意承认或承认他们在问题上滚动的人的推迟。
更多细节
如果你还记得,它是一个房地产网站。 在几个县设有多个办事处。 遍布400多个代理商。事实证明,他们的系统实际上有超过25,000个待售房屋。 该网站提供深入导航–县到城市,到邻里,Zui后到个人财产。
如果你添加所有那些县,城市和社区页面,加上数百个代理页面,那么它就会超过26,000个实际页面。
哦– 看! 几个重复问题
好的,在我的上一篇文章中,我解释了如果你去代理商的生物页面,然后点击那里到网站上的任何其他页面,所有的网址都附加了该代理商的ID。 这是大多数重复的来源。 数千个属性页面,每个属性页面都复制了每个代理程序附加到URL的唯一ID。
可是等等!还有更多!
在我的Zui后一次写作中,我扫描了在百度索引的重复页面。 猜猜怎么着? 事实证明,每个县都有两个不同的URL,您可以使用这些URL访问该县页面。 显然,代码允许多个URL–一个是网站Zui初的架构方式。 另一个是它们在上线后被修改为工作的方式。
除非没有人意识到你必须执行301重定向。
认为’ s bad? 每个县的每个城市都存在类似的问题。 是的,每个城市中的每个社区。
那个超过130个页面都有两个不同的URL你可以使用(两个版本中的许多都被编入百度索引,非常感谢你。)
可是等等!还有更多!
你猜怎么着? 当我进入百度网站管理员工具,看看是否有任何可以揭示这个问题的东西? 是的,我发现列出了100,000个404错误,全部来自5月份!
现在我通常不会过多担心404错误。 大多数大型网站都必定会有一些。 当然,它是Zui佳实践,可以解决所有问题。 然而在大多数情况下,如果有一小部分,它有时是一项低优先级的任务。
除非它是如此巨大。
特别是当他们中的大多数人都有指向他们的链接时。
如何以100,000个404错误结束。 在一个月内。
事实证明,所有这些404错误有三个主要原因。首先,当该网站在去年首次重新设计和重建时,Zui初存在URL结构问题。 回想一下我之前提到过这是如何在县/镇/邻里系统中出现重复内容问题的?
在县/镇系统中,这些第一版URL仍然可以使用。
但是,他们并不在网站的其他部分工作。 这些部分获得了新的URL结构,其第一代URL现在已经走到了死胡同。 404. 未找到。
除了’ s仅适用于少数这些。
然后就是旧网站–在重建之前存在的那个,有某种站点级电子邮件链接方案。 不要问我怎么样,或者为什么。 我所知道的是,在某些时候,有数百个URL以某种方式进入百度索引,其中URL指向该站点上的电子邮件文件夹。 在该电子邮件文件夹中,有各种指向属性页的链接。 奇怪。至少可以说。
然而,真正庞大的404计数来自现已解散的网站上的旧属性URL结构。 无论出于何种原因,当新网站建成时,没有人想到– “嘿–我们正在废弃这个旧网站。 所以也许我们应该301重定向所有这些属性页面”。
甚至在这个网站重建之前,没有人回想起旧网站上的“嘿嘿–当房产被出售时,也许我们应该为每个房产设置一个自动化的301。
清理过道3
所以,正如你可以猜测的那样,这个特定网站上的问题比上个月我第一次写这篇文章时更加混乱,纠缠和痛苦。
实质上,需要清理整个站点的URL结构。 这对我来说真棒。 因为在我的任务文件中,我不仅传达了所有那些重复的城镇/城市/社区页面需要被删除/301’ d。 我走得更远了。 并说“扔出两个版本”。 并用这种语法替换它们。
那是对的–我去了它–真正优雅,用户友好和SEO友好的URL结构。
因为我是一个好人。 ?
不是那么快,先生!
事实证明,这个特定网站的开发负责人非常合作。 非常愿意,无需推迟,改造整个县/镇/社区系统。使用我的首选网址。 那真是太棒了。
直到我得知一切都不是那么快乐。
事实证明,真正的BIG重复内容问题? 他们需要从URL中删除代理ID,并用浏览器cookie系统替换它?
是的–没那么多。 答案是响亮的,强调的,“不可能的”。”。
哦,不,你没错!
好的,所以我不是世界级的网络工程师。 我不会在睡眠中编写复杂的网站代码。但是,我过去编码了整个复杂的购物车系统,具有多层折扣,五种功能选项,多种运输方式和定价选项,安全的会员功能等等。从头开始。
所以我对饼干知道了一两件事。
不幸的是,除了我没有创建这个网站。 因此,在这次重磅炸弹讨论之前,我并没有意识到这些代理URL被嵌入到注册财产警报的人的特殊电子邮件中。
他们被联合到国家房地产网站。
是的,欢迎来到我的小世界。
所以现在,我要求的所有其他任务都将继续进行。 在下一个知道什么的人的某个时刻。
但是URL中的agentID是什么? 他们将不得不回复我们。 因为我说–想想如何解决这个问题。 因为现在它正在杀死该网站。并且“不可能”和“rdquo;是的,是不可接受的。
只是为了覆盖基础,我正在咀嚼如何解决这个问题。 如果他们回来了“我们真的想过它,我们就可以”做到这一点“。我已经想出了我认为的解决方案。
然而,我需要咀嚼它并与一位开发商朋友聚在一起,这位朋友恰好只是火箭科学家的一面。
然后,如果我能做到这一切,我会写下另一篇后续文章。 因为这样清洗灵魂是件好事,但它也是以“我们是如何做到这一点”的形式分享爱情的良好业力–所以你不必经历我们所做的痛苦…”。
CategorySEO