
微软Bing 发布了一个 新博客 帖子说“对于XML 站点地图,您可以在站点地图中包含的最重要的标签之一是“lastmod”标签。” 随着Bing 正在重新设计其抓取调度堆栈以更多地依赖于这个lastmod 字段,它将变得更加重要。
是的,到6 月,Bing 决定抓取内容的方式将更加依赖于lastmod 标签。来自Microsoft 的Fabrice Canel 写道:“我们正在改进我们的抓取调度堆栈,以更好地利用站点地图中“lastmod”标签提供的信息。” 这样做是为了“通过减少对未更改内容的不必要抓取并优先考虑最近更新的内容”来“提高”抓取效率。
他补充说:“我们已经开始在有限的范围内实施这些变化,并计划在6 月之前全面推出。”
因此,确保您的lastmod 日期准确现在变得更加重要。它应该是您最后一次修改URL 的时间,而不是首次发布URL 的时间,也不是生成XML 站点地图文件的时间。事实上,这是Bing 在该字段中发现的最大问题,它通常只显示XML 站点地图文件的生成日期,而不是URL 页面的最后修改日期。
以下是Bing 在XML 站点地图上汇总的一些数据点:
- 58% 的主机拥有至少一个XML 站点地图。
- 这些站点地图中有84% 具有lastmod 属性集。
- 79% 的lastmod 值是正确的。
- 18% 的lastmod 值设置不正确。
- 3% 只有部分URL 具有lastmod 值。
- 这些站点地图中有16% 没有设置lastmod 属性。
- 42% 的主机没有XML 站点地图
哦,Bing 仍然希望您使用IndexNow 协议来获得最有效的爬网解决方案,但如果您不这样做,请确保您的lastmod 日期准确无误。
就谷歌而言,谷歌在2015 年表示他们并没有真正使用lastmod 日期,但随后在2020 年改变了这一点,他们说他们这样做了。当前的谷歌文档 说,“如果lastmod 值始终如一且可验证(例如,通过与页面的上次修改进行比较)准确,Google 就会使用它。”
论坛讨论于 推特.