
Guardian Media Group 公共政策总监马特·罗杰森(Matt Rogerson)发布了一篇 推特 线程剖析了为什么他认为《太阳报》和《在线邮报》关于谷歌搜索虐待他们的说法是错误的。然后,他花时间研究了为什么谷歌没有很好地对它们进行排名——而且可能很大程度上围绕著作者署名。
Matt 在名为The Sun 和Mail Online 的新闻公报上引用了这个故事,认为他们没有获得公平的Google 搜索流量份额。然后,马特提到了《太阳报》和《在线邮报》在《卫报》和其他出版物的Google 搜索中排名不佳的至少两个原因。这些原因是:
(1) 速度问题(2) 原创、深入和调查性报导的问题
速度问题很容易,我个人怀疑这是任何新闻机构在Google 搜索中看不到好的排名的主要原因。但这是他的推文:
6/ 我在21 年9 月再次运行它们,添加了 @电报.
绿色是好的,红色是坏的。
我们知道Google 将这些因素视为网站在搜索中排名的重要因素,因此这些数据是其他发布商在搜索中可能比其他发布商表现更好的客观原因。 pic.twitter.com/a6dRshYuh5
— 马特·罗杰森(@MattRogerson) 2021 年11 月8 日
我发现最具启发性的是原始、深入和调查性的报导问题。简而言之,《每日邮报》的大多数新闻报导似乎都没有署名作者,署名署名。 Matt 引用了搜索质量评估指南:
8/ @谷歌 在这方面可能不像出版商希望的那样成功(参见Sun 在文章1/ 中的担忧),但一个结果可能是严重依赖新闻机构内容的网站的搜索性能会受到影响。
— 马特·罗杰森(@MattRogerson) 2021 年11 月8 日
然后他深入研究故事的类别以及谁写了这些故事。他是这样做的:
10/ 我已经标记了存在“署名署名”、“通用”(即DM 记者)、“机构”副本(例如路透社、法新社)和未知(总文章减去没有作者信息的文章)的数据可用的)。
— 马特·罗杰森(@MattRogerson) 2021 年11 月8 日
这是他想出的:
12/ 在“Covid”搜索词中,近60% 的内容归功于代理机构,仅超过3% 的内容来自署名署名。 https://t.co/HUC90vrC5e pic.twitter.com/8UZNDx1UNt
— 马特·罗杰森(@MattRogerson) 2021 年11 月8 日
14/ 在我们的论文中 @Ofcom,我注意到DM 擅长搜索的领域,“Kim Kardashian”就是一个很好的例子。
代理文案在这里仅占3%,通用或命名署名占20%。
与前三个术语有很大不同。 https://t.co/Xpugc4LjuU pic.twitter.com/PI5IgWXmjN
— 马特·罗杰森(@MattRogerson) 2021 年11 月8 日
15/ 如果DM 自己的搜索功能是正确的,+ 考虑到% 的作者未分类,数据表明,在DM 档案中的约480 万篇文章中,超过50% 直接来自新闻机构。 pic.twitter.com/EvNndKIsSE
— 马特·罗杰森(@MattRogerson) 2021 年11 月8 日
看看馅饼的“命名署名”切片有多小。我不确定它与《卫报》或其他出版物相比如何,但老实说,看到这个数字如此之低,我感到很震惊。
他的结论:
17/ … 客观数据表明,主观性以外的因素可能在一定程度上影响了 @谷歌 将DM 与其他出版商进行比较。
但我喜欢比我更有学识的专家的想法。我不自称是专家! !
— 马特·罗杰森(@MattRogerson) 2021 年11 月8 日
大家怎么看?这是署名的力量,还是只是表明内容不是“原创、深入和调查性报导”的一个信号。
论坛讨论在 推特.
更新:这是来自MailOnline 发言人的声明。
不幸的是,马特罗杰森推文中的研究包含一个致命的缺陷。
他使用MailOnline 的现场搜索功能,找到了480 万个URL,其中50% 是通讯报导。他认为这会对MailOnline 的Google 搜索性能产生不利影响。 ”
马特不知道,因为他没有联系我们征求意见,MailOnline 阻止了谷歌索引机构的故事。它是在Google 读取的页面代码中自动完成的。官方的说法是“对meta robots 标签应用noindex 值,以避免Google 将这段内容编入索引”。
这意味着Google 不会考虑MailOnline 上的有线故事进行排名。因此,这些故事对Google 对MailOnline 原创署名内容的排名影响为零,当然不会被屏蔽。
这同样适用于马特描述为“通用”的类别,我们认为他指的是图片库,其中带有通用的“MailOnline Reporter”署名。其中大部分被谷歌阻止索引,因此对搜索排名的影响为零。
另一个可能没有署名的类别是视频。这是被谷歌索引的,但在搜索中表现不错,所以不支持马特的情况。
最后还有一个大类,马特将其描述为“未知”。他将此描述为“总文章减去没有作者信息的文章”。我们假设Matt 表示MailOnline 的作者信息,因为事实上一些有线故事也带有署名。如果您从所有文章总数中减去没有MailOnline 作者信息的文章数量,您将得到MailOnline 署名文章。但马特已经单独列出了带有署名署名的MailOnline 的文章。如果你把所有文章都减去,然后减去那些MailOnline 作者信息可用的文章,你就会得到通讯故事、画廊和一些视频——但马特也将它们单独列出,所以不能再数了。无论马特所说的“未知”是什么意思,他似乎一直在重复计算。
由于所有这些原因,我们担心马特的研究没有有效性,也没有解释为什么卫报在谷歌搜索排名中的表现比其他新闻网站好得多。