Facebook 算法如何对新闻提要内容进行排名

Facebook 发表了一篇文章,解释了 Facebook News Feed 算法的工作原理。 与 Facebook 的新闻提要算法专利相比,这两份文件都解释了 Facebook 如何在新闻提要中对帖子进行排名。

机器学习和排名

Facebook 的新闻提要算法是一种机器学习排名系统。 不过,这不仅仅是一种算法。 它是在不同阶段协同工作的多种算法的组合。

算法的一部分做不同的事情,比如选择“候选”帖子显示在一个人的新闻提要中,消除带有错误信息或点击诱饵的帖子,创建一个人与之交互的朋友列表,这个人倾向于参与的主题,然后使用所有这些因素都会对 Facebook 新闻提要中的帖子进行排名(或不排名)。

应用所有这些不同的层是为了预测 Facebook 成员会找到与他们相关的内容。

算法的目标是对出现在新闻提要中的帖子、它们的顺序进行排名,并选择 Facebook 成员可能感兴趣并与之互动的帖子。

考虑的不仅仅是几个信号。 Facebook 表示他们使用了数千个信号。

根据脸书:

“对于 Facebook 上的每个人,我们需要评估数千个信号,以确定那个人可能认为最相关的内容……预测每个人希望在他们的信息流中看到什么……”

Facebook 动态消息排名信号

Facebook 帖子的特征

Facebook 讨论的排名信号之一是“特征”的一篇文章。

Facebook 正在使用帖子的功能或质量,并确定这是否是用户倾向于与更多互动的类型。

例如,如果帖子附有彩色图像,并且成员有与带有彩色图像的帖子进行交互的历史,那么它的排名会更高。

如果帖子附有视频,并且这是 Facebook 会员喜欢与之互动的内容,那么该会员的排名会更高。

帖子是否有图片、视频,是否在帖子中标记了用户的朋友,帖子的这些和其他特征被用作确定帖子是否要显示给用户以及显示多高的排名因素它将在新闻提要中排名。

Facebook 使用了一个名为 Juan(西班牙语中的名字“John”)的虚构用户的例子来说明特征排名因素。

这就是 Facebook 所说的特征排名因素:

“我们可以使用帖子的特征,例如照片中的标签以及发布时间,来预测 Juan 是否会喜欢它。

例如,如果 Juan 倾向于经常与 Saanvi 的帖子互动(例如,分享或评论)并且她的跑步视频是最近的,那么 Juan 很可能会喜欢她的帖子。

如果 Juan 过去参与的视频内容多于照片,那么对于 Wei 的可卡犬照片的点赞预测可能会相当低。

在这种情况下,我们的排名算法会将 Saanvi 的跑步视频排名高于 Wei 的狗照片,因为它预测 Juan 喜欢它的概率更高。”

时间是 Facebook 排名因素

上面提到的 Facebook 的例子也说明了时间,以最近发布的形式,也可以用作排名因素。

虚构的“胡安”这个例子的有趣之处在于,Facebook 提到,发帖时间是一个排名因素。

“我们可以使用帖子的特征,例如照片中的标签以及发布时间,来预测 Juan 是否会喜欢它。”

时间作为排名因素的这一方面与 Facebook 的一项相对较新的专利相吻合,该专利指出,最近发布的内容可以用作排名因素。

Facebook 的新闻提要专利被称为, 为社交网络系统用户识别外部内容的新闻故事的选择和呈现.

这就是 Facebook News Feed 专利所说的:

“……新闻故事可能会根据与新闻故事互动相关的时间顺序数据进行排名,以便最近共享的新闻故事具有更高的排名。”

这似乎证实了在一天中多次发布同一帖子的价值。 它可能会在不同的时间段内接触到不同的人,与帖子互动的人可能会帮助将其展示给他们的朋友等。

参与度和兴趣

另一个排名因素涉及预测用户是否可能对帖子感兴趣或参与其中。 Facebook 使用许多信号来做出预测。

这篇文章在这一点上很清楚:

“……系统通过预测您最有可能感兴趣或参与的内容来确定您的动态消息中显示的帖子以及显示顺序。”

Facebook 使用的其中一些因素是来自过去帖子和用户互动过的人的信号。 Facebook 使用这些过去的交互来帮助它预测用户将来会与什么交互。

根据脸书:

“这些预测基于多种因素,包括您最近关注、喜欢或参与的内容和对象。”

Facebook 使用机器学习模型来预测这些不同的事物。 有一个模型可以预测用户会喜欢什么内容,另一个模型可以预测用户会评论哪些帖子。

这些参与形式中的每一种都会获得一个排名分数,然后进行排名。

总而言之,排名过程首先从用户上次登录后发布的帖子池中识别要排名的候选帖子。

下一步是为每个帖子分配排名分数。

这就是 Facebook 通过使用一个名为 Juan 的虚构用户的示例来解释它的方式:

“接下来,系统需要根据各种因素对每个帖子进行评分,例如帖子的类型、与其他项目的相似性以及帖子与 Juan 倾向于与之交互的内容的匹配程度。

为了计算 1000 多个帖子、数十亿用户中的每一个用户的这一点——所有这些都是实时的——我们在多台机器上并行运行所有候选故事的这些模型,称为预测器。”

排名信号是为用户个性化的

对排名因素的一个有趣见解是,从一个用户到下一个用户,它们的权重不同。 加权意味着何时排名信号比另一个排名信号更重要。

Facebook 透露的是,对于一个人来说,他们会“喜欢”一篇帖子的预测可能对该帖子是否被排名产生更大的影响。

对于另一个用户,该用户将对帖子发表评论的预测被赋予更强的排名权重。

脸书分享:

“接下来是主要的得分传球,大部分的个性化都发生在这里。

在这里,每个故事都独立计算一个分数,然后将所有 500 个帖子按分数排序。

对于一些人来说,喜欢的分数可能比评论的分数更高,因为有些人更喜欢通过喜欢而不是评论来表达自己。

一个人很少参与的任何动作(例如,非常接近于零的类似预测)都会自动在排名中发挥最小作用,因为预测值非常低。”

这意味着,为了使帖子成功,帖子必须激发每个用户不同形式的参与。

新闻提要多样性的上下文特征

排名过程的最后一步是确保新闻提要中显示的内容类型的多样性。 这样用户的提要就不会变得重复。

多个个性化的 Facebook 排名因素

Facebook 并未列出用于对新闻提要中的帖子进行排名的所有排名因素。 但他们确实给出了一个想法,概述了排名过程是如何发生的以及优先考虑哪些类型的行为。 我们还了解到,排名信号是动态的,可以根据人的不同进行不同的加权。

引文

新闻提要如何预测您想看到的内容?

机器学习如何为 Facebook 的动态消息排名算法提供支持

为社交网络系统用户识别外部内容的新闻故事的选择和呈现 (PDF)

社交网络系统用户的情绪极性 (PDF)

重新排列故事内容 (PDF)

为辅助系统从多个数据源解析实体 (PDF)

给TA打赏
共{{data.count}}人
人已打赏

2022 年105 个惊人的Facebook 广告统计

2019-9-11 22:26:29

Goal Talk 播客第 5 集:Google、Facebook 和 Bing 上的广告基础知识

2021-11-26 11:24:52

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
搜索