基于机器学习和深度学习构建的推荐算法,提升了超大规模信息分发、推荐的效率,能交付人类难以快速高效完成的任务。但由于算法是通过数据收集、特征工程、模型训练等复杂流程预测用户的行为,其本质是数学模型的运算过程,只是在建立用户行为与内容特征之间的数学统计关联,而非理解内容本身。因此相比人类,算法依然有其局限性。

推荐算法是对用户各种行为概率的综合预估
推荐只预估行为动作
当用户打开抖音时,抖音的推荐算法会给候选视频打分,并把得分最高的视频推送给用户。
用户在观看时可以对看到的视频做出各种互动,这些互动体现了用户对这个视频的感兴趣程度。比如用户点赞比不点赞要好,看完比没看完要好,没有点不喜欢比点不喜欢好。在这里,“看完了”就是一次反馈动作,“点赞”也是一次反馈动作。
用户对观看的视频的每一次反馈,都有正面或者负面的价值。抖音的推荐排序模型学习的也就是这种行为反馈,推荐系统的目标就是把反馈价值最高的视频推给用户。
抖音推荐算法的核心逻辑可以简化为“推荐优先级公式”:综合预测用户行为概率 × 行为价值权重 = 视频推荐优先级。公式展开为:

推荐优先级公式
抖音推荐预估动作率的具体步骤
算法学习:用户反馈行为输入
算法模型是预测用户各种互动和反馈行为发生的概率。发生概率是模型输出的结果,但在此之前,需要输入大量数据,这些模型的数据叫特征。模型需要内容和用户两端的数据做输入,其中主要是学习用户行为数据。抖音算法学习用户行为数据,既有实时的新数据,也很重视对用户历史行为数据的学习。下图为相关模型。

抖音学习用户反馈的深度学习算法
概率模型预测:抖音推荐算法都预估用户哪些行为
推荐算法会通过算法模型预测用户对候选视频的行为概率(动作率)。结合用户行为和视频本身的价值权重,推算出视频推荐的价值分数,并将综合得出的价值最高的视频推送给用户。
在这个过程中,推荐算法会对用户的一系列行为预估,这些行为包括点赞、关注、收藏、分享、不喜欢、是否点击作者头像、评论区停留时长、长期消费等等。

抖音推荐算法预估哪些行为(举例)
价值模型评估:定义行为的“推荐价值”
价值模型,代表了抖音对于哪些动作可能更重要的理解。简单来说,如果仅考虑用户交互概率,可能会造成一些问题,比如,一些精心制作的中长优质视频,可能因为完播率较低,而在分发中处于劣势地位。
因此,抖音的价值模型希望实现内容、用户、作者以及平台的多方价值共赢。通过价值模型,对用户的互动行为进行价值计算,并通过不断调整参数,对各类价值进行加权。
然后,按“价值最大化”原则计算出候选内容的分数。在这个原则的指导下,算法会综合考虑多个因素来评估候选内容的价值。它不仅会关注内容本身的特点,还会考虑作者的收益以及平台生态等因素。
通过对这些因素的深入分析和权衡,算法能够为每个候选内容计算出反映其潜在价值的分数,从而为后续的推荐提供有力的依据。
动态调整:价值权重的即时反馈
随着算法的进步,从行为发生到现实有效反馈的时间已经非常短,这种近似即时调整的机制,有助于算法更精准地预判用户行为。抖音已经实现了“分钟级”实时反馈更新。
人工为算法建立内容秩序
不管推荐算法如何复杂,其工作的核心都是学习用户产生的行为反馈数据,并通过概率计算,将模型中推荐价值最高的视频推送给用户。
算法不必理解晚霞为何令人驻足,只需计算用户停留在火烧云视频的时长与分享概率;算法无需参透幽默的本质,却能精准拟合一串“哈哈哈哈”的评论与众人内心欢喜的相互关系。算法始终在用数学的纯粹性,尝试复刻人类选择的不确定性。
也正是因为这个特性,若单纯依靠算法预判行为而不加约束,可能会带来不当内容泛滥等新问题。因此,对于不懂内容的算法,还需要为其构筑多层“护栏”,避免算法对内容价值的“认知盲区”引发的问题。
评论 (0)