抖音公开算法黑盒网红是你们自己选出来的

抖音 抖音 4376 人阅读 | 0 人回复 | 2025-04-25

在经历多次因热点事件处置引发舆论争议后,抖音近日首度公开了算法推荐原理和平台治理机制,并面向公众上线了专门网站,对公众关注问题进行答疑。此次开放的算法原理说明显示,抖音的推荐系统已进化至以神经网络计算为手段,通过预测用户行为概率和用户不同行为的价值权重来确定视频推荐优先级,而非依赖传统认知中的狭义上给用户或内容打标签来推荐。

在推荐机制层面,抖音基于用户行为的推荐方法包括协同过滤、双塔召回、Wide&Deep等多种技术模型。算法可以在完全“不理解内容”的情况下,找到兴趣相似的用户,将其他人感兴趣的内容推荐给该用户。系统在用户每次浏览时会对候选视频进行实时打分,综合考量完播率、点赞、评论、分享等数十项互动指标,最终选出互动价值最高的内容进行推送。也就是说,系统不知道你为什么喜欢,只需推测你最喜欢什么,归根到底,还是一种数学概率游戏。另外,对于公众关心的几个热点问题,抖音也都在官网上进行了回应。

问题1、“信息茧房”是算法推荐形成的吗?
同质化选题的密集推送容易造成“信息英房”现象,对此,抖音相关责任人回应称:“信息茧房”概念在推荐算法成熟之前就出现了,算法不是“信息茧房”形成的先决因素。现在行业对“信息茧房”的担心本质是“信息偏食”,即信息来源单一。为引导算法打破信息茧房,抖音算法在多自标建模体系下,设置了专门的探索维度。一是对用户在平台上已经表现出的兴趣,尺可能推荐更多样的内容,通过多样性打散、多兴趣召回、扶持小众(长尾)兴趣等方法控制相似内容出现的频次。二是帮助用户探索更多新兴趣,采用随机探索、基于用户社交关系拓展兴趣、搜索推荐联动、“不感兴趣”不再展现等多种方式,让用户的主动行为影响推荐系统,使推荐更加个性化和多样化。

问题2、算法是否故意推荐擦边内容来提升用户使用时长?
抖音算法工程师刘畅表示,抖音更关注用户长期价值,而非追求平台的短期数据。为此,抖音算法考虑了众多自标,如完播、评论、点赞、对作者长期消费、分享、跟拍等,力图计算出更符合用户长期价值的目标。

问题3、现象级网红是平台“强推”出来的吗?
在郭有才等网红走红过程中,一些网友怀疑双红的红是否由平台算法强推出来的。抖音对此表示,这锅我们不背,是你们自己“选”出来的。创作者走红是多个因素共同作用的结果,其中最主要的原因是用户最大公约数的选择一一即用户通过点赞、留言、关注、分享等行为,对自己认同的内容“投票”。一旦算法启动,它就会尊重广大用户的选择。如果给用户硬推不感兴趣的内容,会有大量负反馈,用户会点不感兴趣乃至举报,会不利于用户体验。

问题4、App会“窃听”用户谈话吗?
抖音官网表示,平台没有动力这样做,合规要求也不允许这样做。之所以用户有这样的误解,可能是两方面的原因:一个可能是跨平台营销推荐。这类广告是基于用户在前述应用上的网络行为数据,比如浏览、点击、收藏等举动而对用户进行行为偏好预测,然后形成用户群体画像,进行定向营销广告。例如,用户在A电商平台搜索了一款猫粮。关闭A平台后打开了B社交平台,发现B平台也在推荐猫粮。这并不是B平台对用户做了监控,是A平台作为B平台的广告主,通过程序化广告利用A平台的数据定向给用户展示了广告,实现跨平台的广告营销。另一个原因可能是“幸存者偏差”。例如有一千名用户都提到了猫,其中999名用户打开App后推送的内容都与猫无关,但有一名用户发现App推送了猫的内容,这种反常的巧合格外引人注意,这名用户就会将其放大,甚至猜测App在“窃听”。

除以上问题,相关负责人还解释了抖音内容治理体系的运营机制:实行“人工参与+机器学习模式,包含异常感知、标准定义、机器识别、人工研判、风险处置等过程。创作者将内容上传至抖音后,先进入机器识别环节。如果内容被识别出含有高危特征,将被直接拦截;若未命中高危特征但模型判断有问题,会被送至人工审核;若问题概率较低,获得基础流量进入下一环节。当视频被举报、评论区出现集中质疑、流量激增等情况发生,则可能触发“人工+机器”审核。

看到上述机制,和圈哥过往工作中的治理策略经验基本是相符的,无非是数据生产-拦截-审核-入库-分发-高曝光负反馈-召回复审这么一整套流程,不一样的是,在治理闭环链路中机器学习参与的比重会越来越大,毕竟降本增效永远是各个内容大厂永恒的追求。

关注下面的话题,发现更多精彩
回复

使用道具 举报

高级模式
B Color Link Quote Code Smilies

本版积分规则

两年抖音创业电商,有过失败有过成功,分享失败与成功经验
106
获赞
48
内容
38
关注
13
粉丝