审核员永不眠

  

  北京冬奥会开幕那一天,国内视频类龙头Bilibili(B站)迎来年轻人的欢腾与追捧。然而,B站员工管先生(花名“暮色木心”)却永远也感受不到了这一切了。因为这位年轻人:

  过年期间值班,在晚上9点到早上9点(12小时)的工作强度下,2月5日凌晨脑出血猝死。

  然而,在B站的内部信和随后的道歉信中,管先生的离世是一个意外,他是按照工作计划正常上下班的,连加班都算不上。不过,在春节期间,良心的B站还体贴地管先生这样的正常上班员工提供了3倍工资。

  但残忍的是,1月12日,管先生就要满25岁了。也就是说:

  他的头七,也是他的生日。

  一个巨大的疑问在于,管先生从事的是什么特殊职业,连春节期间晚9早9都是正常上班呢?

  答案从此前B站的招聘要求可以得知:

  此岗位有夜班、通宵班,每天工作12小时,做一休一。团队并实行三班倒机制,早班9:00-21:00、晚班21:00-9:00、中班12:30-24:30。

  而管先生的身份,从B站内部通报邮件中的身份披露亦可见一斑:

  武汉AI审核组代组长。

  

  我们可以大胆推测,管先生是一名优秀的员工。不仅因为他入职不到2年就升任代组长,而且因为他在春节期间给自己排了不少21:00-9:00的晚班。

  颇具黑色幽默的是,即使是这份姗姗来迟的道歉信,也是B站员工加班发布的。

  

  审核工作的特殊属性当然不只是“全天候”那么简单。事实上,当B站上众多视频热议管先生时,相关讨论(包括视频、弹幕)迅速被列为违规,审核不予通过。可见:

  管先生的同事是化悲愤为力量,坚决执行工作纪律的。

  铁人同志在哀悼列宁的发言中说到:

  我们XXXX是具有特种性格的人,我们是由特殊材料制成的。

  我认为从事全天候特殊属性工作的B站审核员也是。

  我国的网络审查员制度,是随着互联网的发展而诞生、壮大的。从1998年新闻出版署的联合声明,到后续工信部的具体规定,再到门户网站的兴起,网络审查从政府行为趋于企业行为,工作内容也有了新的变化。

  我对审查员的初印象源于大学毕业前夕,一位同学兴高采烈地冲进宿舍,向我们昭告的一条招聘信息。阅片上万的猎奇心理、颇有竞争力的薪酬待遇、党员优先…让我们叹为观止。这个职业被简称为:

  网络鉴黄师。

  但事实上,淫秽物品鉴定仅是审查员的部分工作职能。现如今,审核工作已经成为各大平台内容发布的前置步骤,直接影响内容数据。

  一般说来,在经过初审后,再由复审团队把初审团队评定为“安全”的内容,人工打上“优”、“良”、“一般”的标签,从而决定内容的曝光推荐级别。

  而在时效性上,大原则是“当日内容当日审核完毕”,有些公司更是规定,用户上传的内容在2小时内审核完毕。

  这么庞大的工作量与深刻的利益纠葛,使得审核方法也不断改良,逐步形成了AI(人工智能)初审+人工复核的模式。

  人工复核且放一边,先来说说被寄以厚望的AI初审吧。它的原理就是把大量人工审核结果作为样本,供算法系统进行学习;然后用成长的AI替代人工审核。其优点在于标准统一,且处理效率极高。

  但AI审核并不能完全取代人工。其中原因是多方面的。

  一方面,内容标准难以量化。打个比方,假设“如果”成为审核关键词,那么“罐头不如果汁好吃”算不算违规呢?假设身体裸露涉嫌违规,那么二次元人物(甚至动物卡通形象)的判断标准又有什么不同?

  另一方面,是“道高一尺,魔高一丈”的用户对抗策略。例如,除了普遍运用的谐音梗,更成熟的方法是利用机器学习的弱点,有针对性地增加机器噪声,从而欺骗算法。

  举个例子,在图像识别中,就可以通过人眼难以感知的像素图像叠加,使AI把左图中的熊猫形象识别为长臂猿。

  而更现实的问题是,训练AI是要花钱的,而且价格高昂。MIT的研究表明,大多数AI模型需要超过10万个数据样本,才能初步展示出良好的训练效果。以谷歌的BERT 模型为例,构建和测试最终具有价值的模型需要至少六个月,且不说软硬件投入:

  仅仅是训练过程中的能耗,就相当于78,000 磅的碳排量。

  这就意味着,即使是出于成本考虑,各大公司也不可能无限制地迭代学习。

  就像周星驰电影《大内密探零零发》中,由鼠力发电驱动的按摩床一样;人工,也只有人工,才能替代AI,圆满完成日趋复杂的审核工作。

  价格便宜还环保,简直是完美的解决方案。

  2017年5月,网信办公布了《网络产品和服务安全审查办法》,建立起网络安全审查委员会,并一再重申:

  第十二条网络产品和服务提供者应当对网络安全审查工作予以配合,并对提供材料的真实性负责。

  而试行快一年后,有关部门突然发力。2018年4月,快手、火山、B站均被约谈整改,头条干脆撤除了内涵段子。内容审核行业迎来了指数增长,头部平台的审核团队,招人都是:

  以千为计量单位。

  而在纳斯达克上市仅一个月的B站,更是胆战心惊。据悉,B站的审核员在分析违规外,还需要进行不定期的站内主动回查。

  2021年3月,B站在香港二次上市,招股说明书以及随后的投行研报显示,作为国内最大的长视频UGC平台,B站的日活用户达到了7000万,UP主月均投稿量居然突破了1000万。

  

  相应地,截至2020年底,B站共有2413名内容审核岗员工,占公司全员工比例的27.9%。

  但就算是这样,审核的人手还是极为紧张的。据悉,审查员一天的工作状态,是以秒为单位计算的,每天500~1000条内容的任务量,居然还是垫底。一位审核员私下透露:

  时长90秒左右的短视频,我一个小时必须审800条。

  然而,审查效率只是一个方面,公司还设立了抽检复核部门,如果审核员仅拿到97%的合格率,则属于质量尾部,是需要扣除绩效、整改提高的。

  除了枯燥且严苛的工作要求让替代AI的员工头皮发麻,长期与负面信息接触后导致的巨大心理压力、对审核人员的低评级社会评价则凸显出另一个严重的问题:

  这样的工作到底对我有什么价值?

  因此,尽管多数互联网大厂将审核岗设置在二三线城市,对学历要求放宽为大专或者本科以上,并提供相对有竞争力的薪酬(14薪,基本工资为4000-6000元)。但审核团队的流动性极大,工作不超过1年即离职的大有人在。

  2021年,某大厂严正申明:

  我司审核岗位的竞聘流程不存在学历歧视,并未对985、211院校毕业生设置排他性门槛。

  所谓“此地无银三百两,隔壁阿二不曾偷”,这一波逆向歧视,可还行?

  

  其实,把眼光投向全球,审核员之殇绝非个例。

  2020年5月13日,Facebook同意支付5200万美元和解与内容审核员的诉讼,用于医治后者在工作过程中产生的心理创伤。而早在2018年,汉斯·布洛克就根据这一马拉松式诉讼案,拍摄了一部高分的纪录片:

  《网络审查员》

  耐人寻味的是,截至2020年初,Facebook共有1.5万内容审核员,但几乎所有人都不是Facebook的直接雇员,而是受雇于埃森哲和高知特等劳务派遣公司。

  可见,临时工制度已是资本共识。在这方面,B站还是没有学到同行的精髓,居然以公司名义聘用员工,而不是将外包制度发扬光大。

  

  在2月8日的长文道歉信中,B站宣称将扩招审核人员 1000 人,降低工作压力。

  

  有朋友问我:“元芳你怎么看?”

  我当然是坐着看,然后给你讲个故事啊。

  上世纪五十年代,哥伦比亚大学经济学家贝利与哈佛大学教授多德(就是和格雷厄姆合写经典教材《证券分析》的那位)展开了大论战。双方的焦点在于:

  公司究竟是不是股东至上,应不应该考虑包括员工、社会责任在内的利益相关者?

  对这个问题的看法,关系到公司金融与财务问题基本假设,绝非等闲之事。一时间双方你来我往好不热闹。

  但二十年后,贝利在《二十世纪的资本主义革命》一书中公开表示:

  这场争论是以完全赞同多德教授的意见而结束的,企业必须考虑利益相关者的需求,现代公司不仅是一项经济制度,还是一项准政治制度。

  同理,虽然人们对审查员的工作存在诸多微词,但我们又不得不承认,这又是个必须存在的工作。然而,B站等大厂们也必须认识到,光靠人肉电池的24小时无休止服务,已经越来越不适应信息时代与大数据浪潮的需要了。

  说得更明白点,AI审核再费钱再不绿色环保,该上的还得上。

  别忘了电影中,周星驰的鼠力发电机虽然可以调档,但用力过猛后还是会系统散架的。

  

  而对B站的“增员策略”,这是解决问题的终极手段吗?

  这其实是一个哲学问题。很大程度上,它不是能不能完成工作量的问题,而是关系到把员工当成工具还是当成人的问题。

  我们口口声声重视人才、重视人口危机,可不是把人招进来当作AI的廉价替代品;更不能在KPI的大棒之下、无视审核工作导致的沉重心理压力与社会伦理问题。

  南宋时的张知甫,在他的笔记中记录了金国入侵之下,宋人无奈之下的黑色幽默:

  敌有狼牙棒,我有天灵盖。

  欣欣向荣的B站,可不能“你有人工智能,我有智能人工”,更不能最后变为“灵活就业增加1000人”的喜报啊。

  最后要说的是,据管先生的表妹透露:

  在前日下葬时,为了规避现场情绪激动可能导致的紊乱,B站没有派人出席优秀员工的葬礼。

  觉得有趣,关注公众号:将军箭,不过分吧?

  发现“分享”和“赞”了吗,戳我看看吧