“算法的社会性知识”——短视频内容创作者的算法解释与知识的集体建构

  本刊官方网站:

  http://cjjc.ruc.edu.cn/

  摘要

  算法已经成为当今世界的一个文化逻辑,但由于算法技术的结构性隐匿,关于算法的知识被框定为系统的纯粹技术性专业知识,忽视了对算法的社会性解释。在与用户对算法的感知研究和知识社会学的学术对话中,本研究概念化了“算法的社会性知识”,用以指涉与技术性算法知识相对的、在算法结构化的社交媒体中由用户集体建构的与算法有关的本土化问题解释。通过对短视频内容创作者进行的数码和实地民族志,本研究揭示了算法知识片段从算法-用户互动的具体日常情境中涌现的过程及其类型。这些局部的知识片段通过“私密验证”的方式进行关系性的拼贴,在松散的民间算法知识社群中被集体建构为“算法的社会性知识”。“算法的社会性知识”作为社会性的,而非认知性的实践知识,指导人们协商与算法的关系以导向应对算法的行动策略,并因此被纳入到算法的递归反馈回路之中,随不稳定的算法生态而快速变动。

  作者简介

  赖楚谣,华东政法大学传播学院副研究员。

  基金项目

  本文为复旦大学新闻学院第四批新媒体系列项目“平台化与审美公众:公共传播视角下的媒介娱乐研究”阶段性成果。

  一

  引言:

  算法技术的结构性隐匿与社会性解释

  算法以技术无意识(technological unconscious)的方式在社会生活中占据了越来越重要的位置,正在广泛地影响着人们的日常决策并成为新的权力经纪人(Diakopoulos,2013;Beer,2017;Willson,2017)。随着人工智能算法技术社会应用的大规模开展,可以说,算法已经成为当今世界的一个文化逻辑,它嵌入了网络社会的几乎所有领域,参与构建了理解传播实践和社会生活的基础性框架(Lai,2022)。

  如同以往每一次颠覆性的技术变革,以算法为代表的一系列互联网新信息技术的推进不仅仅是技术对象本身令人惊异的发展,更与人和社会的新可能性紧密相连。因此,人们更加希望了解算法是如何影响自身、社会和日常生活的,但当人们试图理解这一技术对象时,面临的首要困难就在于算法技术性内部的不可知。算法系统的高度复杂性叠加深度神经网络模型本身固有的可解释性(interpretability)等问题使得普通用户几乎不可能掌握算法处理的技术细节及动态特征。同时,由于商业竞争、技术垄断等多种显而易见的原因,大部分的算法都是在不接受公开审查的环境中创建的,而且很难通过谈判进入编码团队或获取他们编制的源代码(Kitchin,2017)。因此,用户面对的是算法技术本身的结构性隐匿,算法深藏于Pasquale(2015:1)所说的“黑箱”(black box)之中。普遍的“黑箱”隐喻下,算法领域被塑造为一个不透明的、抽象的技术领域,关于算法的知识也被框定为被技术精英垄断的专业壁垒高耸的纯粹技术性知识。

  但绕过不透明的算法技术性内部,越来越多的研究观察和探讨了通过媒体平台接口与算法进行持续性互动的用户从经验参与的算法外部如何理解和回应算法(Bucher,2017;Cotter,2019;Bishop,2019;张萌,2022)。这一类的研究不是将算法视作与代码有关的抽象计算过程和纯粹技术性对象,而是将算法视作是在更广泛的社会-技术集合的语境下被架构的(Kitchin,2017),经多重实践交汇,时时处在生成过程的一系列复杂后果(潘霁,2021)。因此不同于技术性层面的算法研究,这类算法研究从算法的外在表现和展示出发,由“果”至“因”地阐释算法逻辑在社会文化层面的意义生产(孙萍,邱林川,于海青,2021)。本研究延续了这种研究算法的进路,以算法驱动的社交媒体(主要是中国的短视频应用,包括抖音、快手等)为主要经验场域,考察这些社交媒体中的内容创作者的算法知识建构过程。在与以往关于用户对算法的感知研究和知识社会学的学术对话中概念化了“算法的社会性知识”,强调与技术精英垄断的纯粹技术性知识相对,存在一种自下而上的、非正式的算法知识领域。

  二

  理解算法:用户对算法的感知维度

  在社会性层面的算法研究趋势中,人机交互(human-computer interaction)领域涌现了一系列探索性的,关注用户对算法技术感知的研究。这些研究在关于算法的知识方面有共同的兴趣,它们重申了用户视角的重要价值,其核心是了解人们——无论是专业内容创作者、普通用户还是更广泛层面的公众——对算法系统的理解和思考。

  这一领域的开创性研究将“算法意识”(algorithm awareness)作为用户认知算法的起点。随着算法技术社会应用的普及,用户逐渐产生了所谓的“算法意识”,即意识到算法的存在及其潜在影响。“算法意识”在现今的数字生活中至关重要,以至于Gran、Booth和Bucher(2021)将算法意识视作一种元技能(meta skill)——一种可以提高其他数字技能和总体效益的知识或理解的技能,对算法的认知可能构成新的数字鸿沟。

  比“算法意识”更深入的对算法的认知被Bucher(2017)概括为“算法想象”(algorithmic imaginary),这一概念具体指向“思考算法是什么,它们应该是什么,它们是如何运作的,以及这些想象反过来又使什么成为可能”的相关问题。通过与算法的情境接触,“人们学习他们需要知道的东西,以便有意义地参与并找到他们在算法中介的世界中的道路”(Bucher,2018:98)。

  与“算法想象”的相关研究类似,关于算法的民间理论(folk theory)的一系列研究展现了相似的研究兴趣,它关注人们用来解释算法行为和影响的直观因果框架(DeVito,2021;DeVito,Gergle & Birnholtz,2017)。这一领域的研究借助民间理论的框架来分析人们如何看待媒体中的算法,从日常数据处理和算法的经验中探索和概括用户对于算法系统持有的不同理论。Siles等(2020)在对Spotify推荐算法的研究中展示了民间理论作为话语资源如何支持用户制定不同形式的算法纠缠,同时指出这也是他们融入构建自我和归属感的文化过程的方式。在这一研究中,他们还特别强调关于“像Spotify这样的算法系统是什么”,以及“如何使用它们”,还存在许多可能的理论,只要符合特定的文化环境和需求,就会成为对人们有用或可接受的民间理论(Siles,Segura-Castillo,Solís & Sancho,2020)。

  值得注意的是,算法民间理论的相关研究形成了一系列有意义的类型学。DeVito等人(2017)确定了与Twitter算法和算法时间轴有关的两种不同民间理论:实用理论(知道一些影响算法策划的标准)和抽象理论(一种不精确的感觉,意识到算法时间轴会对Twitter产生影响)。在这项工作的基础上,DeVito(2021)形成了一种算法民间理论的类型学,包括“基本意识”“因果力量”“机理碎片”和“排序机制”。Dogruel(2021)也证明了三种关于算法如何在互联网用户中工作的民间理论:个人互动理论、流行度理论和分类理论,以及平台的经济导向塑造功能的理论。Ytre-Arne和Moe(2021)利用2019年在挪威进行的一项媒体素养调查的数据确定了五项关于算法的民间理论:算法是具有局限性的、实用性的、还原性的、无形的和剥削性的。这些算法民间理论的类型学分析有助于在跨平台的背景下丰富不同语境中社会性层面的算法解释。

  既往关于用户对算法的感知的相关研究共同强调了用户对算法的意义解释绝不仅仅是一个技术理解问题,而更是一个内嵌于社会系统中的文化解释的过程。但现有的研究存在以下两方面的问题:首先,最初从用户角度出发展开的算法研究致力于捕捉基于个体经验的“个人算法故事”,这似乎影响了之后的研究思路,使得这一领域的研究在一定程度上存在对算法知识社会维度的忽视。尽管已有一些研究关注在特定的社区或群体中与算法有关的知识分享(Bishop,2019;Schellewald,2022),但尚缺少足够的经验性研究考察和讨论算法知识是如何由个体经验转变为公共知识的,这也关涉算法知识在更广泛的社会层面被组织、共享和传播的过程。其次,中国的新技术与日常生活的融合程度已经居于世界前列,中国的社交媒体用户在与算法的互动中发展出了极为丰富且富有想象力的理解和实践,但基于中国独特的本土化经验的探讨却依然不够充分。目前,相关研究绝大多数是在西方语境下展开的,少数中国语境下的研究(Sun,2019;Zhang,Chen & Xi,2020;张萌,2022;陈阳,吕行,2022)也仍未突破算法技术的规约和用户的底层反抗这一二元对立视角。

  三

  概念化“算法的社会性知识”:

  知识作为一个框架

  更广泛的知识社会学理论,有助于将注意力集中于算法知识的社会维度,并在其中定位“算法的社会性知识”。知识社会学强调所有知识的共同之处在于,它们是在社会环境中,在不同的群体和制度动态中发展起来的(Bili?,2015;王佳鹏,2021)。知识社会学的研究总是致力于理解处于具体的历史-社会环境中的思想。伯格(Peter Berger)和卢克曼(Thomas Luckmann)(1966/2019)认为知识社会学只关注社会中任何被认为是“知识”的东西,而不考虑这种“知识”的最终有效性(伯格,卢克曼,1966/2019:15)。

  知识社会学领域对于知识的分类将有助于在知识理论的框架中进一步定位“算法的社会性知识”。知识社会学区分了两种不同类型的知识——“表象知识”(representational knowledge)与“实践知识”(practice knowledge)。“表象知识”指涉强意识的、抽象的、可以言明的系统知识,具有普遍意义,不以环境文化等具体地方性要素为转移(张伟伟,2018)。实践主义挑战了理性主义主客二分的认识观,进而影响了对知识的诠释,在波兰尼(Michael Polanyi)(1958/2017)的“个人知识”(personal knowledge)和“缄默知识”(tacit knowledge)的基础上提出了“实践知识”(practice knowledge)的概念。“实践知识”是主体在动态介入客体的可见过程中自然涌现出来、难以言说的经验积累(Nordmann,2006),同时又是在具体情境中生发的,因此是地方性的、自下而上生成的。另一个具有参考意义的知识分类是威廉·詹姆斯(William James)(1890/2013:43)提出的两种知识形式:“知晓”(knowledge of acquaintance)和“理解”(knowledge about),前者指涉大众观念和常识或日常知识,后者指涉系统化的专门的知识(马尔凯,1979/2001:4)。这一知识分类被Park引入对新闻的定义中,在这一基础上,Park(1940)认为应该将知识视为一个连续光谱(continiuum),“知晓”和“理解”构成光谱的两端,不同类型的知识可被定位为光谱中不同位置的点。

  与政治知识(political knowledge)、经济知识(economic knowledge)、新闻(news)、故事(stories)以及其他的知识领域一样,算法知识是涉及特定领域的一种知识类型,它指向所有与算法这一社会-技术系统有关的问题解释。算法知识领域同样存在一个“表象知识”与“实践知识”,或称“理解”和“知晓”的连续光谱,“算法的社会性知识”作为算法知识的子类,是建立在对于技术性算法知识的批判性反思基础之上的,因此应当位于靠近“实践知识”/“知晓”的一端,代表了与系统的抽象算法技术知识相对的一种自下而上建构的非正式算法知识。在本研究中,“算法的社会性知识”被概念化为在算法结构化的社交媒体中用户集体建构的与算法有关的本土化问题解释。

  依照伯格和卢克曼考察知识建构过程的进路,本研究将“算法的社会性知识”置于短视频内容创作者日常生活的具体语境中进行探讨。短视频平台作为近年来新兴的以算法驱动的社交媒体,提供了一个具有代表性的考察“算法的社会性知识”的具体经验场域。由于社交媒体的内容生产/消费界限模糊不清,短视频平台的内容创作者作为活跃用户代表了与平台算法的设计者相对的一类特殊的用户。由于始终面对一种平台算法所带来的“隐身的威胁”或称“不可见的威胁”(Bucher,2012),短视频内容创作者必须寻求使自己“在算法上被识别”的可能方法(Gillespie,2017)。因此,相比普通用户,内容创作者们与平台算法的接触更频繁,这使得他们对算法的感知和思考也随之更加深入。已有的研究已经证实,尽管用户所拥有的算法知识受到一系列社会经济因素的影响(Gran,Booth & Bucher,2021),但这些仅仅是造成算法知识差异的一小部分原因,算法知识的最强预测因素是用户对算法的先前体验:包括使用频率和使用广度(Cotter & Reisdorf,2020)。通过考察短视频内容创作者日常的算法知识构建过程,本研究既例证了“算法的社会性知识”是什么样的,又阐明了“算法的社会性知识”是如何在算法-用户互动的具体日常情境中涌现出来的,以及短视频内容创作者们如何集体建构这种“算法的社会性知识”。

  四

  研究方法

  为了回答上述研究问题,研究者在短视频平台进行了为期12个月(2020年7月至2021年6月)的数码民族志,以及在浙江省义乌市北下朱村和江苏省连云港市海头镇进行了实地民族志。从2020年7月开始,研究者每周定期浏览短视频平台,包括抖音、快手和哔哩哔哩短视频区,并将非参与式观察结果记录在田野笔记中,目的是了解短视频应用程序的主要功能和算法环境,识别和获取一部分的研究对象。之后,研究者长期(每个对象至少跟踪一个月)跟踪了70余位内容创作者,浏览了他们的个人主页、短视频内容,定期观看他们的直播并保存了相关视觉影像材料和数字痕迹。研究者选取了典型“直播村”——北下朱村和海头镇作为实地田野的地点,因为在这些直播村中聚集了大量的短视频内容创作者,他们在直播村的社区中积极地共享关于算法的知识。

  在线上和线下的田野中,研究者依照目的性抽样和机遇式抽样的原则,从短视频内容创作者中选取45个在短视频平台上进行创作超过3个月的个体内容创作者进行了深度访谈。所有访谈均为半结构半开放式访谈,包含个人情况、媒介使用情况、算法体验、评价和感受等多方面内容。通过总结、识别和组织实地笔记、访谈记录和影像记录中的主题和类型来编码数据集,使用质性分析(qualitative analysis))软件NVivo(11版本)对材料进行编码分析。考虑到研究伦理问题和“保密原则”,研究者在本研究中删除了所有研究对象的具体身份信息并为他们分配了假名。

  

  五

  算法知识的个体建构:情境与类型

  (一)情境化框架中的算法知识片段

  尽管算法渗透进所有领域,但自动化计算的本质特征使得算法通常是以隐秘的、不可见的方式隐藏在日常生活之下,这就是算法的隐身性(亚卡托,2018/2021:14)。在日常生活的语境中,人们关于算法工作的见解、片段和小道消息往往是以出人意料的方式在日常生活中浮现的(Seaver,2017)。同时,因为算法是在不同条件下与数据、技术、人等协作,在语境中被执行,它们的影响通常以偶然的方式展开(Kitchin,2017),所以最终我们要在情境化框架下来理解算法及其结果。以从情境中凸显的算法知识片段为肇始,“算法的社会性知识”建构才成为可能。

  短视频内容创作者对算法的解释源于算法在生活中显露的、偶然的和个体化的遭遇时刻。在这些特定的典型情境中,对算法的意识、感觉、情绪和想象力的独特组合被激发(Bucher,2017),关于算法的信息片段由此被揭示。在田野和访谈中,多名内容创作者向研究者描述了相似的“算法遭遇时刻”。作为旅游领域的内容创作者LPS常常在全国各地收集素材,一次,LPS和朋友在微信中聊天,朋友提议LPS去成都转转,顺便收集一些当地美食的素材。LPS刚和朋友聊完,打开短视频平台想随便刷刷,算法给他推送的第一条视频就是成都当地旅游的内容。LPS回忆当时的情景时说:

  这太吓人了!就是我突然发现算法一直在偷窥我们。我当时心里一阵紧张啊!而且最关键的这是在两个平台(上发生的),它们之间肯定是没有数据共享什么的。我就不知道是巧合还是啥,如果是巧合那太吓人了!我觉得算法都知道了我的想法,我上一秒还在心里想呢,你这一秒就让我去了。(LPS)

  在这样的日常情境中,用户公共领域和个人隐私之间的明确分离已经遭到质疑,这使得算法作为一种数字监控机制从潜伏中被带到前台。为了应对复杂的算法技术系统,他们必须在持续性的算法交互过程中推理和总结算法的技术逻辑与运作模式。LPS在2020年曾先后两次前往广州搜集当地素材,刚安顿好,打开手机一刷短视频平台,发现页全都是广州本地的视频。LPS推测,“这个算法捕捉到我现在人在广州,它可能就立马基于手机的地理位置来推荐内容。因为我就住在广州塔附近,在酒店刷的短视频前两三条都是关于广州塔观光的。”多次的相同经历验证了LPS的推测。除了地理位置信息,内容创作者们在访谈中还列举了一系列算法可能考虑的因素或指标,例如,身份信息(性别、年龄、职业等)、社交网络、使用设备的属性(设备的品牌、价格、网络类型)、用户偏好。这些知识有效地解释了算法的因果力量,即算法“在一个独特的结果中发挥的因果作用”(DeVito,2021)。由于内容创作者是基于个体的算法遭遇经验获得的算法知识,无法脱离个体对于特殊情境的感知和描述,因此,这些算法知识往往是局部的和非系统的意义构建,可以被视作是更庞大的“算法社会性知识”的片段。

  (二)测试算法与操作性的算法知识

  操作性的算法知识指向内容创作者们所掌握的关于算法如何运作的解释,它赋予了Ryle(1945)称之为“知道”的知识形式特权,构成了“知道事情是这样的”解释,建立在熟悉事实、规则或启发的基础之上。具体而言,对短视频内容创作者来说,这种操作性的算法知识涉及算法是如何权衡和偏向某些标准的具体解释(Kitchin,2017)。

  为了了解影响算法可见性的数据权重规则,科普领域的内容创作者XK曾在一段时间内记录了自己账号内发布的每条短视频的相关数据,并对这些数据进行回归计算和相关性分析。按照他的计算结果,他发现短视频作品的播放量和互动率、涨粉数关系都不大,唯独与完播率显著相关,由此,XK认为在抖音的推荐算法中完播率是权重最大的一个因素。另一位内容创作者WG为了获得这种算法的操作性知识采用的方法是一种简略形式的A/B测试(A/B testing)。WG会在自己的短视频中尝试改变不同的创作要素以发掘算法的偏好,包括视频速度、视频背景、字幕、标题、封面,甚至“在视频里坐着还是站着”,“横屏还是竖屏”或是“文案中改一个字”。WG强调这样的测试进行得越细致对于提升可见性的效果就越好。正是通过这些细致的A/B测试,WG最终得出了一套“最适合自己的公式”,并依据这个公式创作了之后的视频内容。一位游戏领域的内容创作者CJQ则描述了一种更简便,也更常见的获得算法操作性知识的过程。CJQ在创作初期对于完播率其实不是很了解,但在发了几十个视频之后,她敏锐地捕捉到了完播率的可能影响并开始总结后台的数据反馈。随后,CJQ采用了一种与敏感性分析(sensitivity analysis)类似的方法来寻找使完播率最优的短视频时长。基于统计方法的敏感性分析是指在机器学习领域里通过大量的重复采样(bootstrap)对神经网络进行统计检验的分析方法。CJQ以从短至长的不同视频时长来测试算法,依据获得的数据反馈来判定最优的视频时长范围。最后她发现“30秒左右”是其短视频完播率最高的“完美时长”。正是通过“在算法中介空间中的习惯性实践”(Bucher,2018),短视频内容创作者实现对于具体的算法运作机理的解释。

  (三)“算法偏差”与规范性的算法知识

  除了操作性的算法知识之外,还存在一种规范性的算法知识,涉及对算法的质量、重要性和影响的命题式理解(Cotter,2022)。在算法造成令内容创作者不安或惊讶的效果之前(Zhang,Chen & Xi,2020),算法的规范性维度并不明显。算法的规范性维度常常在算法没有按照人们期望的方式运行时,也就是所谓算法的“崩溃”时分被凸显(皇甫博媛,2021)。在本研究中,这种算法与内容创作者的预期不符的具体情境被称为“算法偏差”,规范性的算法知识正是来源于对“算法偏差”的审查和批判性反思。

  内容创作者ZSS是一名支教老师,她在抖音和微信视频号上创作以乡村支教老师的日常生活为主的短视频内容。在田野中,研究者观察到ZSS的创作基本都是纪实风格,拍摄之前不进行剧本设计,拍摄过程中也一般不摆拍。但据ZSS所说,2020年她刚开始创作短视频的时候,内容总是做得特别细致,前期就会拍摄几小时的素材,后期还会精心地剪辑和制作。但出乎ZSS意料的是,自己这样的精心制作反而使算法误将她的账号标注为剧情类。说起这段经历,ZSS还觉得很愤慨,“我做的那么精致,结果算法就以为我是剧情号了,算法是觉得三农领域就不该有质量这么好的作品吗?”

  算法的识别和分类体系与内容创作者的身份认知体系之间的冲突在这样偏差中被凸显。这种身份的识别和分类时刻在进行,但唯有在其与创作者的自我定位冲突时才被察觉。经历过这样的体验之后,ZSS认为:“我觉得这个算法这样是有点问题的,就是很有成见的那种,三农领域的人也可以拍一些精致的视频啊,就像李子柒那样,算法应该给我们这样的主播多点流量,而不是把我们直接归到剧情类。”在这些内容创作者看来,算法的身份识别显然并非客观和公正的。基于对这种隐含的文化霸权的反思,他们发展出一种规范性的算法知识,算法应当准确地识别和标签化创作者的身份并分配给他们相应的涉及可见性和用户注意力占用程度的资源。

  在中国语境下,“算法偏差”有时反映了文化观念和价值判断的整体性矛盾。在访谈和田野中,很多内容创作者不约而同地表示对短视频平台整体内容的价值取向存在焦虑,这显示了他们的经验与短视频平台公司所宣称的“技术中立”和“科技向善”承诺之间难以弥合的鸿沟。一位内容创作者OJ这样形容抖音平台中的内容:“现在抖音上的那些获得大流量的短视频都没有什么意义,也不激励人,也不引导大家向上,但是算法就是推,人家就能涨粉。”在OJ看来,算法更应该给那些“正能量”的内容以大流量,而不是那些无法带来所谓正面社会效应的内容。“正能量”作为中国社会政治话语中广泛使用的关键表达(Yang & Tang,2018),代表了一种普遍的利他主义,被短视频内容创作者挪用至对平台算法的规范性叙事之中。

  六

  算法知识的集体建构:

  方式、组织与关键角色

  算法的社会性知识片段从短视频内容创作者与算法持续交互的具体日常情境中涌现,其中又可区分出操作性和规范性两种不同的类型。而这些局部的算法知识片段需要通过关系性的算法知识拼贴方式才能从具体的个人情境中分离出来,沉积为共享的知识,最终在民间算法知识社群中被集体建构为“算法的社会性知识”。

  (一)“私密验证”:关系性的算法知识拼贴

  由于机器学习算法包含了能动个人、技术系统和社会文化体系充满偶发的“再装配”(潘霁,2021),因此,如前所述,基于个体经验获得的这些算法知识始终是偶然的、局部的关于算法的表达。本小节以短视频内容创作者中流行的一种“私密验证”的方式来解释他们如何运用关系性的资源“拼贴”出平台的算法机制和运作模式。内容创作者MZ在2021年5月发布了一条作品,随后他在评论区置顶了一条自己的评论询问“有多少人是从首页过来的”(见图1)。MZ表示他是想通过这条评论的回复了解平台算法分配私域流量和公域流量的实际机制。“首页过来”的观众数量代表了算法分配的公域流量,而从关注订阅中刷到的则代表了MZ的账号本身的私域流量。观众的回复代表了一种零散的关于算法输出的数据证据,勾勒出算法的具体运作痕迹,在评论区中被创作者和这条视频的观众共享。MZ与他的短视频作品观众之间的“私密验证”,提供了一种利用交叉参考来拼贴关于平台算法可见性机制的算法知识的有效方法。通过这种“私密验证”,MZ发现这条他筹备了一个多月的视频获得了大量的公域流量推荐。他推测这是由于该作品的主题与他以往的作品主题有较大差异,也就是说,与之前私域的关注者所感兴趣的话题有较大差异,同时这条视频又契合了当时的热点话题,因此算法将这条视频推送给了更多的公域用户。这条视频被MZ认为是一条“爆款”视频,为他带来了接近一万的新粉丝,以这条视频为样例,后续他又创作了几条类似主题的视频以保证算法的持续推荐。

  

  另一种“私密验证”发生在创作者之间。三农领域的内容创作者ZSH曾在2020年遭遇过流量陡然下滑的情况,对于其中的原因他百思不得其解,无奈之下他只好求助于三农领域的其他创作者:

  我先在群里问大家最近流量都怎么样了,结果大家一个个都出来说不好啊,下滑得厉害。不管是大网红还是小网红,大家的流量都不好。……一说才知道,原来不是自己一个人的问题。然后大家就一起讨论,分析原因,有人说是平台整治,有人说是流量被分到别的地方了,有人说是别的什么原因。后来我们就一个个对比嘛,发现都不对,最后排除下来发现就是抖音内部千川和巨量不对付,然后他们就改了算法导致我们(整个三农领域)的流量都不好了。(ZSH)

  ZSH的例子显示了当个体的算法知识不能提供足够的解释力时,亲密性的社群就成为了一个试验性的空间,在这个空间中内容创作者们提出问题,通过对照进行相互验证,不断修正因果假设以生成经过社群集体验证的算法知识。

  个体的内容创作者从日常经验中获得算法知识可被视作关于庞大而复杂的算法系统图景的一块块拼图,通过这些关系性的拼贴,短视频内容创作者绘制了与算法进行进一步协商的知识地图。通过“私密验证”,局部的算法知识由此从具体个人的原始背景中分离出来并传递给了参与验证的所有人,随之在内容创作者之间流通,个体叙事由此转化为了流动的、生成性的算法的社会性知识。

  (二)民间算法知识社群:松散的互助组织

  “私密验证”展现了短视频内容创作者建构算法的社会性知识的一种典型方式,这种知识建构常常是在民间的算法知识社群中实现的。与专业的算法技术社群不同,这样的算法知识社群是建立在Bishop(2020)所说的用户对算法操作逻辑的集体遭遇(collective encounters)的基础之上的。算法知识社群本质上是一种草根的互助组织,这种互助大致上来源于所共同面对的强大对手(de Peuter & Cohen,2015)。在算法结构化的社交媒体中,短视频内容创作者们所共同面对的正是算法。也正是在这种相互依赖成为生存的必要条件时,支持的关系就应运而生(Kropotkin,1987)。但互助的产物,也就是算法的社会性知识,并不指向对算法的抵抗,而更多倾向于与这个强大对手的协商以换取更多的可见性。

  民间的算法知识社群通常是松散的,缺乏制度化的形式约束。这些民间的算法知识社群通常由具有某些共同点的成员构成,有的成员都是同一领域的内容创作者,有的成员都居住于同一个地方,还有的成员都加入了同一个工会或MCN机构。由于创意文化生产领域日益增长的不稳定性,这些社群中的成员频繁流动,而这样的流动又不断地打破“私密验证”中由于关系性的拼贴可能导致的知识分享的边界,使得不同社群中的算法知识被共享、重新验证和再生产。以研究者在直播村的田野中遇到的一个小型的民间算法知识社群为例,这个社群当时主要由海头镇的四位生鲜领域的短视频内容创作者ZR、JF、PP、DJ共同组成。他们都是同龄人,因原有的社会关系和共同的职业追求而组成社群,就像PP所说的,“这地方很小,大家都是做视频的经常也能刷到对方,谁干的比较好吧,你就会去关注他。然后经常在船上买货的时候就会遇到,一来二去就认识了。”原先这个社群中只有ZR、PP、DJ三个固定成员,后来在上海和深圳都做过短视频运营的JF回到家乡加入了这个社群。JF的到来给这个社群带来了很多关于算法的新知,ZR说:“JF他因为在外面跑过,懂得多,他一来告诉我们好多新东西……这些我们原来都不知道的。”

  有时,新人并不能像JF一样给社群提供直接的算法知识,但能够带来新的个人经验,补充和验证原先社群中所共享的算法知识。ZR带来了一位刚开始做直播的朋友GYZ一起参加讨论,让社群中的其他成员帮这位新手解决一些现阶段的难题。GYZ所遇到的问题是短视频作品的数据反馈很优秀,但直播变现的效果却不好。经过分析和几番相互的驳斥、验证,最终他们得出一致的结论,GYZ的账号由于频繁地上传短视频内容而没有同时跟进直播,被算法打上了“视频流量”的标签,因此直播变现的效果很差,要想改变这种状况就必须“拉直播时长”,尽快让算法给账号打上“直播流量”的标签。

  那些关于算法的直觉性的和不精确的局部知识在这样的社群中被有效地组织起来,通过不断的交换、共享、反驳和讨论,短视频内容创作者为应对他们共同所处的算法结构化的社交媒体典型情境集体建构了算法的社会性知识。由于机器学习算法本质上的递归性,社群中的集体知识建构也始终随着不稳定的用户-算法系统处于动态的调整之中。直播村中内容创作者们的经历展现了他们与算法的动态协商过程。内容创作者们通常将那些数据反馈表现显著优于以往均值的视频作品称为“爆款”视频,在他们看来,“爆款”视频迎合了算法的偏好,代表着获得更多可见性的机会。

  “连爆”实际上利用了当时平台算法的漏洞,以战略性地发布同质化视频的方式重复地获得算法的推荐并实现对视频可见性优势的迁移。随着开放的民间知识社群中频繁的交流,“连爆”很快被大量的内容创作者知晓并广泛实践,这些实践又作为行为和内容数据重新输入到算法系统中。由于这些实践显然与平台的预期目标相违背,算法迅速做出调整,据JF所说,“连爆”的方法被普及之后很快就失去了原有的效用,算法对视频内容进行了重复性审核,同质化的视频将不被允许发布或被限制流量。原有的集体知识失效了,内容创作者们被迫重新投入到新一轮的知识建构中,但很快他们就集体建构了以微小的修改和替代来躲避重复性审核的新知识并将其运用到实践中。在算法和用户共同组成的递归循环回路背景中,变动是常态,恒常的规律性知识反而是稀缺的。

  (三)草根“算法专家”:算法解释的关键角色

  内容创作者ZX每天除了开直播和拍视频,剩下大部分使用短视频应用的时间都在看别人关于算法的讲解。关于算法的可验证和有用的信息在日常环境中仍然是稀缺和不切实际的(Schellewald,2022),作为算法结构化平台中的稀缺资源,分享算法知识的视频和直播常常能获得更多的可见性。在平台中积极分享算法知识的通常是一些可以被称为草根“算法专家”的内容创作者,他们扮演了算法社会性知识生产和传播中的关键角色。作为内容创作者与算法的中间人(intermediary)(Bishop,2020),短视频平台上的这些草根“算法专家”通过积极分享一些算法知识和应对算法的策略塑造自己的专家形象,然后将其他的算法知识整合成“算法课程”售卖给那些迫切了解算法以提高平台中的可见性的内容创作者们。“算法专家”一般会先拍摄一些具体的算法知识视频吸引创作者,例如“如何给账号快速打上标签?”“直播间极速流量怎么来第二波?”(如图2所示)。当这些观看视频的创作者想要了解更多信息时,他们就会向其兜售“更系统的”算法课程。这些算法课程的价格不一,标价低至几十,高至几万。大部分的“算法专家”甚至会直接帮助支付了高昂“学费”的客户开设和维护账号、创作内容,实质上担任了内容的事实制作人和把关人。

  

  和算法工程师一类的算法技术精英不同,草根的“算法专家”不通过解读代码指令来解释算法的知识形式,作为内容创作者的一员,他们同样通过个人经验的累积和关系性的知识拼贴获得算法的社会性知识。但和其他的内容创作者相比,草根的“算法专家”更多在不同的算法知识社群中游走以获得尽可能多的算法知识。在田野中,北下朱村的一位“算法专家”ZSN向研究者展示了他加入的200余个微信群,同时他还拥有几个线下的更紧密的社群以获取更多的可靠信息。成功的“算法专家”也更善于将对算法知识的解释编织成充满比喻和实用策略的故事。

  Bishop(2020)在对YouTube算法专家的民族志研究中称他们擅长利用霸权的“极客”(geek)亚文化的自我呈现策略来巩固关于算法的专业知识。但中国短视频平台背景下的草根“算法专家”提供了一些不同的,甚至有时是截然相反的经验。在田野中,研究者发现成功的算法专家并不热衷于那种指向数据的、客观化的算法知识,可能他们会在用以吸引潜在客户的短视频或直播中分享这类型的知识,但在实际对重要客户的指导中,他们提供一种实用的差异化知识和策略组合。如前所述,算法知识在算法递归反馈回路的背景中通常是是动态变化的,草根算法专家也因此强调捕捉算法变化并灵活地重新建构和运用算法知识的重要性,他们通常会指导客户随时调整自身实践以应对整个不稳定的系统。在直播村中,那些提供线性的算法输入和输出关系的,所谓系统化“算法知识”的通常是直播培训机构和传媒公司,直播村中创作者称这种机构都是“割韭菜”的,他们评价算法专家所提供的算法知识的唯一标准是“有没有效果”。ZSN说:“我们一般不讲那些没用的,如果一个东西大家都知道了,那平台那边肯定也知道了,他们就会改算法了,算法没那么简单……我们会根据每个人的情况来分析,用不同的方法,关键是要让他们听得懂,以后能用上。”

  七

  结语

  互联网新信息技术在人类知识领域掀起革命,创造了与知识的新关系,但社会科学领域的人工智能算法研究尚未厘清人们对算法所带来的一系列问题究竟给予了怎样的解释,以及与算法有关的知识建构又如何与更广泛的关系网络和社会图景勾连。位于算法外部边缘的短视频内容创作者的案例展现了与算法技术精英相对的算法知识建构过程,一种自下而上的、非正式的算法知识形式从他们的日常情境中涌现出来,在本研究中被概念化为“算法的社会性知识”。与新技术有关的重要知识并不趋向于去语境化(decontextualized),相反,“算法的社会性知识”显现出与具体的语境更加紧密的关联,甚至可以说大部分时候我们必须在偶然的情境化框架中才能理解算法,因为它本身就是处于算法-用户互动关系中的个人和群体的可感知的表达。“算法的社会性知识”可区分为操作性的和规范性的两种类型,前者指向对算法的实然解释,后者指向对算法的应然解释。两种类型的“算法社会性知识”实际上都属于实践知识的范畴,一方面因为算法本身被认为是一种“体验技术”(Blank & Dutton,2012),即通过使用来理解的技术,人们通过使用算法来获得算法知识并内化算法(Galloway,2006:90;Bucher,2017);另一方面,算法的社会性知识通过引导人们协商与算法的关系导向应对算法的行动策略,因此它们更多是社会性的而非认知性的(Cotter,2022)。“算法的社会性知识”产生于实践也指导实践,内容创作者通过频繁使用和有意识地测试获得算法知识的片段,又在算法的社会性知识的指导下战略性地运用各种应对算法的实践以实现自身目标。

  “算法的社会性知识”源于具体个人的原始情境中的实践经验沉积,通过“私密验证”一类的关系性拼贴,个体叙事在亲密性的试验空间中转化为了共享的“算法的社会性知识”。在短视频内容创作者的例子中,这种转化和新的知识建构通常发生在松散的民间算法知识社群中,其中,作为算法的社会性知识解释的关键性角色是那些草根算法专家,他们提供了一系列本土化的、与算法技术精英相对的算法阐释活动案例。民间算法社群本质上又是在对算法逻辑的集体遭遇基础上建立的互助组织,其特征是开放的、流动的和动态的。这些特征促生了丰富的知识创造性,“算法的社会性知识”通过指导内容创作者的实践过程加入到算法-用户的递归循环回路之中,发挥不同程度的生成性的作用来塑造社会生活。这也意味着“算法的社会性知识”始终是一种动态的知识体系,作为递归循环回路的一部分随着整个不稳定的算法生态快速变动。

  同时需要强调的是,“算法的社会性知识”的有效性并不在本研究的考察范围之中,本研究关注的是被人们认为是与算法有关的知识,而不以任何标准来衡量这些知识在多大程度上有效。但在短视频内容创作者的经验中,算法知识在经济上的有效性却成为了他们对其价值进行评估的最主要依据,他们关注这些算法的社会性知识运用到实践中能够转化为多少经济收益。这种对于算法知识的价值评估由一种实用的动机所支配,使得内容创作者们通常只强调那些能帮助其实现经济目标的具体的功能性知识,而忽略了其他目标驱动的知识类型。对知识有效性的单一考量是由短视频内容创作者在算法结构化平台中的角色和目标决定的,今后的研究可以发展对处于其他社会关系系统中的个体或群体的算法知识建构的考察。以这项研究为起点,未来的研究可以进一步充实“算法的社会性知识”的类型、动态和边界以及这一知识所指导的用户实践以拓展这一概念在其他语境下的解释力。

  本文系简写版,参考文献从略,原文刊载于《国际新闻界》2022年第12期。

  封面图片来源于网络

  本期执编/小晶

  订阅信息

  全国各地邮局均可订阅《国际新闻界》,国内邮发代号:82-849,欢迎您订阅!

  您也可通过下方二维码或网址https://weidian.com/?userid=1185747182,进入国际新闻界微店,购买当期杂志和过刊。

  您还可访问《国际新闻界》官方网站 http://cjjc.ruc.edu.cn/ ,免费获取往期pdf版本。