数字素养、数据权利与数字伦理
点击蓝字关注我们FOCUS ON US
李正风 王 硕
(清华大学社会科学学院,北京 100084)
[摘 要]数字社会的良性治理需要提升公民的数字素养与技能,重新审视大数据时代公民的数据权利,重构数字社会的数字技术伦理秩序。数字素养与技能是数字社会中公民“数字化生存”的内在要求。当前,全球面临严峻的“数字鸿沟”,我国公民数字素养平均水平不高,未来要加强科普和宣传,稳步提升我国全民数字素养与技能;公民深度参与“大数据”的生产过程,权利的让渡成为风险的源头,“数据霸权”成为公民数据权利面临的严峻挑战,未来要通过思想的启蒙和制度的创建不断保障公民的数据权利;数据、算法等技术因素与社会因素交织,带来了诸多数字技术伦理问题。数字社会的健康发展与良性治理需要反思传统社会的价值观念和行为规范,建立起包含多元主体参与的治理机制与体系,共同塑造新型数字技术伦理秩序。
[关键词]数字社会;数字素养;数据权利;数字技术伦理
随着数字技术的发展和数字经济时代的来临,数字技术全面融入人类经济、政治、文化、社会、生态文明建设各领域和全过程,不断给人类生产生活带来广泛而深刻的影响,人类正在逐渐走向以数字技术作为底层架构的数字社会。作为一种新型社会形态,数字社会对传统的社会秩序与治理模式提出了哪些挑战?如何从学理上认清并以政策与治理来应对这些挑战?如何实现数字社会的良性治理?本文旨在针对以上问题展开探讨。
对于数字社会的良性治理,已有研究大致可以分为三个层次。一是有关公民数字素养与技能的研究。这类议题更多地受到图书情报学、教育学等学科的关注,有关研究对数字素养与技能的概念流变、构成要素、不同国家的培养模式展开探讨。二是有关公民数据权利的研究。这类议题更多为法学学科所关注,有关研究对数据权利属性、法律特征、数据法益保护展开讨论。三是有关数字技术伦理的研究。这类议题为政治学、法学、社会学、公共管理等学科所关注。有的研究从一般意义上讨论算法伦理、数据伦理等问题,也有研究从具体应用场景来讨论数字技术带来的伦理挑战,尤其是数字医学与数字教育两个重要领域。总体来看,已有研究涉及的学科领域分散,理论视角多元,但是很少有研究将这三个层次整合到统一的框架中,并用其来分析数字社会所面临的挑战及治理路径。
本文将以上三个层次整合到一个分析框架中,指出三者都是实现数字社会良性治理不可或缺的重要组成部分,分别分析每个层次的问题与挑战,并在此基础上提出可能的治理路径,以期为更好地推动数字社会的良性治理与实现人民美好数字生活提供理论参照与政策启示。1
全民数字素养与技能的提升
2021年10月,我国出台了《提升全民数字素养与技能行动纲要》,明确界定了数字素养与技能的概念,认为“数字素养与技能是数字社会公民学习工作生活应具备的数字获取、制作、使用、评价、交互、分享、创新、安全保障、伦理道德等一系列素质与能力的集合”。同时指出,“全球经济数字化转型不断加速,数字技术深刻改变着人类的思维、生活、生产、学习方式,推动世界政治格局、经济格局、科技格局、文化格局、安全格局深度变革,全民数字素养与技能日益成为国际竞争力和软实力的关键指标”。
理解数字素养与技能首先要深刻认识数字社会。与数字社会紧密关联的两个概念是“数字化”和“数字化转型”。在英文语境中,“数字化”有digitization和digitalization两种翻译。digitization指将模拟信息转换为数字信息的过程,而digitalization则强调数字技术与原有生产生活方式的深度结合对社会产生了深刻影响。在中文语境中,“数字化”指的是人类行为、自然对象乃至历史资源的“数字化”。随着技术的不断发展,“数字化”的对象和范围不断得到拓展,大数据、人工智能、云计算、物联网、区块链等新兴数字技术以前所未有的速度、广度和深度改变着人类的思维、生活、生产和学习方式,使得社会运行体系经历着深刻的“数字化转型”。
数字素养与技能是在数字社会中公民“数字化生存”的内在要求。数字社会不仅带来了数据驱动的知识生产方式、数字化的生产生活方式,而且使个体获得知识、信息的渠道变得多样化,个体利用数字进行学习与生活的素养与技能变得越来越重要。早在1996年,尼古拉·尼葛洛庞帝(Nicholas Negroponte)在《数字化生存》(Being Digital)一书中就对“数字化生活”作出判断:“计算不再只和计算机有关,它决定我们的生存……几乎在全球各地,都向个人电脑俯首称臣。”尼葛洛庞帝没有预想到的是,随着移动互联网的发展,二十多年后“数字化生活”推进的进程更为迅速,带来的社会变革也更为深刻。由此,数字素养与技能越来越成为一种最基本的生存技能。对于数字素养的概念,比较有代表性的定义由以色列学者约拉姆(Yoram)提出,他认为数字素养应该包括五个方面,即图像素养(视觉识读)、创新素养(创造性生产)、分支素养(新思维)、信息素养(辨别真伪)及“社会—情感”素养(共享与情感交流),这一定义强调了数字素养的多元性与复合性。联合国教育、科学及文化组织则将数字素养定义为“通过数字设备和网络技术安全和适当地访问、管理、理解、整合、交流、评估和创建信息,以参与经济和社会生活的能力”,并且提出“全球数字素养框架”(Digital Literacy Global Framework),这一定义则更强调数字素养的过程性与能力属性。我国的《提升全民数字素养与技能行动纲要》对数字素养与技能的定义既强调数字素养的多元性和复合性,也强调过程性、社会性和体现这些复杂特征的能力属性。因此,我们不能把数字素养看作简单的数字获取与使用等技术性技能,还要看到与之相关联的思维和行为模式。换言之,公众应具备的数字素养与技能,不仅指人们具有信息通信等数字技术相关的知识和技能,还包括在数字社会中的价值观、伦理、行为和思维方式等方面的素养。
必须注意的是,尽管数字技术不断渗透到人们的生活中,但是人们的数字素养并不会自然而然地获得并得到提升。当前全球面临严峻的“数字鸿沟”,我国的公民数字素养平均水平不高,特定区域群体的数字素养与技能与其他区域群体存在较大差距。根据2021年联合国国际电信联盟发布的《衡量数字化发展:事实与数字(2021)》(Measuring Digital Development:Facts and Figures 2021),欧美国家的互联网覆盖率达到80%以上,而非洲国家的覆盖率只有33%,全球仍有近30亿人口从未使用过互联网,其中有29亿来自发展中国家。根据2021年中国社会科学院信息化研究中心发布的《乡村振兴战略背景下中国乡村数字素养调查分析报告》,当前我国公民数字素养参差不齐,平均得分仅43.6分(满分为100分),标准差为15.7。该报告还指出,我国城乡居民数字素养差距达37.5%,城乡数字鸿沟的问题已经非常突出。数字鸿沟在国家内部甚至全球范围内不断扩大,将对人的生存权利与能力构成极大的威胁与挑战,不利于人的全面发展。
未来要加强科普和宣传,稳步提升我国全民数字素养与技能。很多欧美国家已经形成了包括政府机构、教育系统、社会力量在内的多元数字素养与技能的培养体系。我国也高度重视全民数字素养与技能的提升。2021年3月,我国出台了《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》将“加强全民数字技能教育和培训,普及提升公民数字素养”明确作为“构筑美好数字生活新图景”的重要路径。2021年10月,我国出台《提升全民数字素养与技能行动纲要》,计划在2035年基本建成数字人才强国,全民数字素养与技能等能力达到更高水平。未来要更多地发挥科普的功能作用,构建终身数字学习体系,不断提升各类群体的数字素养与技能。2
“大数据时代”公民的数据权利
数字社会的本质是数据社会,数字技术的发展赋予“数据”概念全新的含义,“大数据”成为人类走向数字社会的重要引擎。传统社会的“数据”是事物属性的量化表征,需要经“测量”产生,人们由此发明出测量的方法与技术、测量结果的表达形式(如性质、量纲与单位等)以及基于数量及其关系的计算工具(如数学、科学公式、统计工具等)。从这个意义来看,实验(测量)与数学结合是传统社会中“数据”的核心特征,“数量化”在一定程度上揭示了传统“数据”的本质。然而,“大数据”的出现与应用呈现出全新的特征。虽然大数据的定义没有统一,但是国际数据公司(International Data Corporation,IDC)定义的“4V特征”被业界广泛接受,即数据量(volume)大、数据种类(variety)多、数据价值密度(value)低以及数据产生和处理速度(velocity)快。在学术界,罗伯·基钦(Rob Kitchin)在《数据革命》(The Data Revolution)一书中对于“大数据”的定义也受到很多人认同,他将范围上的全面(exhaustive in scope)、分辨率的精度(fine-grained in resolution)、内在的相关性(relational in nature)、灵活(flexible)、可扩展(scalable)也看作“大数据”的核心特征。从这些定义与特征来看,“大数据”的本质就是数字化与网络化、智能化计算的结合。所以,“大数据”在一定意义上重新定义了“数据”的概念,“数据”不仅指可以“数量化”的事实或信息,而且指能够被利用数字技术“数字化”的所有对象,包括文本、图像、视频、音频等。正如伊格纳斯·卡尔波卡斯(Ignas Kalpokas)在《算法治理:后人类时代的政治与法律》中所声称的那样:“当今世界已完全数据化……当今世界的特点是收集并分析史无前例体量之数据的能力。”得益于数据生成能力与存储能力的不断增强,“大数据”能够不断且迅速地扩张。更重要的是,“大数据”能够超越时空边界并相互关联,深度学习与人工智能对大数据进行挖掘和计算的能力不断增强。
值得注意的是,在数字社会中,公民的数字素养与技能和其“数据权利”有密切关联。在“数字化转型”中,公民深深嵌入“大数据”的生产过程中,成为“大数据”的生产主体。正如克里斯多夫·库克里克(Christoph Kucklick)在其著作《微粒社会》(The Granular Society)中所描绘的那样:“我们的身体、我们的社会关系、自然界,以及政治和经济等一切将以比之前更加精细、精确、透彻的方式被获取、分析和评价。”人们在信息平台上的浏览与搜索行为的记录,电子商务活动中提供精准服务的信息供给与信息要求,社交媒体中产生的大量文本与图像、音频、视频等“电子痕迹”等都是“大数据”的重要来源。此外,传统的、结构化公共数据(例如政府为了监管和服务而采集的公共数据、研究机构为了研究目的而采集的科研数据等)也都被极大地“信息化”与“数字化”,成为“大数据”的重要生产来源。公民有意识或无意识地成为“大数据”的来源,并且成为“大数据”的生产者。
公民让渡一部分个人的信息(数据)或权利,成为使用数字化信息或工具的前提条件。但权利的让渡也成为风险的源头,不同层面的组织、机构或企业在提供数字化服务的同时,也采集了海量的公民数据,并有可能产生“数据霸权”,成为公民数据权利面临的严峻挑战。“霸权”指无视他人意愿而强制性侵犯他人权利、占有他者利益的行为。“数据霸权”既指以数据为对象的霸权,即强行获取和利用他者数据资源,也指基于数据的霸权,即因拥有大量重要数据而形成垄断性、强制性权力。例如,2016年,英国伦敦皇家自由医院(Royal Free London)在没有充分保护患者隐私且未获得患者知情同意的情况下,将160万名患者的数据提供给深度思维公司(DeepMind)用以研究,引发了广泛的社会争议。包括生活、环境、社交、医疗记录和医疗保险等信息在内的医疗大数据一旦泄露,可能会严重影响个人生活,例如导致欺凌、高额保险费和因病史失业等。
公民拥有与其相关的数据在搜集、处理和使用过程中的知情同意权、选择决策权等合理、正当的数据权利。对于公民数据权利的保护,当前学界比较具有代表性的观点是:一方面,要为个人数据权利提供防御性的保护与救济;另一方面,要立足于大数据活动实情来重新界定数据企业收集个人数据的合法边界。换言之,既要有效地保护公民数据权利,又要充分维护数据活动的自由。国外有关数据权利保障的立法实践起步较早,最具代表性的是欧盟的《通用数据保护条例》(General Data Protection Regulation),该条例旨在保护欧盟境内所有消费者的个人数据,并且得到了严格执行。我国也在2021年颁布了《中华人民共和国个人信息保护法》,初步建立起公民数据权利保障体系,但在实际操作过程中遇到了诸多困难。未来要结合国际经验与现实国情,通过思想的启发和制度的建设来保障公民的数据权利。3
数字社会中数字伦理的塑造
提升全民数字素养与技能的过程,也是重塑数字社会中数字伦理的过程。数字社会的健康发展与良性治理需要反思传统社会的价值观念和行为规范,塑造新型数字技术伦理秩序。伦理是指处理人与人、人与社会、人与自然相互关系应遵循的价值理念和行为规则。数字伦理则是指与数字化转型、数字化信息与技术的开发和应用相关的伦理理念和行为规范。
当前数字技术伦理问题主要分为四个层面:第一,从个人层面来看,主要包括隐私权与知情同意、生命与财产安全、公平公正使用数据产品的权利等问题;第二,从公司层面来看,主要包括数据正当采集和使用、数据泄露、算法歧视、算法垄断、算法滥用等问题;第三,从社会层面来看,主要包括促进普惠共享、防止数据鸿沟、数据和算法的监管与问责、多元主体和参与者的权责、伦理审查制度、人工智能的道德主体地位等问题;第四,从人类层面来看,主要包括保障人类社会美好未来、全球数据共享、数据安全与协同治理、防止智能机器人反噬人类、防止智能技术整体失控等问题。
数据的采集与处理通过算法完成,算法也依赖大量数据和算例,数据与算法相结合对已有的伦理秩序构成极大的挑战。
一方面,算法会再现或放大已有的伦理问题。算法具有不透明性、可塑性、人类智能的嵌入性、价值负载性以及应用后果的不确定性。其中,算法的可塑性尤为重要,人能够对算法进行扩展、删除和修改,这意味着机器学习中的开放和创造也易于在伦理上产生“道德真空”。社会和结构不平等,关于知识、正义和技术本身的假设,有偏见的、不完整的学习样本导致了歧视的加深和传递,都可能损害社会公平。当前人们讨论较多的算法偏见与算法歧视,就是指潜藏着的来自设计者、使用者和学习数据的偏见。例如,有研究发现,美国医疗保健系统的机器学习算法中存在种族偏见的证据,被判定为相同风险水平的黑人患者比白人患者实际病情更重。算法偏见与算法歧视可能贯穿于算法的设计与实现、数据的收集与处理以及结果呈现等多个阶段,产生不合理不公正的判断。算法偏见与算法歧视和算法本身的构建和其数据样本数量及样本性质密不可分。偏好性歧视(歧视的根源来自设计者的价值观)和统计性歧视(歧视的根源来自粗暴的利益诉求)都可能通过算法被强化和极化。
另一方面,“数据—算法”的叠加带来了新的社会伦理问题。例如数据权利问题、风险与责任、隐私与信息安全问题。算法从用户获取大量的个人数据,甚至该行为是在数据主体不知情的情况下进行的。更甚者,算法可以通过不透明的计算、剖析、解释与预测介入或侵犯个人隐私。此外,人类自主性丧失也是重要的伦理问题。数据采集、算法系统是否会以任何无意和不可取的方式干扰用户最终的决策过程,从而影响人类的自主性?这些都是由数据与算法相结合所带来的新型社会伦理问题。
数字技术伦理问题既来源于数据与算法等技术因素,更是社会因素交互建构的结果。算法本身具有技术上的局限性,算法本身的复杂性、专业性、封闭性尤其是不可解释性使得一般人无法理解这项技术,导致了公众对算法伦理规约的参与性比较低,无法更好地在这一技术发展过程中表达个人诉求与建议。伴随数字经济的兴起,商业对数据进行了发掘,企业与平台按照符合自身利益的方式通过算法对数据进行操作。企业与平台所使用的算法如果优先考虑经济利益,可能会置个人隐私、信息安全等伦理问题于危险中。同时,价值的偏好、认知的缺失也是重要的影响因素。算法设计者和审查者的价值无意识、价值偏好、对伦理问题和伦理责任缺乏意识和敏感性等都加剧了数字技术伦理问题。此外,政府监管不及时、体系不完善也导致很多伦理问题长期得不到解决。
重构数字社会伦理秩序,是一个充满新旧交织、新旧交替、破旧立新的快速变化并不断探索的过程,需要在一定的原则和规范的基础上建立起包含多元主体参与的治理机制与体系,共同面对数字社会发展的风险,尽可能让人们最大限度地享受其福祉,同时降低可能出现的风险。
从技术层面来看,数字技术的发展与治理需要遵循一些一般性原则。首先,数据与算法伦理设计需要遵循“风险最小必要原则”和“数据最少必要原则”。其次,实现隐私设计和采取默认保护隐私的措施(如加密、脱敏处理、匿名化)。最后,实现全周期算法道德化的技术治理,不仅要求算法在设计阶段实现“前瞻性”道德嵌入,在应用过程中还要对道德伦理规范进行“敏捷性”迭代更新,来适应具体的道德应用情境。
从个体层面来看,数字伦理规约的达成要建立在个体道德修养提升的基础上。道德是个体性的,强调个体的认知和选择。在一个社会中,道德水准的分布有着很大的差异。相比较而言,伦理是社会性的,强调集体的共识和规则。伦理标准实际上是一种非差异化的“社会契约”。在一个社会中,个体道德水准普遍越高,伦理规则的文明程度越高。而如果道德水准差异化程度越大,形成高水平的伦理规则就越难。因此,要将不断提升个体道德修养作为建立数字技术伦理秩序的重要前提与基础。
从企业层面来看,企业要自觉开展伦理合规建设与伦理自治。数据、算法产品的特殊性在于接受了消费者让渡的部分决策权,深刻改变了企业与消费者之间的关系,使得企业的伦理责任更加重要,为此需要建立新型的“企业—社会”伦理治理共同体。企业要充分考虑与平衡企业利益、员工利益、用户利益、竞争者利益与公共利益等多元利益。在数字社会中,企业竞争的核心已经不仅仅在于资本和技术,更在于伦理。为此,企业要树立“伦理即责任、伦理即竞争力”的意识,并付诸行动。
从国家层面来看,需要不断建立与完善有关数字技术的伦理审查机制与伦理法律规范。数据、算法产品的专业化和黑箱化,导致公众难以辨别“企业—消费者”就伦理问题形成的社会契约的内在风险和陷阱。因而,政府相关管理机构作为公众的“代理人”要积极行使伦理审查的责任,依法进行约束和惩罚。数字社会的伦理规范逐渐呈现规则化和法律化的特征,伦理约束从非正式行为上升到正式规则(行政、法律处罚)。面对数字技术的飞速发展以及伦理问题的突显,政府要愈加关注数字技术所带来的伦理风险及其治理方式,有序地引导数字技术不断服务于社会进步与造福人类。
作者简介:李正风,清华大学社会科学学院教授,研究方向:科技的社会研究、科技伦理与科学文化、科技发展战略与政策。王硕为通讯作者。参考文献、图表等内容从略,引用请参考原文。
引用本文:李正风,王硕.数字素养、数据权利与数字伦理[J].科普研究,2022,17(6):8-14.
《科普研究》是由中国科学技术协会主管、中国科普研究所主办的专业学术期刊,自2006年正式出版发行以来,主要刊载科学普及领域的理论和实践研究成果,现为中文核心期刊、中国科技核心期刊、RCCSE中国核心学术期刊。本刊以“促进科普理论研究,推动科普事业发展”为宗旨,力推学术精品力作,持续致力于促进科普学术繁荣和科普事业高质量发展。
来稿论文须有创新性、前瞻性、学术性,观点明确、论证严谨、结论科学,篇幅在8000字左右为宜。详细投稿要求请参见:https://kpyj.ijournals.cn。
责编:颜燕 袁博 李莹
排版:岳嫄