睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一，入选IDC企业数据治理实施部署指南。同时，在IDC发布的《中国数据治理市场份额》报告中，连续四年蝉联数据治理解决方案市场份额领先。

在线免费试用 DEMO体验视频介绍

睿治智能数据治理平台

IDC蝉联数据治理解决方案市场领先

杨婕：关于数据伦理国内外研究评述与发展动态分析

时间：2022-05-04来源：见愁浏览数：1072次

数据这一新兴生产要素正在改变全球经济发展模式和重塑企业商业模式，数据已经深入到生活的方方面面，与此相伴的伦理风险问题也更为凸显。因此对于数据伦理问题的研究需要逐渐走进深水区，深入分析数据带来的伦理风险并探讨问题产生的根源，有助于我们对大数据技术形成理性认知—不盲目乐观也不消极悲观。

全文共计约7100字，细读时间约20分钟

文| 杨婕信通院互联网法律研究中心高级研究员

摘要：数据伦理是信息技术发展过程中出现的一个新问题，产生的根源是由于个人、企业和国家在信息技术的冲击下不断地被数字化和虚拟化，个人生活、生产和意识形态更易被渗透和重塑。随着大数据、区块链、云计算等技术的竞相发展和各类智慧样板的涌现，万物互联、万物重构、万象互算的数字化社会扑面而来。全球数据量呈现出爆发式的增长，数据的流动属性和资源属性不断增强。通过大规模地数据收集、处理和分析挖掘，可以为企业创造巨大的财富价值，但是也可能对国家安全和个人隐私造成巨大的冲击，引发规则失范的问题。[1]但是由于法律的滞后性，而伦理规制又具有一定的弹性和灵活性，数据伦理的相关研究就变成了十分重要的基础性工作。本文从数据伦理的内涵解析、产生原因以及问题表现方面进行了综述，指出大多数研究存在片面性、局部性的特点，对有关数据伦理的研究缺乏理论的沉淀和研究深度的拓展。

关键词：大数据；数据伦理；研究综述

一、问题起源

近年来，科技创新快速发展，越来越多的前沿领域闯入“无人区”，引发的伦理挑战也日益增多。2021年3月，中共中央办公厅、国务院办公厅印发《关于加强科技伦理治理的意见》，作为我国国家层面科技伦理治理的第一个指导性文件，从伦理原则、构建体制、制度顶层设计以及监管措施等方面作出系统部署，填补了我国科技伦理治理的制度空白，也引发了社会各界对于伦理问题的广泛讨论。而大数据技术一直都是推动科技发展的重要驱动力，因而数据伦理问题也可以说是科技伦理中的重要组成部分。如尼葛洛庞帝在《数字化生存》中所言，“每一种技术或科学的馈赠都有其黑暗面。数字化生存也不例外”。[2]特别是当前，数据具有基础性战略资源和关键性生产要素的双重角色，[3]正在成为重构要素资源、改变竞争格局、重塑经济结构的关键力量。因此，结合当前的技术发展背景，对数据伦理问题的研究十分有必要，这不仅关系到如何充分释放数据要素价值、解放发展生产力，更关系到运用数据来认识和改造世界方法是否正确。

二、研究视角及进展

在问题导向的研究中，研究视角取决于所需研究问题的一般逻辑。当前数据伦理问题研究主要从内涵解析、产生原因以及问题表现等研究视角展开。

（一）数据伦理的内涵解析

数据伦理并非无源之水，主要从属于应用伦理学的范畴，而且大数据源于信息技术，其产生过程基本上是沿着遵循信息伦理到网络伦理再到数据伦理的路径。可以说，“数据伦理”一词最初来自于“信息伦理”。1988年罗伯特·豪普特曼 (R. Hauptman)首次提出“信息伦理”一词，他认为“所有对与信息生产、信息储存、信息访问和信息发布伦理问题相关的研究都统称为信息伦理。[4]我国学者吕耀怀则认为信息伦理是指“涉及信息开发、信息传播、信息的管理和利用等方面的伦理要求、伦理准则、伦理规约，以及在此基础上形成的新型的伦理关系”[5]。随着网络的普及，社会交互行为逐渐加剧，网络伦理的研究开始兴起。“网络伦理就是人们通过电子信息网络进行社会交往时而表现出来的道德关系”[6]。其可具体化为网络的开发、设计与应用中应当具备的道德意识和应当遵守的道德行为准则。网络的广泛关联性使得网络伦理的研究范畴更具社会属性。随后，随着大数据技术的发展，社会各界的研究视角开始聚焦到数据伦理。国际上第一部关于数据伦理问题的学术专著是《大数据伦理学》，作者详细讨论了大数据技术的兴起，人类将面临着伦理挑战，指出所有企业都应针对数据确立自身适用的道德规范，明确数据对自身的价值，重视数据中所涉及的身份、隐私、归属以及名誉，在技术创新与风险之间保持必要的平衡。[7]库克耶在《大数据时代》中将数据伦理界定为隐私问题、数据安全问题、虚假数据问题。[8]国内较早研究大数据伦理问题的是邱仁宗教授，他在《大数据技术的伦理问题》一文中以数字身份为核心，总结了大数据技术在创新、研发和应用中的伦理问题，探讨了与大数据技术有关的“如何保护互联网上个人的数字身份问题”、“个人隐私不被泄露的问题”、“如何确保使用者信息可及以及如何防止不当可及问题”、“如何使每个人平等获得数字资源”等伦理问题。[9]随后也有一些学者对于数据伦理问题进行概括，包括“数字身份暴露”、“被监控”、“隐私泄露”、“预测性骚扰”、“获取路径被限”、“数字鸿沟”、“数据崇拜”。[10]概言之，数据伦理是随着信息技术不断发展而产生的关于数据的善、恶议题与价值规范，可以看作为信息伦理、网络伦理的延伸，一脉相承的议题。

（二）数据伦理的产生原因

一是主观原因：个人的有限理性。人们置身于大数据环境中，可以享受大数据所带来的前所未有的“自由”，在虚拟的世界中利用自己的数字身份肆意发泄自己压抑的情绪，享受数据空间中的快感，科技巨头正是利用个人对数字平台的依赖性，将用户信息转化为实际的资本而从中获利。此外，当个人权益遭到侵犯时，往往不懂得如何保护自己的合法权益，自我隐私保护意识不足，这样的意识和行为会催生更多的数据伦理问题。

二是客观原因：数据权力的形成。大数据的发展应用使数字网络平台成为网络社会时代社会权力积聚的新场域，网络空间中的私权力正在崛起，网络服务提供者成为权力主体，这种私权力的获得在于某些私主体对于其他私主体在技术、平台和信息等方面的优势。[11]技术和数据优势共同建构了数据权力，大数据时代谁掌握了大数据与算法谁就获得了支配他人的隐性权力，然而掌控着海量数据和技术的却只有少数的资本或组织，产生了“资本利用数据推动霸权的情形”[12]。数据权力呈现了资本为了追逐利润利用大数据通过占有数据和滥用权力制造社会伦理危机的内在机理，也是数据伦理危机生成的根本动因。

三是制度原因：规约机制的滞后。法律制度、机制的滞后和不健全是产生新的伦理问题的主要原因。正如唐凯麟所指出的，目前大数据行为处于“失范”状态，“道德原则的不完善……使大数据行为处于一种无规范可依据的失范状态”[13]。王欢、李景春指出，大数据作为互联网技术发展到一定阶段的新兴产物，目前属于发展蓬勃期，之前适用于互联网技术的法律体系和伦理规范已不能完全适应大数据时代。由于大数据独特的功能和特性，法律无法解决大数据应用所产生的新的伦理问题，且又缺少相关法律对大数据伦理问题的规约。同时，法律与伦理边界模糊，暂无法明确数据出现问题后的责任方，从而引发境遇难题，并且法律制度的缺位会造成行为主体的无所忌惮，进而破坏社会公平、公正的道德规范。[14]

（三）数据伦理的问题表现

一是数据滥用侵犯用户隐私。“大数据发展的核心动力来源于人类测量、记录和分析世界的渴望”[15]。数据是记录的结果，大数据是众多记录结果的集合，这其中就必然包含对个人隐私的记录。数据存在于更多维度，数据收集方式更为隐秘、持续和智能，用户隐私内容更为多元。具体来看，随着人脸识别、虹膜识别等应用的普及，人工智能正在大规模、不间断地收集、使用敏感个人信息，个人隐私泄露风险加大。例如，变脸应用“ZAO”因用户协议过度攫取用户授权、存在数据泄漏问题而被监管机构约谈要求自查整改。杭州一动物园因启用人脸识别技术，强制收集游客敏感个人信息而被诉至法院，成为我国“人脸识别第一案”。

二是数字身份陷入伦理困境。学界关于数据伦理的议题研究中，对数字身份引发的伦理探究极少。随着接入互联网的终端数量呈几何级增长，数字身份的概念内涵亦在不断变化。Clare Sullivan对个人数字身份的产生、应用做过相应论述，她认为数字身份由一大一小两大信息集构成。小的信息集有明确的目的，是有限的信息集，决定了完成交易所必需的身份信息，被定义为“交易身份”；大的信息集提供更详细的信息，由上传信息系统的个人基本信息组成，被定义为“其他身份信息”。[16]国内，董军、程昊指出，在大数据时代，由于个人数字身份主体对身份的数据化风险感知不足以及网络言行缺乏法律和道德约束等原因，伦理问题频发。刘千仞等认为，用户在互联网活动的基础是数字身份，这之间的所有联系、交易和数据的完整性及隐私性都必须得到最佳的保护和管理。[17]葛秋萍、王珏绕认为，多样性和流变性导致数字身份认定难，个人数字身份推算危及国家安全和社会稳定。[18]

三是数据霸权催生数据垄断。Ezrachi, A.和Stucke, E. M.指出，数据的经济学性质，使其有利于市场集中和支配地位。以数据为主要驱动力的平台经济模式天生带有“垄断基因”，获得数据垄断地位的大型平台企业在市场竞争中不仅可以限制用户使用服务、侵害用户权益，而且会对其他中小型企业的发展形成挤压。翟云、蒋敏娟、王伟玲认为，企业利用“谁收集谁拥有”“谁投资谁拥有”“谁控制谁拥有”的丛林规则形成了数据垄断和“跑马圈地”格局。[19]不过，也有学者对数据垄断持否认观点。一种批评的观点是，数据本身并不稀缺，单纯依赖数据，很难形成明显的竞争优势。[20]另一种批评的观点则认为，数据是一种生产要素，这种生产要素本身具有由所有者垄断使用的特征。[21]

四是数据叠加算法支配个人。张以哲认为，在这个万物互联而又深度依靠数据进行记忆的时代，资本与大数据、算法联姻把大数据技术变成了引导、支配、控制他人的思维和行为的绝佳工具。通过对海量信息数据的深度分析可以精准地为数字化生存中的每个人进行“画像”，并基于技术手段掌握每个人的不同偏好，如果有利可图，掌握着数据和算法的私权力主体可以根据需要向目标对象推送特定信息，引导目标对象的思维和行为，形成隐形支配他人的权力。[22]“信息茧房”是凯斯·桑斯坦在《信息乌托邦》一书中提出的概念。一方面，长期困于信息茧房、屏蔽异己信息，不利于个人思想塑造和观点养成；另一方面，信息茧房容易激化矛盾、加剧社会焦虑情绪，如医患关系等问题，甚至导致群体极化。

五是数字鸿沟加剧社会不公。胡鞍钢，周绍杰指出，数字鸿沟是由于不同新兴的信息与通信技术在不同国家之间、国家内部的不同群体之间技术应用方面的不平衡而产生的不平等现象。[23]邱仁宗、黄雯、翟晓梅认为，数字鸿沟实质上是“技术鸿沟”，技术发展与使用的不平等进一步加剧了收入的不平等，导致使用群体的两极分化，也让弱势群体，特别是老年人陷入困境之中。[24]王欢、李景春认为数字鸿沟主要体现在拥有数据、分析数据和数据思维三个层面。政府出于社会稳定性考量并不会选择完全的信息公开；企业则为了实现数据资产的积累将数据视为商业秘密；个人作为普通用户，即便数字平台公布了相关算法政策，也很难读懂并进一步了解算法的底层运算规则。[25]

六是数据作假引发信任危机。真假问题是一个影响深远的伦理议题，数据的价值根源于其表意的真实性。对于数据作假的研宄，目前学界的界说较少。数据得以产生和连接的背后是人们彼此间的信任，没有信任机制，数据流不会产生，连接也不会建立。信任机制是社会网络得以构成的基础，没有彼此间的信任，就不会有沟通、协作、交换等社会行为的持续。数据作假将会逐渐摧毁这一基础，使数据背后流动的信任基因消失。此外，数据作假还会对人们固有的常识进行干扰和误导，使人们不仅不能以数据作为依据来做出判断及预测未来，甚至连基于数据认识世界都无法做到。

三、研究评述

通过大数据伦理问题相关文献资料的梳理可发现，学界已有的大多数研究存在分散性、局部性的特点，对有关数据伦理的研究缺乏理论的沉淀和研究深度的拓展。

（一）尚未从实践角度对数据伦理的发展脉络进行梳理

正如上文所言，数据伦理的发展是脉络化的，并非无水之源。20世纪70年代，计算机的出现，带来了新的技术问题，为了应对这些问题，学者们展开了信息伦理的相关研究，其核心是为了促使对计算机技术在道德范围内的正确使用。20世纪90年代，互联网的出现带来了新的网络问题，为了正确地使用互联网，学者们将与之相符的道德标准称之为网络伦理，网络伦理顾名思义就是人们对于在互联网网络中所出现的伦理问题所共同遵循的道德观念及准则。在大数据发展的今天，数据伦理进入人们的视野。从本质上来讲，数据伦理是建立在计算机伦理、网络伦理和信息伦理的基础上的。数据伦理是大数据时代出现的一种新型伦理关系，绝非对传统伦理的否定，而是对传统伦理的继承和拓展，具有一般道德的性质和功能。可以说，由信息伦理到数据伦理有其发展的继承性，他们之间有很大的相似之处，也有一些不同。但是，当前学界缺乏通过发展脉络的视角去审视数据伦理问题，没有关注新技术背景下数据伦理议题的嬗变，导致无法体现技术发展变化带来的伦理新需求。

（二）数据伦理研究集中于问题形式的浅层分析

当前学界对数据伦理的研究集中于隐私保护、算法不正义等方面，对数据伦理观念体系的建构、数据伦理的学理内涵及通识性表达、数据伦理的规范体系及实践路径等问题的探讨较少。传统的伦理结构核心在于协调人与人、人与社会之间的关系，大数据时代给伦理学带来新的命题“人机关系”，因此相关研究还需要完善数据伦理结构，实现科技与人文的统一，根本上就是要注重技术伦理与行政伦理并重的格局。特别是，需要加强对于数据伦理机制建设的研究，提供机制保障。伦理规则仅仅靠自主地去遵守是远远不够的，应该将伦理原则上升到机制层面，通过良好的机制建设，解决数据伦理问题。

（三）数据伦理问题缺乏从价值维度构建技术与伦理的纽带

当前，学界对于数据伦理问题的研究，缺乏从伦理价值角度进行探讨，没有构建起技术问题与伦理价值之间的纽带因此，需要进一步分析数据技术会对哪些伦理价值产生影响：第一，平等。平等是人文主义倡导的三大理念之一，也是现当代最为重要的人类价值观和伦理要求。因此，数据技术的发展应遵循平等原则，将大数据公正实践化。数据鸿沟和数据霸权是大数据应用引发的平等问题的典型代表，数据本身具有中立性，但数据鸿沟和数据霸权的存在使数据成为具有偏向性的、意识形态性的工具，社会中的弱势群体、博弈中的弱势国家等不同主体难以平等地接入、使用、享用大数据。第二，自由。自由亦是人文主义倡导的三大理念之一。对于自由的含义，维纳指出：“每个人的自由即是在自由中去发展他身上的最大程度的可能性”。而由于大型公司的市场垄断与自律机制的缺乏，公众通常会自愿选择放弃部分数据控制权以换取更好的服务。因此，在此种受制于人的情况下，个人不再是自由的行动者，而是处在一种限制之中，这种限制不能为个人所左右，由此个人不能自主地决定做或不做某事。第三，诚信。诚信是人类社会建构的基础。人们彼此间的沟通、合作乃至更深入的社会建构活动的进行都是建立在诚信的基础上。大数据应用过程中的数据作假是典型的违反诚信的伦理问题，诚信原则的缺失正在逐步消解公众对互联网行业与政府数据处理活动的信任。

四、研究总结与展望

数据这一新兴生产要素正在改变全球经济发展模式和重塑企业商业模式，数据已经深入到生活的方方面面，与此相伴的伦理风险问题也更为凸显。因此对于数据伦理问题的研究需要逐渐走进深水区，深入分析数据带来的伦理风险并探讨问题产生的根源，有助于我们对大数据技术形成理性认知—不盲目乐观也不消极悲观。一般来说，制度伦理包含两个理论维度，即“为制度本身的正当性、合法性提供伦理支援或道德辩护，为社会公民实现个体权利和自由提供公正的制度安排、制度调整和制度保护”。下一步，可以尝试建立一套伦理规范来指导大数据的应用和实践，有效化解伦理冲突并走出伦理困境，发挥规范各主体行为、平衡多方主体利益关系、传承以人为本伦理理念的效果，以实现大数据生态系统的良性发展。

（部分内容来源网络，如有侵权请联系删除）

立即申请数据分析/数据治理产品免费试用我要试用

上一篇：汪庆华、许可、何波、林北征等：对“反数据权属”的评议（下）...

下一篇：李嘉璐：欧盟可信人工智能自评估清单...