睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

数据流通利用系列:数据经纪人产业治理方向

时间:2022-01-29来源:坏小孩浏览数:511

当前社会由于网络科技的不断发展,消费者在进行商业贸易的同时将频繁地使用电子设备进行网络交易,这方便了交易的同时也产生了大量的数据,从而催生出了“数据经纪人”(Date Broker)这一新兴产业。美国是全世界较早出现数据经纪人职业的国家,早在21世纪初便对数据经纪人有了相关规定。本文结合美国联邦贸易委员会(Federal Trade Commission,FTC)针对数据经纪人行业的报告和相关资料进行综述,阐释数据经纪人工作具体内容和亟需提高数据经纪人工作透明度的相关管控措施,总结了美国相关评论对该报告的评价。

转载自“清华大学智能法治研究院”公众号

一、美国数据经纪人产业的发展状况

2014年,FTC针对日趋火热的数据经纪人所引来的问题做出了一份调查报告,披露了当前数家大型数据交易公司的交易现况和数据经纪人一职的有关缺陷。FTC报告中提出的数据经纪人是一个广义概念,是指:“从各种来源收集信息,然后将此类信息转售给其客户以实现各种目的,包括验证个人身份、辨别记录、营销产品,防止财务欺诈等用途”。也即,各类从事数据运营的公司都属于数据经纪人。美国佛蒙特州在2018年发布的《数据经纪法》则特别选择了狭义的“数据经纪人”的概念,是指企业或由企业经营的一个或多个单位,单独或共同有意识地收集并向第三方出售或许可与该企业没有直接关系的被代理的消费者个人信息。

数据经纪人是响应大数据和人工智能等新兴科技而生的一种新产业。美国早在上世纪就出现了数据经纪人的雏形,其产生根源于市场对于数据价值的需求。早期的数据经纪人是一种需要汇集、处理、清洗、分析多方数据资源的业务,并从数据交易授权给其他组织而获利。 这种对于数据的交易,正巧应对了当前数据要素市场发展需求。要素市场不再单一需求物质商品,对于无形数据商品的需求逐渐上升。数据经纪人从某种程度上来说,成为了促进数据贸易市场形成的关键环节,它构建了数据贸易的交易链,形成了数据公司-数据经纪人-消费者的流通利用链。

数据经纪人的出现,使得数据贸易市场有了高效的中介服务。虽然数据经纪人的些许行为对消费者的隐私权造成了侵害,但有观点指出:如果没有数据经纪人的出现,数据市场将会更加混乱。数据经纪人能够很好地协调数据买卖各方之间的关系,从一定程度上达到平衡。这样,也能够保证消费者和数据公司之间信用缺失的状况不再发生,数据经纪人可以和公司与消费者之间建立良好的信用体系。

此外,数据交易市场的极大丰富化,也是数据经纪人能够发挥作用所带来的结果之一。以数据经纪人为基石组成的数据交易市场可以运用各种大数据技术,使交易多元化、技术化。例如,成立于2016年的DataBroker DAO,是全球第一个销售和购买传感器数据的市场被称为物联网传感器数据的“eBay”或“Amazon”,Databroker DAO使传感器所有者能够将生成的数据转化为收入。这将为各行各业开辟丰富的机会,数据将被使用,并变得更有效。DataBroker DAO作为以区块链技术为基础的交易平台,支撑了数据的流通利用,并为大众创造利益。

FTC在2014年发布的报告侧重于探究数据经纪人以营销为目的各种搜集信息的措施。联邦贸易委员会对美国Acxiom、Datalogix等数据公司进行调研,发现相当一部分公司在数据来源上存在不透明现象,因此联邦贸易委员会呼吁政府能够采取相关法律措施提高数据经纪人工作的透明度以及实行相关问责制,以此达到保护消费者数据隐私等目的。数据经纪人虽然对数据进行买卖交易,但与传统交易模式所不同的是,美国当前的数据经纪人没有直接从消费者手中获取数据,对消费者数据采取行动时也没有通知消费者,消费者通常无法见到数据经纪人。数据经纪人的数据一般是由各自市场的方式间接从消费者处收集得来的。这种运营方式既有其所适应社会潮流的优点,也在运行的同时显露出其不足之处。其优点在于,消费者能够从数据经纪人所收集的许多数据中获益,并能够使用收集到的数据。数据经纪人销售的产品有助于防止欺诈,且有利于改善产品供应,并向消费者提供量身定制的广告推送。此外,利用消费者数据开发的风险缓解产品对消费者本身也有好处。但缺点也很明显,数据经纪人作为中间商,其收集和使用数据的行为同时也给消费者带来了风险。例如,数据经纪人运营的数据产品对消费者来说是不透明的,这意味着消费者无法得知是否对自身造成了损害,在造成损害之后也无法采取有效的权益保障行动。

在FTC的报告之中,委员会希望能够约束数据经纪人不经过消费者允许收集数据的行为,提高数据经纪人工作的透明度。FTC做此报告的目的是能够达成三项目标:

1. 在数据交易中能够向消费者提供更多关于数据经纪人、数据经纪人的数据收集行为和消费者的选择退出权信息。保障消费者可以自主选择退出的权利。

2. 禁止数据经纪人等从其他方出于不法行为目的获取个人信息。

3. 能够有效地保护消费者数据隐私权。而FTC的报告中,委员会结合了美国九家数据经纪公司的案例,希望能够引起政府和社会对数据经纪人工作的相关重视程度。

二、数据经纪人的工作内容

数据经纪人作为一个新兴的行业,其工作内容不同于以往传统的交易,本文参考了FTC的报告,将数据经纪人的工作内容从以下方面进行总结,总体来说,数据经纪人是将企业和消费者联系在一起的职业,其工作内容包括四个方面:

1. 对不同行业,不同的对象进行广泛的数据收集,并进行分类整理。

2. 对所收集的数据内容进行运营,用于销售等其他目的。

3. 确定数据定价的方法。

4. 与数据的消费者达成协议并支付利益。

(一) 数据经纪人收集的数据及其来源

美国数据经纪人行业收集数据的重心在于人口统计信息,例如姓名、地址、电话号码、电子邮件地址等。此外还包括如个人偏好信息、个人行程信息、个人消费,交易信息、个人社交信息、个人慈善信息等。以上都是一般数据形式,但是FTC的报告一致认为:一些简单的可用数据可以衍生出更多的空前数量的信息,具体例如:消费者的购买产品及交易信息,消费者是否购买了某项产品,甚至消费者购买的频率;消费者如购买了汽车,其汽车制造商及型号,消费者更喜欢新车还是二手车,这些都将算在信息数据的考虑范围之内。因此,在数据经纪人眼中,简单的数据易演化成更为广泛的数据海。

FTC在报告中提到,其向多家公司采取了调研,统计结果显示获得美国消费者数据的渠道可以分为五种来源:

1. 公共数据来源:数据经纪人可以从公共记录来源获取信息,例如人口普查、财产记录、法庭判决等。

2. 向其他数据收集商购买或获得使用许可:可以向数据零售商、数据经纪人购买或者取得许可,此种来源对象包括可以个人、企业。

3. 合作协议与其他公司:与其他公司协议,共享数据库。

4. 数据经纪人自行收集:数据经纪人可以通过问卷、抽奖或社会调研等方式收集个人信息。前提是必须合法。

5. 社交媒体:从消费者的社交媒体收集有关行程、喜好等个人信息。

(二) 数据经纪人的交易模式

在交易时,数据经纪人将消费者的信息进行分类,由其共享特征和可能的行为定义确定数据的分组。例如,一些数据经纪人会对经济弱势群体的数据进行特别标注,数据经纪人描述的很多产品都侧重于描述消费者的经济情况。这些标签往往用来识别奢侈品交易和投资的潜在受众。

在美国交易市场,数据经纪人通常会对销售产品确立“信用评分”和“风险评分”,用来确定消费者是否处于经济弱势群体或是否遵守信用。不同的数据经纪人因为经营数据的种类不同,因而对消费者群体的偏好也不相同。

根据美《公平信用报告法》:一些企业出于营销目的销售的评分产品类似于信用评分工具,根据公平信用报告法,不能用于营销。

(三) 数据经纪人的消费方(Data Broker Customers)交易模式

1、购买数据方(Who Buys the Data)

FTC对多家公司进行了调研,不过,一些公司对特定客户提供了描述,其他公司却只提供了购买其数据的客户类型的一般描述。

Epsilon公司为FTC提供了一份消费者行业清单,其中包括:“企业对企业,经纪人,包装消费品,直接消费品,新兴市场,金融,医疗保健,高科技-电信,保险,多渠道营销(目录),非营利性,出版,研究,零售,战略合作伙伴,烟草,以及旅游和娱乐。”

2、交易标的

数据经纪人收集了消费者个人数据之后,数据便成为了交易的产品。数据经纪人将数据销售给消费者,消费者也会根据需求从经纪人处购买商品。

如果对数据经纪人销售的数据产品进行分类,则可分为“现实数据”、“虚拟数据模型”两种组成。其中,“现实数据”是指,经纪人所收集的消费者个人真实的信息,可以用数字文字来直接表述;而“虚拟数据模型”则是指数据经纪人基于实际消费者所提供的特征,可预测的行为和衍生数据。

3、客户对数据的使用新机制(New Mechanisms for Using Data)

数据经纪人会通过在线或离线的方式与消费者接触。传统方式下,数据经纪人会将客户列举邮件清单,以电子邮件、电话联系发送等方式向消费者提供数据信息。不过,数据经纪人越来越多地将以数据化方式提供给客户。他们还越来越多地关注使用他们的线下消费者资料来提供在线广告服务。

许多数据中间商声称:数字产品比传统邮件营销为消费者提供了更多的隐私保护,因为在这种情况下使用的消费者数据不像通常理解的那样是“个人可识别的”。他们指出,在网上营销中,有关消费者的信息通常与代码相关联,而不是消费者的名字。然而,一些隐私和信息专家已经表达了对重新识别技术可能用于此类数据的担忧,并质疑识别特定计算机和设备的数据是否真的可以被视为“匿名”。

毕竟,消费者在大多数情况下不与数据经纪人直接沟通与接触。

三、数据经纪人的问题及其治理策略

(一)数据经纪人的透明度(Data Broker Transparency)

数据代理通常不是面向消费者的,因此,大多数消费者没有办法知道数据经纪人可能正在收集他们的数据。

由于许多企业与客户签订了合同,以此来限制客户对其数据源的披露。美国消费者通常没有联邦法定权利访问、更正或控制数据经纪人为营销而保留的信息,企业可以在很大程度上自行决定为这些数据建立隐私保护。

通过上述情况,联邦委员会成员报告继续支持自我监管,认为这是保护用于营销的消费者数据隐私的最佳方法,许多数据代理对委员会的回应强调了自我监管的重要性。

(二)数据经纪人制度的局限性(Limitations)

在美国的数据交易市场上,数据经纪人受到企业的监督管理,即:除非收到公司的书面许可,否则不允许将公司作为许可数据的来源进行广告宣传或以其他方式向第三方进行披露。

不过,数据经纪人在查阅和更正数据的权力上区别很大,有的企业给予经纪人在查阅数据上的权利的同时,也相应给予了修改权,但这相关于消费者的信息在很多情况下是不允许予修正的。

(三)消费者的选择权(Opt-Out Right)

委员会也提出:消费者同时也应当保有供这些服务的公司选项。通常通过他们的隐私政策和公司通知消费者这个选项网站。他们也可以完全选择不让别人收集他们的任何数据。即可以选择退出信息共享。

当消费者选择退出共享信息时,有的公司并不会删除消费者的个人信息,通常是为了保存消费者的偏好,以达到更好的营销目的。

不过重要的是,当前很多消费者不清楚数据经纪人掌握了他们的信息,更加不清楚他们具有选择退出的权力。这也是政府和公司对于相关渠道不曾完善的缘故。

在某种程度上,数据经纪人为消费者提供了关于他们的数据的选择,但美国联邦贸易委员会认为:数据经纪人给予的选择在很大程度上是不可见和不完整的。一些数据代理提供给消费者有关于数据的选择,但由于数据代理不是面向消费者的,消费者可能不知道到哪里去执行可能提供的任何选择。

(四)对数据经纪人的立法建议

FTC在提出了数据经纪人目前的缺陷的同时,也做出了多种立法建议。数据经纪人行业在实践中,最明显的问题是在根本上缺乏透明度。

数据经纪人能够获取大量关于消费者的详细和具体信息,通过分析它,来推断消费者的喜好和其他信息,其中一些可能被认为是相当敏感,触犯了个人数据隐私。而这些活动大多发生在消费者不知情的情况下。如果从立法上保护消费者的数据隐私,就要提高使消费者能够了解数据中间商的存在和活动,并使消费者能够合理地获取这些实体所持有的有关数据中间商的信息。事实证明,自我监管这项原则能够实行的作用极其有限。因此亟需从立法上进行监督管控。FTC的报告指出,应当要求数据中间商支持消费者访问他们的数据,去除经纪人为了营销目的而选择不向消费者共享数据的行为。目前,消费者不知道哪些数据代理可能拥有他们的数据,也不知道他们可以从哪里访问数据,或者他们如何行使数据代理商可能已经提供的任何退出权利。为了使消费者能够有效地利用自己的这些权利,立法还可以要求建立一个统一的机制,例如数据经纪人登记平台,在该平台中,数据经纪人可以介绍自己,描述其信息收集和使用做法,并提供访问工具的链接和选择退出(opt-out)这样的程序机制。为进一步提高透明度,FTC的报告建议今后的立法可以要求数据经纪人清楚地向消费者披露(例如,在他们的网站上),因为他们不仅使用从消费者处获得的原始数据,例如一个人的姓名、地址、年龄和收入范围,也从数据中得出某些推论性的衍生数据。这些应当给予披露。

概而言之,立法应当要求数据经纪人向消费者提供以下支持:

(1)允许消费者访问自己的信息;

(2)允许消费者选择不使用该信息;

(3)向消费者明确披露数据中间商的信息来源,以便消费者在可能的情况下从源头更正其信息;

(4)明确披露选择退出的任何限制。

四、FTC数据经纪人报告在美国的影响

虽然FTC给出的提案中对于数据经纪人当前的社会影响颇有微词,譬如对消费者的隐私权造成了危害,现有的政治制度不足以保护消费者的合法权益等。但自美国兴起的数据经纪人一职在当前社会趋势下符合了当前数据社会的发展要求,数据经纪人随着当前大数据的不断发展相伴相生,成为了眼下不可缺失的职业。

而美国的数据经纪人职业,也是世界范围内较早将数据交易、数据经纪人付诸于法律的国家。美国对于数据经纪人的实践给世界各国提供了积极的范例,可以说,美国在该领域已经就数据流通和利用方面建立了较为成熟的数据经纪人治理机制。如果对数据经纪人的来源进行追溯,其源头或可追溯到上世纪,不过,在上文提到的2012年FTC对数据经纪人行业进行的大调研中,九家不同的企业Acixion、Corelogic、Datalogix、e Bureau、ID Analytics、Intelius、Peek You、Rapleaf、Recorded Future经过FTC的调研,使社会各界对数据经纪人有了更加深入的了解。也以此为开端,美国社会对数据经纪人带来的社会影响也逐渐加以重视,逐渐涌现出了很多对于数据经纪人的报告和提案。

例如,《数据经纪人责任制和透明法案》于2014年2月由议员洛克菲勒(JohnD.Rockefeller)和马基(Markey)提出,2015年由美国国会第114次会议进行审议形成草案。美国于2015年发布了《消费者隐私权利法案》(Consumer Privacy Billof Rights Act)草案,其中采纳了美国联邦贸易委员会新的隐私框架,构建了大数据时代的新思路。

2014年,美国联邦贸易委员会对数据经纪人所作的报告在美国国内引起了较大的反响,数据经纪人作为一个较为新颖的理念出现在人们的视野内,并被群众逐渐所接受合理解。不过,舆论还是对委员会提出了质疑。其中,包括但不限于对FTC报告内容的批判性解读。例如,美国西北大学的Ashley Kuempel在2016年发表文章指出:FTC报告中的立法建议虽然朝着正确的方向迈出了一步,但无法达到充分数据隐私改革的目标,文章建议美国也参照欧盟采取专门的隐私数据立法来解决问题。此外,还有众多美国评论家呼吁委员会能够采取更加有效的手段保护消费者的数据隐私。1

安东尼·伯吉斯(Anthony Burgess)认为:“在现代社会,一个人能要求的最宝贵的东西就是独处。” 2Ashley Kuempel认为,2014年的FTC报告是一记对数据经纪人行业的隐私警钟,但是其所收获的实效却远远小于其对社会各界的影响力。因为,FTC报告中的“立法建议”部分缺乏必要的力度来解决当前美国消费者面临的隐私和歧视问题。为何联邦委员会在解决数据隐私的问题上缺乏力度?Ashley Kuempel提出:FTC仅仅强加给消费者一项“拥有不受干涉的隐私权利”是远远不够的,消费者还将受到消费市场种种不公平和掠夺性的行为影响、例如差别定价或营销公司的消极对待。FTC必须主动通过全面的立法,去实现对个人数据的严格保护。文章认为,对数据经纪人的监管必须事先实施,而不是事后弥补,要做到这一点,唯一的方法是完全放弃在上文所提到的数据经纪人的自我监管方式。

该篇文章以及美国社交媒体的评论是从个体权利的角度去评价FTC报告的效果,因此在一定程度上具有理想主义,但从另一方面来看也指出了FTC报告的不足。研究认为,委员会的弊端主要在以下两个方面:

1、聚集效应(The Aggregation Effect)

该文章引用了一个新的概念:“聚集效应”。聚集效应是指数据公司不只是收集单个的原始数据,而是使用学习算法对消费者进行推断,将他们按种族、收入、宗教和政治立场等进行分类。在从多个来源收集原始数据之后,数据代理将这些数据合并,最终创建一个消费者生活的“详细组合”。这被称之为“聚集效应”。

应该说很多聚集效应出现的初衷都是好的,商家将这些详细的个人资料整合,并认为在消费者市场上将有奇效,可以向特定的人群提供产品和服务。然而,他们没有注意到的是,许多这些“详细的材料”并不能有效针对到市场群体,并成为数据公司用来歧视的工具。正如上文所提到的那样,数据分类之后会对消费者进行具有歧视性质的分类,从而导致消费者权益损害。

2、消费者缺乏补偿(A Lack of Consumer Redress)

FTC和评论界一致肯定的是,消费者几乎没有办法改善大数据带来的隐私和歧视问题。而且,消费者在营销领域中的联邦法定权利基本不存在。也就是说,法律并不能很好的保护消费者的固有权利。更甚者,消费者无权控制和分享自己的个人信息,即使这些信息涉及个人敏感问题,消费者也缺乏修正数据的法定权利。

大多数消费者没有意识到,在大数据的世界里,“选择退出”并不等同于删除数据。而结果是,一些数据经纪人仍然可以继续在“以匿名聚集效应下显示数据的产品”中使用曾经“删除”的信息,而不是完全停止使用。因此,给予消费者“选择退出”的权利,并不能有效地减轻消费者的隐私负担。综上,有效的解决方法不应该仅仅确立消费者的权利,而应当从立法方面着手,对数据中间商实施事先规制,甚至在收集数据之前就为消费者提供充分的保障,也即倾向于欧盟的严格立法模式。

对于这些暴露出来的问题,从舆论的角度,也有评论给出了一些建议,以此来补足FTC报告的缺漏之处。例如,在上文中,FTC报告建议国会通过法律,允许消费者:(1)可以访问他们的数据,(2)能够选择不将他们的个人信息用于营销目的。但是,评论观点认为,FTC应该对数据隐私权采取更强硬的立场。FTC过于专注于个人的选择,例如,消费者可以选择自我退出。立法机关应当加重对大数据行业本身的监管。

五、广州市海珠区首推国内数据经纪人

虽然美国于2014年就将数据经纪人推至舆论大众的视野当中,我国对于数据交易所的实践尚在尝试阶段。2021年12月9日,《广州市海珠区数据经纪人试点工作方案》正式印发,旨在全国范围内首次探索建立数据经纪人制度,这是广州市海珠区数据市场的一项重大制度改革,也是我国官方首次推出数据经纪人理念。应当说明的是,美国的数据经纪人模式和我国的数据经纪人模式尚有差异,广州市海珠区首创的数据经纪人在我国是否有广阔的前景,尚值得探究。

根据相关资料,广州市海珠区总结出了两种模式:一是数据市场模式,数据提供方和购买方都经交易平台审核认证、自愿从事数据买卖,数据交易平台以中间代理人身份为交易双方提供撮合服务。数据交易平台还可以数据经纪商身份,收集用户数据,并将其转让、共享与他人。二是数据银行模式。数据提供方(一般为个人)采用授权或主动上传的方式将数据存储于数据银行网站之上,数据银行向提供方支付一定的报酬,数据需求方在数据银行网站上对目标数据集进行搜索,需求匹配后可完成交易。这两种模式都是利用了数据第三方在数据要素市场的作用,可以统称为数据经纪人运行模式。在近十年的发展过程中,我国以贵阳大数据交易所为首的首批数据交易所发展不甚理想,究其原因,也是对于消费者的数据隐私保护并不完善,而导致数据交易双方与中间商相互之间不信任的局面。因此,本次数据经纪人试点将着重于提高数据可用性和数据交易服务的质量,保障交易公平和真实性,旨在提升交易之间的信任度。

当前,在海珠区数据经纪人的试点范围设定在电力、金融、工业互联网、电子商务、通信等社会数据丰富的重点领域,采用适合行业特性和产业链业务需求的方式推动场景化数据利用,一方面,要做好平台方稳定的数据安全保障能力,实现数据平台模式的透明化,可溯可查,另一方面,也要加强政府对试点平台的监督监察。结合广州市海珠区所出台的工作方案,广州市海珠区数据经纪人模式已经具备了数据经纪人模式的发展理念和初步的发展规划。例如,广州市海珠区旨在构建分类分级的数据经纪人体系,将公共数据划分为核心数据、重要数据和一般数据,建立与之对应数据经纪人分类分级资质管理体系。

六、结语

数据经纪人作为当前大数据背景下新兴职业之一,具有十分宏远的发展前景,合理运用数据经纪人,可以增进数据市场的信任关系,扩宽交易渠道,完善我国数据交易市场的运营机制。美国对于数据经纪人的研究报告给我们提供了经验教训,在我们构建数据经纪人的过程中可予以参考。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询