睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

数据治理:数据开放与共享的现状与未来

时间:2022-11-28来源:两包辣条约吗浏览数:2079

数据治理的核心之一是推动数据有序、安全地流动,以便最大程度地挖掘和释放数据价值。数据流动则需要推动数据的开放分享,实现数据的“聚”“通”“用”。近10年来,发达国家以政府数据开放共享为核心,普遍进行了卓成有效的数据开放分享实践,在企业数据开放分享方面也有“开放银行”等创新探索实践。我国虽然还处于数据开放分享的初期阶段,但因为数字中国、数字政府等数字战略的实施,以及数字技术在各个领域的持续创新应用,数据开放共享也已取得较好成果。数据的开放分享,核心在于“数据价值”的流通,“分布式数据价值分享”或将成为未来数据开放分享的重要特征,而隐私计算等新型数字技术将为此提供技术支撑。

一 全球数据开放分享的背景

首先,社会对知情权的追求在大数据时代有了新发展。伴随着社会和居民对知情权的追求不断升级,发达国家在信息公开、政务公开等方面也一直在升级。从整体来看,美国、英国、德国、法国、加拿大、澳大利亚等主要西方发达国家,早在20世纪60-80年代就开始出台关于信息自由、数据保护等方面的国家层级的法律,并不断改进信息公开、政府公开的方法。进入21世纪后,数字经济逐渐成形,信息革命无论是在政府还是经济各个领域都快速展开,大数据以几何级速度增加,传统的信息公开、政务公开方式已难以全面、有效达成社会知情权的实现。公众和各国政府普遍认识到,大数据的开放分享,可以有效打破“数据孤岛”,进一步满足社会和公众的知情权。

其次,大数据已成为社会发展的重要资源和新型生产要素,只有推动数据有序、安全地流动,才能更好发挥其价值。大数据普遍被认为具有规模海量、低价值密度、维度多样等特点,分散的数据维度少、数据量小、价值低。例如,人们的医疗数据分散在不同医疗机构,保险数据分散在不同的保险公司,借贷数据则分散在不同的银行,从而形成互不相连的单一数据源。单一数据源造成数据规模量小、可供分析维度少、数据质量低等问题,难以通过高级统计分析以及人工智能等技术盘活海量数据资源,充分发挥数据价值。只有通过算法、算力等实现数据的“聚”“通”“用”,才能实现数据价值的整合和有效释放。

数据开放分享是人类在数字经济时代必须面对的时代新命题,一方面数据融合可以带来极大的社会价值,大数据作为新型资源生产要素可以创造更多的消费者福利,催生更多的经济创新;另方面,数据开放分享稍有不慎也可能带来不利影响,在消费者层面可能使个人数据安全和隐私保护受到挑战,在企业数据主体层面可能使商业秘密、创新动力等受到挑战,在国家层面可能使国家安全受到部分挑战。

二  国外数据开放分享的发展情况

继美国于2009年发布并上线整合联邦政府各行政部门数据的政府数据开放平台 Data.gov 以来,数据开放分享在全球范围内出现快速推进的趋势。

一、发达国家政府数据开放进展

(一)美国

1995年,美国共和党众议院创建THOMAS.gov网站,为公众提供有关立法的全面信息。之后,美国出现了多个数据共享网站,让数据开始走出政府,包括国民人口及经济数据共享网站 Census.gov、竞选财政数据共享网站 OpenSecrets. org、国会相关数据共享网站CowTrack.us 等。2009年,美国国家级政府数据开放平台 Data. gov 正式建立,其整合了联邦政府各行政部门数据,被学者认为是全球政府数据开放的标志性开端事件。①美国政府数据开放有以下几个特征:

一是确保数据开放共享平台的数据可利用性较强。首先是数据可操作性强。Data. gov 上有50多个组织的近20万个数据集,涉及农业、商业、教育、海洋、公共安全等10多个主题,但其有丰富的数据格式,可以满足不同用户提取、使用数据的需求,用户还可以通过该平台获得数据分析、摘录、提取、格式转换等数据处理工具与应用程序。其次是检索功能强。Data.gov 为用户提供了直接检索按分类检索和按位置检索三种检索方式,能够最大化地方便用户检索。最后是用户参与度高。Data.gov 提供了信息分享功能,用户可将部分政府数据分享到Youtube、Flickr 和Facebook 等社交媒体上。为了方便与用户的沟通交流,Data gov设置了“问询”“请求”和“问题报告”三大板块以提高用户的参与度。

二是通过完善的法律体系保障数据自由开放。该法律体系用于保证政府数据的开放性以及公众所获数据的质量和数量。从前期的《阳光下的政府法》和《电子政务法》,到2009年奥巴马签署的《透明与开放的政府备忘录》,共同为政府数据开放打好了基础。2015年,美国颁布《第三份开放政府国家行动计划》,2016年,美国发布《联邦大数据研究与开发战略计划》,2018年12月21日,美国启用《公共、公开、电子与必要性政府数据法案》(又称《开放政府数据法案》),这些让美国政府在数据开放方面再上新高度。三是通过有效执行机制和管理体系确保数据开放落实。①美国政府为了保障数据开放分享的政策落到实处,制定了配套的政策执行机制,在人力、政府信息化顶层设计、技术政策制定、技术专项预算管理、数据战略规划等多个方面为美国政府数据的共享开放提供支持。在以往基础上,最新的《联邦数据战略与2020年行动计划》指出,建立联邦首席数据官委员会和联邦数据政策委员会,并通过专门负责人完成对数据全生命周期的监控和管理。

(二)英国

英国也是政府数据开放共享程度较高的国家之一。根据2018年万维网基金会的《开放数据晴雨表》,英国的政府数据开放总得分位列全球第一。

英国的数据开放分享,在平台建设方面注重用户体验以及激发社会使用兴趣。第一,数据开放提供多种数据分类入口。截至2020年6月,英国政府数据开放平台 data.gov.uk共涉及商业与经济、环境、地图、犯罪与司法等12个主题的54000余个数据集,主要包括国土、地理信息、人口普查、国家预算、公司注册、国家立法、国际贸易、健康、教育、犯罪、环境、竞选结果等数据。为便于用户检索数据,平台提供发布机构、主题、数据格式等多种分类维度,在支持关键词检索基础上,还支持用户利用布尔逻辑组配、短语检索、字段限制、基于地理位置检索等检索技巧。第二,平台至今已举行七次“数据开放营”,培养全社会对开放数据的使用兴趣。此外,平台也及时倾听用户反馈并改进数据开放体验。

在政策保障方面,英国具有完善的政府开放数据政策法规体系。近年来,英国政府高层一直将政府数据开放作为国家战略进行推动。2010年,英国首相卡梅伦提出致力于打造“世界上最开放、最透明的政府”。在数据开发战略规划上,2011年至2019年,英国连续发布四份《英国开放政府国家行动计划》。在开放数据标准上,2010

年,英国发布《公共部门透明委员会:公共数据原则》,提高数据开放形式、格式、许可使用范围等14项原则。2012年,发布《开放数据白皮书:释放潜能》,提出数据开放的五星评价标准和专门的“开放标准原则”。在开放数据创新利用上,英国政府倡导数据分析与可视化技术的创新,奖励推动开放数据创新的最佳组织。

在组织机制方面,侧重于“互相协同、共同推进”。首先,英国十分注重明确数据开放的责任主体。例如,英国内阁办公室为数据开放领导机构,主要负责协调和监督各单位数据开放工作,并负责制定与数据开放的相关政策法规。此外,英国还设有开放数据研究部门等。其次,英国组建了推进数据开放的专门机构。2011年,英国设立了数据战略委员会和公共数据集团,前者向内阁大臣提供数据发布建议,管理与公共数据集团合同,以及为中央和地方的开放数据机构提供资金等;后者则致力于以低廉的价格为数据使用者提供服务,为中小型企业和非营利机构使用数据扫清障碍等。

(三)欧盟

近年来,由于数据开放分享主要集中于政府公共数据领域,因此欧盟的数据开放分享主要由各成员国各自主导。但在欧盟层面,相应的数据开放分享工作也在有序开展,重点是在制度层面寻求欧盟范围内的统一,以便利化数据在欧盟内部的自由流通。

欧盟于2020年初发布《欧盟数据战略》,试图通过加强数据流通,建立真正的欧洲单一数据市场,其中公共数据的开放分享是重点。一是加强欧盟层面在数据公共空间使用数据的治理机制,优先通过标准化活动,形成数据集、数据对象和标识符的统一描述,促进各领域间的数据流动,以符合GDPR的方式保证数据在技术层面具有可用性。二是使以公共利益为目的的个人数据使用(即“数据利他主义”)更加便利。三是致力于实现更多高质量公共数据的再利用,使数据集在欧盟内部可以通过机器可读的格式利用API免费提供。2020年底,欧盟发布《数据治理法》草案,进一步要求确保公共部门数据在受他人权利约束(如GDPR)的情况下,允许出于“利他目的”重复使用。

(四)小结:发达国家政府数据开放的主要特点

总体来看,发达国家政府数据开放具有以下三个方面的特点:一是各国基本建立了全国性的“一站式”政府数据共享平台。除美国、英国外,加拿大、德国、法国、日本和新西兰等主要发达国家近年来均建立起全国统一的“一站式”政府数据门户网站。数据开放的领域集中在农业、经济、环境、教育、交通、健康、能源、科技等与公民密切相关的领域,提供PDF、HTML、CSV、XLS、API等多种形式的数据格式。

二是基本建立了较完备的数据开放分享法律体系和落实机制。209年之后,加拿大出台《信息获取政策》等,明确政府信息获取渠道;德国通过实施《信息自由法》等系列法律,明确政府数据的公开性和透明化原则;法国颁布《“数字共和国”法案》《公众与政府关系法》等,强调政府数据开放和数据安全。与此同时,各国与美国、英国类似,也建立了特色鲜明的数据开放分享落实机制。其中,德国专门设立开放数据机构,建立跨级别、跨行业的数据开放协调办公室。

三是在开放数据利用开发方面进行了多种创新,包括数据分析机制、有偿利用机制、多主体开发利用机制等。英国标准协会(BSI)和德国标准化协会(DIN)针对公众使用国家标准的有关数据制定了分级收费机制,在创新领域或政府资助的项目中提供一些免费的标准或公用规范,而其他领域的国家标准数据资源则需要通过购买才能获取。各国均倡导社会多主体参与数据开放分享。例如,2010年,美国联邦政府与健康服务企业、医药实验室、零售药房供应商与州免疫信息数据库等合作推出“蓝纽扣”计划,消费者使用“蓝纽扣”获取个人健康信息副本,以便管理其健康、经济状况,并与信息提供方交换信息。2012年,美国政府与电力行业合作推出“绿纽扣”计划,为家庭与企业提供能源使用信息,并帮助他们节约能源。

从效果上来看,数据开放分享的确对社会治理和经济发展起到了较明显作用。研究发现,数据开放分享之后,大量基础数据成为社会基础设施,吸引了相关商业机构、科技机构、中介组织等对数据的利用。例如,社会组织“为美国编程”利用美国波士顿市政府开放的13000多个公共消防栓位置数据,向本地居民发起“领养”消防栓活动,解决了该城市冬天消防栓经常被大雪掩埋导致火灾时消防员延误救火的痛点。新加坡近来利用政府开放数据实现了登革热传染疾病的群防群治等。

二、发达国家企业数据开放分享探索

政府各部门公共数据开放在数据开放分享中占有大部分权重,此外,企业主体的数据开放分享也在探索中,其中金融领域的数据相于数据相对标准化、价值含量高,成为企业数据开放的领头羊。近年,全球范围内兴起的开放银行(Open Banking),是金融领域数据开放分享的典型创新。

开放银行,是一种旨在实现“银行无处不在”的发展策略,方式包括银行业向第三方机构开放金融服务接口和数据,或将第三方场景服务引入银行业务等,其目的是将金融服务嵌入各类商业、生活场景,发现并满足用户各种新型金融需求,实现数据融合和金融服务下沉。例如,近年来花旗银行和澳洲航空(Quantas)以开放AH模式推出新型联营信用卡,客户可以直接在澳洲航空 App 上完成从开户到支付、还款的全部交互过程,澳洲航空负责账户管理,并且和银行数据分享。再例如,高盛和苹果公司合作推出数字信用卡Apple Card,苹果的硬件、软件和用户数据与高盛的金融服务无缝连接,共同为双方素未谋面的海量用户提供全新体验的移动互联网消费金融服务。

近年来,随着开放银行理念的发展,账户数据整合成为美国和欧洲等成熟市场智能投顾平台的普遍实践。账户数据整合和理财规划功能在提升家庭长期财务规划意识方面能够发挥非常重要的作用,也是投顾人员全面了解客户非常好的工具。美国的 Mint公司具有很强的代表性。根据官方网站的数据,Mint 目前拥有约5000万客户,客户可以通过授权在 Mint网站上管理美国几乎所有的金融账户储蓄、抵押贷款、汽车贷款、信用卡、学生贷款、养老金和股票等。该公司已与美国多家金融机构签署了数据共享协议。通过一站式数据收集,Mit还提供增值服务,如消费者财务分析,财务规划和账单支付为客户带来了极大便利,为客户增值创造了机会。

顺应个人账户数据整合的市场需求,欧美市场还发展出一批专门为创新型企业和金融机构提供个人账户数据链接的中间层企业Yodlee 是美国一家领先的数据聚合和分析平台公司,其提供三类API 产品:一是数据聚合 API,利用机器学习和数据科学算法识别账户交易数据并将其分门别类,从而为上层商业生态系统内的第三方公司提供精确、清晰、标准化和易于使用的交易数据源;二是账户验证API,以往银行账户验证过程需要花费数天时间,甚至需要客户核实银行账户中的小额存款以验证账户,而 Yodlee的账户验证API将此过程缩短至秒级,客户只需要输入网上银行凭证即可实时验证账户内余额;三是资金流动 API,使用Yodlee的 API平台,客户可以通过第三方应用程序连接到自己的银行账户,并在一个安全的支付环境中转移资金。

此外,发达国家金融机构在服务中小企业方面正从支付、信贷等单点金融服务方式,向多元化、全流程的生态服务方式转变,该种服务转变也离不开数据融合利用。例如,美国智能财税服务巨头Imtuit公司充分利用自身的财税服务和数据价值,与市面上主流中小企业服务平台进行深入合作,建立全方位、全流程的中小企业服务的开放生态,具备了为中小企业提供财务、税务、薪资、支付、理财等综合服务能力。

三 中国数据开放分享的发展情况

我国也极为重视数据开放分享战略。党的十八届五中全会通过的(中共中央关于制定国民经济和社会发展第十三个五年规划的建设)提出,“实施国家大数据战略,推进数据资源开放分享”。国家大数据战略,旨在全面推进我国大数据发展和应用,加快建设数据强国,推动数据资源开放共享,释放技术红利、制度红利和创新红利,促进经济转型升级。

我国目前虽处于数据开放分享的发展初期,但在借鉴国际经验的基础上,结合建设数字中国、数字政务以及数字经济基础设施的建设需求,我国开展了大量数据开放分享实践,在取得一系列成效的同时,还探索了中国特色的数字政务模式,以及企业数据融合模式。

一、我国政府数据开放实践

(一)我国超半数省份建成数据共享平台,但数据开放速度、质量仍有进一步提升空间

我国虽然尚未形成国家层面的“一站式”政府数据开放分享和开发利用平台,但政府数据开放进展迅速、喜人。2012年,上海市政府推出我国首个公共数据开放平台(https://data.sh.gov. en),之后北京、湛江等地也建设了自己的网站。在2015年国家出台《促进大数据发展行动纲要》之后,我国政府数据开放平台呈现爆发式增长。据复旦大学与国家信息中心数字中国研究院联合发布的(2020下半年中国地方政府数据开放报告》,截至2020年10月,我国已有142个省级、副省级和地级政府上线了数据开放平台,与2019年下半年相比,新增4个省级平台和36个地级(含副省级)平台,平台总数增长近4成。

在建设模式方面,我国省级开放平台分两种,一种是省统一建设平台并为各地市提供数据存储、安全和门户个性化定制等服务;另一种是省市独立建设,相互之间关联性低,该情形相对较为普遍,

在平台功能方面,各地已建开放平台基本包括数据目录预览、数据分类检索、数据详情、数据下载、接口服务和功能交流等功能。部分地方还增设了数据可视化分析大屏、分析工具、智能客服等功能。

在开放数据数量方面,全国开放数据集总量已从2019年10月的71092 个增长到2020年10月的98558 个,增幅接近40%。然而,各地之间的开放数据集总量仍差异显著,约20%的地方平台已开放的有效数据集总量超过了1000个,其中山东的威海、烟台、枣庄等地区开放的有效数据集总量最高,但目前还有约50%的地方开放的有效数据集在数量上不到100个。从数据容量来看,截至2020年10月、各地开放的有效数据集的总容量接近19亿个,与2019年同期相比增长约23%。然而,各地开放的数据容量大小差异显著,江与温州两地平台上开放的可下载数据集的数据容量已分别超过1亿个,但仍有约43%的平台上开放的数据容量在100万个及在开放数据质量方面,约35%的地方平台提供了优质数据集,但优质API接口屈指可数。各地提供的 API接口普遍存在调用难度高、调取数据容量小和数据更新频率低等问题。在开放数据标准上,超四成地方平台缺少专门的开放授权协议,仅有不到两成的地方平台为数据集标示了多种开放类型。在开放数据持续性方面,仅有不是一成的地方平台能在近两年半以来每个季度都能持续新增数据集;019年第二、第三季度,近四成的地方平台没有更新数据集。

(二)我国数据开放分享政策、法规体系建设进入快车道,但还缺乏权威法律体系

近年来,党中央、国务院和国家有关部委高度重视政府数据开放分享工作,相继发布了一系列政策、法规指导各地加快建设数据做平台。2015年9月,国务院印发《促进大数据发展行动纲要》,提出“加强对政府部门数据的国家统筹管理,加快建设国家政府数据一开放平台”。2016年7月,《国家信息化发展战略纲要》印发,要求建立公共信息资源开放目录,构建统一规范、互联互通和全可控的国家数据开放体系。国务院办公厅于2016年、2017年相继出台《政务信息资源共享管理暂行办法》《政务信息系统整合共享实施方案》,要求将政务信息系统纳入共享范畴,推进全国政务信息整合共享。2017年2月,中央全面深化改革领导小组通过《关下推进公共信息资源开放的若干意见》,提出进一步强化信息资源深度整合;发挥市场优势,促进信息资源规模化创新应用。党中央、国务院于2020年3月30日颁布的《关于构建更加完善的要素市场化配置体制机制的意见》指出,要加快培育数据要素市场,促进重点领域政府数据开放和数据资源有效流动,扩大农业、工业、交通等重点行业的政府数据开发利用场景。

我国还有近20个省级行政区颁布了公共数据管理办法或信息资源共享管理办法、总体规划,广东、山东等省份还发布了公共数据开放的地方技术标准和规范,对数据开放涉及的基本要求、分级分类、脱敏和指标评价等进行了探索。

不过,总体来说,与西方主要发达国家相比,我国政府数据开放分享政策、法律体系还处于建设阶段,尚未出台全国层面的关于政府数据开放、开发利用的系统性的法律法规,更缺乏辩证统一的权威法律体系,也未有专门针对数据隐私保护的法律。

(三)政府数据开发利用亮点频出,但潜力有待进一步释放

目前,我国政府数据开发利用的进程集中于地方政府数据的集聚和开放分享阶段。在政府数据开发利用的典型工作上,交通运输部、教育部、生态环境部等部门积极响应国家大数据战略行动,出台指导性部门规章,在交通、医疗、气象、教育等重点领域推动政数据开放和融合应用,推进政府数据资源开发进程,上线了服务交通、教育、健康等的有效应用。此外,上海开放数据创新应用'、青岛市政务数据中台等地方政府数据的探索利用均取得了显普就效。不过从整体来看,我国现有数据开放分享中,利用国家政开放数据进行公共服务或商业应用的亮点开发行动还是非常不足的,对行业开放数据的挖掘不够深,未来政府数据开发利用的深度看待进一步加大,进一步释放应有的潜力。

二、我国打破“数据孤岛”的数字政务创新

我国在加快建设“一站式”政府数据开放分享和开发利用平台的基础上,还在进行具有中国特色的公共数据融合利用模式创新——数字政务“一网通办”。

近年来,我国各级、各地的数字政府建设取得显著成效,以“联网+政务服务”为代表的举措已全面铺开。我国数亿居民在线下基本实现“只进一扇门”“最多跑一次”的基础上,在线上也能实现“一网通办”,数字生活水平在全球居于领先位置。2018年起,爱国政务服务“一网通办”还与国内大型互联网平台合作,利用数字科技手段提升用户精准触达和智能服务水平。

我国政务服务“一张网”已初步形成。2018年10月,西藏自治区政务服务网开始试运行,标志着我国32个省级政务服务平台已基本建成。2019年5月,国家政务服务平台上线试运行,联通了32个地区和 46个国务院部门,标志着以国家政务服务平台为总枢纽的全国一体化政务服务平台框架初步建成。①通过打造全国政务服务“一张网”,全国一体化平台标准规范体系、安全保障体系和运营管理体系已基本建立,这让我国政务服务数据共享水平有了显著提升。

三、我国企业数据开放分享探索

在公共数据开放之外,近年来我国也在企业数据开放分享方面进行了富有成效的探索。例如,商业银行与三大电信运营商、公安系统通过数据合作,共同开展金融反欺诈业务。再例如,在中央网信办指导下,公安部门与阿里巴巴集团等互联网平台通过数据融合,上线“团圆”系统(公安部失踪儿童紧急发布平台),利用高科技和信息化手段以“互联网+打拐”的形式,在近年成功找回数千名失踪儿童。

在金融领域,在用户授权基础上通过数据融合提升金融服务广度和深度,也是大势所趋。近年来,作为数字信贷的一种创新模式——互联网联营贷款——在中国快速发展,互联网联营贷款可以视为我国典型的企业数据开放分享模式之一。

联营贷款/助贷模式是金融机构和互联网平台优势互补的有效分工合作。现有金融机构主要依托线下网点展业,其优势在于资金成本低、资金渠道多元化,同时拥有客户的强信用数据。但对于服务长尾客群有两大困难:一是难以有效触达客户或者触达成本高;二是风险评估、管理难,长尾客户由于缺少征信记录和抵押物,对金融机构的事前风险评估和事中风险管理构成很大挑战。金融科技平台的优势是能够较快、低成本触达用户,并能通过大数据来精准和动态地评价用户风险,但总体资本规模小、资金渠道缺乏,也严重制约了金融服务能力的发挥。通过联营贷款合作,商业银行通过互联网平台的多维度大数据的分享,拓展了获客渠道,降低了信息获取成本,提升了风控效率;互联网平台则为客户提供更好的消费体验,促进业务增长;消费者则获得了更好的消费体验、更低的信贷门槛和贷款利率。

五 数据开放分享的未来模式:分布式数据价值分享

数据开放分享对于各行各业数字化升级、降本增效,消费者福利增加,以及国家经济结构深刻转型均有重要意义,加强数据的开放分享是全球大趋势。与此同时,数据开放共享并不简单,需要有创新的解决方案,以化解面临的挑战,走出一条多方共赢的、可持续的数据开放分享道路。分布式+注重数据价值的分享模式,可能会成为未来主流模式。

一、数据开放分享面临的挑战

第一重挑战是数据分享方会面临合规、舆情等风险,“不敢分享”。直接传输和分享原始数据的方式,容易造成个人信息泄露和滥用,如果第三方产生侵犯个人隐私、数据泄露等事件,数据分享方同样会被认为难辞其咎。比如,剑桥分析数据泄露事件中,剑桥分析公司(Cambridge Analytica)为了吸引更多的人参与,他们还为用户提供5美元的奖金,用户只需回答一些无关紧要的测试问题,就可以获得奖金,而前提是将部分Facebook 信息授权给这个第三方程序。在这个事件中,Facebook“被动”分享了用户信息,但其因为对第三方程序的风险把关不严,依然负有不可推卸的责任。

第二重挑战是数据分享方的财产性权益难以有效保障,“不愿分享”。数据作为一种虚拟资产,具有复制成本低的特征。直接传输和分享原始数据的方式,无法对分享出去的数据进行有效的管控和保护,可能被复制和滥用,不仅损害数据分享方的商业利益,甚至导致数据安全隐患。在缺乏机构互信的情况下,数据可复制性进一步阻碍了数据的跨机构联合应用。

二、“分布式数据价值分享”是未来数据开放分享的核心特征

少部分人士提出,可以采用集中式、大一统的数据管理和强制性的数据开放模式,但该方案无法解决安全、激励和创新问题,可能难以持续。以大数据时代的数据量级,所有数据集中存储和调用的成本极高,且极易产生数据安全漏洞和个人隐私保护漏洞。更为重要的是,数据不是自然存在的,而是生产出来的。数据是相关主体投入存储、算法、算力、技术人员等“生产”出来的,是从非结构信息中记录、清理、整合、提炼、加工出来的。原始大数据的收集、数据处理技术的引入和研发,个人信息保护和数据安全合规成本的投入,以及相关设备购置等,均需投入巨大的成本。如果不尊重和保护数据生产者的财产权益,会降低机构进行数据生产和积累的积极性。

最高人民法院也对数据生产者的财产权益表示了认可,在《最高人民法院关于支持和保障深圳建设中国特色社会主义先行示范区的意见》《最高人民法院关于人民法院为北京市国家服务业扩大开放综合示范区、中国(北京)自由贸易试验区建设提供司法服务和保障的意见》均明确指出,“依法保护数据要素市场主体以合法收集和自身生成数据为基础开发的数据产品的财产性权益”,这也已成为司法实践中遵循的原则。

目前,主流观点认为,对于数据开放分享,还是应该坚持市场机制在资源配置中的决定性作用。只有尊重和保护市场机构的权益,才能激励市场机构去进行数据的生产、积累和向业务价值的转化。相比于“大一统”,“分布式”分享符合市场化原则,“分布式”会成为未来数据开放分享模式的核心特征之一。

注重数据价值而不是数据本身的分享,是未来数据开放分享模式的第二个核心特征。对于数据要素市场的构建,把原始数据拿出来交易只是其中一种方式。数据作为企业的生产要素、国家的战略资源和个体的数字人格,承载着多元利益,将数据简单化视为一般商品拿来交易的思路,没能洞见数据利益的多元性。过去的实践也证明,这种模式并不成功,而且引发了一些问题。中国互联网金融协会发布的《金融业数据要素融合应用研究》指出,“数据要素融合是指在数据要素化背景下,对单一或多个数据源的数据进行关联、组合等操作,从而获得更好的数据处理效果。传统的公开数据搜集、原始数据共享等融合方式存在一定局限性”。

数据价值的流通是数据流通的核,把握住这一点,我们将会看到很多新的解决思路。通过搭建数据价值的互联互通网络,在确保数据安全可控和隐私保护的同时,实现数据的“可用不可见”“定量定向使用”,从而构建出一个分布式数据价值流通体系,这或是我国数据要素市场建设的未来方向。

中国人民银行于2021年2月发布的《金融业数据能力建设指引》提出,“建立数据规范共享机制,在保障原始数据可用不可见的前提下规范开展数据共享与融合应用,保证跨行业、跨机构的数据使用合规、范围可控,有效保护数据隐私安全,确保数据所有权不因共享应用而发生让渡”。这正是“分布式数据价值分享”模式的具象表述。

近年来,快速发展起来的隐私计算技术(多方安全计算、联邦学习、数据可证去标识化等)已成为分布式数据价值分享体系的技术底座(关于隐私计算的技术体系和应用,将在第六章详细展开)。《积极培育壮大数据产业(人民要论)》指出,数据的“价值释放模式不断创新。随着数据要素市场快速壮大,数据要素价值实现手段持续丰富完善。流通技术方面,数据沙箱、联邦学习、多方安全计算等创新技术,能够在原始数据不泄露的前提下实现合法合规的数据开放,帮助多个机构在满足用户隐私、数据安全和法规要求的同时,进行数据使用和机器学习建模”。中国互联网金融协会发布的《金融业数据要素融合应用研究》也强调,“运用多方计算(业界亦称多方安全计算或安全多方计算)、联邦学习等技术,推动金融业数据要素在确保安全合规前提下实现融合应用创新,在促进金融业数字化转型、增强数字普惠金融水平、落实金融消费者保护要求、提升金融穿透式监管效能等方面具有重要意义。”历史总是在不断解决问题的过程中进步,而技术创新正是为解决问题而生,相信在技术创新的加持下,分布式数据价值分享体系指日可待。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询