睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

数据治理的研究现状及未来展望

时间:2021-12-24来源:互联网浏览数:975

数据作为人工智能和大数据的核心要素,将对人类社会发展带来深刻影响。随着数据容量的快速积累、数据质量和运算能力的不断提高,如何使用和管理数据成为第四次工业革命带给人类社会的一个重要命题。

数据治理有两种含义,分别是对数据的治理和利用数据治理。这二者相互联系,但并不冲突。从数据本身治理看,数据是一种新的经济增长驱动因素,数据法需要重新审视数据相关知识产权和法律法规问题。

一、引言
无论是在公共部门还是私营部门,数据的使用和管理,已经逐渐成为一个真实的应用场景。在概念讨论的理论范畴,不同的社会科学领域围绕数据治理相关问题已经开展了一系列研究,但是相关概念、理论和政策的系统梳理依然比较缺乏。在数字经济时代,数据为公共管理、科学研究、商业活动带来了效率的改善和质量的提升,海量的数据被视为21世纪关键的资源之一。

在公共管理方面,地方政府与企业密切合作,在“最多跑一次”“政务APP”“城市大脑”等项目上频频发力,建立数据中心、大数据局,开放数据资源打破信息孤岛,利用新兴技术对公共服务进行优化和提升。在科学研究领域,开放科学、开放获取,逐渐成为科学共同体的共识,通过构建以数据为中心的开放科学,促进科研变革。在商业领域,通过积累海量的个人用户数据,数据的价值得到日益彰显,互联网巨头围绕数据的竞争也越来越白热化。

数据正在成为一种高度关注的社会资源,并逐渐成为一个新兴的研究对象,如何有效地管理和使用这些数据资源成为一个挑战,甚至暴露出数据管理和使用方面的很多问题。这需要从数据获取、利用和保护等各个角度,以及法律、制度和政策等不同层面对数据治理问题进行系统深入的研究,以指导其治理实践。

由于数据治理问题的复杂性,不仅要在数据管理和使用的实践中探索,更要加强数据治理的理论研究。然而,与目前数据治理问题受到社会高度关注相比,当前学界对于数据治理的研究仍然滞后,而实践中暴露的问题对于理论研究正不断提出更高的要求。

尽管信息科学、情报学等对如何管理各种数据已经有了很多研究成果,但是学界对数据治理的理论认识还有待进一步深入,与数据治理相关的重大理论问题还需要进一步探讨。数据的本质是什么?应该如何认识数据?什么是数据治理?目前国内外文献对于数据治理的研究处于怎样的状态?主要关注哪些焦点问题?国际上数据治理研究能够为我国构建面向未来的数据治理体系提供哪些借鉴和启发?这些问题值得深入探讨。

本文主要基于相关文献,从历史、经济、法律等维度对已有的数据治理研究文献进行梳理和归纳,展现国内外数据治理研究前沿概况,并对未来的研究进行展望,丰富本领域的理论研究成果。

二、数据的历史、概念和意义
人类利用数据的历史非常悠久,最早可以追溯到数字发明时期,不同文明均掌握了利用数字记录和管理生产生活的能力。19世纪初,博物学家在私人的资助下环游世界搜集动植物标本,并对天文现象进行观测,开始规模化地记录数据,从纷繁复杂的事实中归纳出开普勒定律等很多重要的科学发现。尽管当时的数据量已经相当庞大,但数据的重要性仅由少数专业人士决定,还不能视作一种社会资源。数据真正被社会关注、被规范和监管的时候,才真正被制度化为社会资源。

欧洲的霍乱疫情使得人们开始统计搜集疾病传播的数据,并发明了可视化的技术和数据分析方法。1887年德国帝国技术物理研究所成立,负责全社会需要的数据,成为第一个真正意义的标准局。进入20世纪之后,贸易的需求促进了测量和计算方法发展,统计学成为一门独立的学科以应对数据分析的需求。而20世纪40年代后大量的军事投入带来计算科学的进步以及数据传输技术的发展。近年来,少数的几家互联网公司脸书(Facebook)、微信、亚马逊创建并管理数十亿人在网络上的工作、娱乐、购物数据。

纵观人类利用数据的历史,虽然数据的本质没有变化,但是在制度、技术和经济发展的交织作用下,数据完成了从数字到资产的转变,在这个过程中数据的规模、价值和影响不断扩大。

我们今天所谈论的数据是信息化和人工智能时代的海量数据资源。进行数据治理的第一步是重新定义数据,对于大数据的概念一般是从容量(Volume)、速度(Velocity)、种类(Variety)、准确性(Veracity)、价值(Value)等5V角度进行界定。全球性、全方位、易于获得的数据资源,是大数据成为人工智能系统输入信息的前提。

数据作为一种经济资源和生产要素,是人工智能等新兴技术发展的动力,没有海量的数据积累和应用场景,人工智能很难冲破瓶颈快速发展。数据为人类社会带来机遇的同时也带来了风险,围绕数据产权、数据安全和隐私保护的问题也日益突出,并催生了一个全新的命题——数据治理。

数据治理的概念具有两种含义,分别是对数据的治理和利用数据进行的治理。一种是以数据为治理对象的治理活动,如GDPR,数据隐私保护条例等;另一种是利用数据进行治理的活动,例如电子政务服务、一站式政府服务。数据治理的两个含义相互联系,但并不冲突,本研究中的数据治理更侧重于对数据本身的治理。

数据治理是价值和风险二者之间的权衡,治理的目的在于充分发掘数据的价值,同时尽量减少相关的成本和风险。数据治理在宏观层面包括国际、国家和部门的法律、政策和条例,在中观组织层面包括数据管理规章、数据价值测量、数据风险权衡等,在微观层次关注日常数据、依靠数据处理的信息和专业人士等。

三、数据对于经济的影响
经济学相关的文献深入探讨了数字转型和数字经济的重要意义,从宏观、中观和微观3个层次分析了数据对于经济发展的重要意义。从宏观经济发展角度,经济发展和增长理论长期关注商品、服务、思想和人口跨界流动的影响和结果,而当前数据流动是最显着的跨界流动形式。随着数据生产设备的激增,以及数据存储和处理能力的拓展,21世纪的大数据被誉为“神奇的金矿”,创新经济转型和促进循环发展的“核心资源”。

在数据时代,世界经济发展关注的命题已经从集装箱货运逐渐转向数据的跨界,乃至跨国流动,数据成为一种新的经济增长的驱动因素。数据流动中流入和流出数量多少的不平衡,以及数据质量高低的不平衡,造成了地区和国家间经济发展上新的不平衡。

既然数据与传统经济驱动要素很不相同,这种差异会影响经济学基本的分析变量和框架吗?韦伯(Weber)的回答是否定的,尽管数据与传统的经济增长要素存在很大差异,但是原有的经济增长理论并不过时。

首先,数据资源如同早期的石油资源一样,一旦具备了产生、收集和利用的基础设施,数据的成本就会变得非常低廉。其次,与传统资源相比,原始数据可以无限地免费复制,因此数据的实际价值具有无限潜力,但是数据要体现价值依然需要知识产权的保护。最后,数据到处都是,但是数据利用的挑战来自于如何收集数据和如何使用数据,而这几乎和传统自然资源的开发完全一样。

在中观产业经济层面,信息资产将会带来经济效益,“数据应该被记录为一种具有价值及潜在价值的物品”。数据的价值已经被当今的商业活动所证实,顶尖的数据驱动型公司如苹果、谷歌和微软,将搜集的数据转换为价值,创造的净利润是传统石油天然气公司的两倍以上,拥有数据的公司成为了现在获益最多的公司。数据驱动型公司的成功在于积聚海量的用户和用户数据,网络效应对用户产生了粘滞效应,带来高昂的转换成本。

在微观的企业组织层面,数据如何创造价值?某种程度上,数据被视作智慧的一种形态。罗莱伊(Rowley)在此基础上建立了一种从数据到智慧的等级概念,包括数据、信息、知识和智慧4个渐进的层次。

数据是原始的事实和符号,是整个层级结构的基础;信息是具体语境中的数据,具体回答地点、时间、人物和事件等问题;知识是信息的集合同时结合了主观的理解和能力;而智慧位于层级的顶端,通过积累知识获得直觉和理解。

在整个层级中,高层级的形态以低层级的形态为基础,整体构成了从数据到智慧的解释模型。海量的数据积累是一种颠覆性的创新,需要企业促进数据流动,并将数据整合进原有的商业流程。数据带来了从信息技术到商业模式的范式转变,推动了企业从传统要素驱动型向数据驱动型企业转变。
(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询