睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

公共数据治理不仅仅是技术问题,更重要的是价值判断,不仅是对“公共数据”的治理,更是“公共的”数据治理。

时间:2024-01-31来源:互联网浏览数:125

摘 要:公共数据治理不仅仅是技术问题,更重要的是价值判断,不仅是对“公共数据”的治理,更是“公共的”数据治理。将公共治理理论引入公共数据治理研究,对公共数据治理的范围和目标进行了探讨和深化,认为公共数据治理是以实现公共价值为最终目标,将公共数据视为重要的公共资源,由政府、企业和公民等各个利益相关方共同对公共数据相关事务进行决策和行使权力的行为。在此基础上,面向公共价值实现的目标,梳理和构建了公共数据治理的基本内容框架,包括价值层、利用层、数据层、制度层和环境层五个层面。最后,基于以上视角,对公共数据治理的未来研究方向提出了建议。

关键词:公共数据;数据治理;公共价值


一、引言

当前,数据已成为一种新型生产要素,其中有大量基础性关键性的公共数据储存在各级政府部门中,公共数据的重要性日益凸显,对公共数据进行有效利用和治理的必要性也成为各方共识。《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》要求研究建立公共数据开放和数据资源有效流动的制度规范,《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》《国务院关于加强数字政府建设的指导意见》等文件都提出要加快推进跨部门数据资源共享共用,推动公共数据资源开放,改进公共数据采集、整合、分析、利用。《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》也提出要建立公共数据分类分级确权授权制度等要求。随着国家数据局的组建,将把数据资源整合共享和开发利用方面的有关职责相对集中,负责协同推进数据基础制度建设。


公共数据共享、开放和利用的基础是数据治理。随着公共部门的数据量呈指数级增长,数据类型不断增加,数据治理的复杂性和成本也急剧上升。公共数据治理不是一个单纯的技术问题,而是兼具政策、管理和技术等多重属性,与国家治理体系和治理能力的现代化密切相关。目前,我国公共数据治理体系和治理能力正在逐步建立和完善的过程中,公共数据治理水平总体上尚处于起步阶段,仍面临诸多问题和挑战。

当前,学界对于公共数据治理的研究更多是将企业数据治理的理论和实践引入公共数据治理领域,更多关注“管理”而不是“治理”的视角,也更多着力于“技术判断”而非“价值判断”。因此,亟需面向公共价值实现的目标,对公共数据治理的目标、定位和内容框架进行梳理和探究。


下文试图从跨学科视角出发,在回顾国内外公共数据治理相关研究基础上,重点对数据治理的概念进行溯源和总结,然后将公共治理理论引入对公共数据治理的研究,对公共数据治理的范围和目标进行探讨和深化,并在此基础上面向公共价值实现的目标,梳理和构建公共数据治理的内容框架,对公共数据治理的未来研究方向提出建议。


二、研究方法

首先需要说明的是,学界多认为信息和数据两个概念并不等同,数据更强调形式,信息更强调内容;数据包括有意义和无意义的,而信息是有意义的。但在实践中,信息和数据的概念经常混用,数据治理也是广义的信息治理计划的一部分,因此,本文采纳多数学者(如Weber、Pierce、Brous等)的做法,在讨论数据治理问题时不对信息和数据的概念进行严格区分。

对于英文文献,本文采用被广泛认可的华盛顿大学数字政府参考图书馆(DGRL)2022年12月发布的18.5版,共包含数字治理领域17987篇经过同行评审的文献。检索标题、关键词和摘要中同时包含“data”和“governance”以及同时包含“data”和“management”的文献,共得到文献226篇,时间跨度从2007年至2022年。对于中文文献,在“中国知网”中进行检索,检索范围为CSSCI来源期刊,检索条件为文献的标题、关键词或摘要中同时包含“数据”和“治理”或同时包含“数据”和“管理”,并且在文献摘要中提及“公共”或“政府”,共得到文献356篇,时间跨度为2008年至2022年。

对上述文献进行进一步筛选,筛选标准为将公共数据治理或政府数据资源管理作为核心研究对象或作为核心发现之一的论文,经过上述步骤后共筛选出英文文献28篇,中文文献59篇。

另外,美国、澳大利亚、新西兰等国的政府部门,以及IBM、Gartner、Oracle、SAP等企业和数据治理研究所(DGI)、数据管理协会(DAMA)、能力成熟度研究所(CMMI)等研究机构,也对数据治理相关问题开展过理论研究和实践探索,因此本文也参考和梳理了上述机构发布的成果。


三、数据治理:从管好“水管”到治好“水”

数据治理的概念最早起源于企业的治理实践。回顾企业治理、IT治理和数据治理的发展演变过程,有助于我们更好地理解数据治理这一概念的起源。


(一)IT治理:管好“水管”

现代大型企业一般采用所有权与控制权分离的“委托-代理”模式。在该模式下,委托人和代理人之间存在信息不对称和目标不一致的问题,每一个层级的组织成员都有其私有信息(private information)。随着等级链条的延长,私有信息更加分散,信息不对称状况更加恶化。

自20世纪80年代以来,随着IT在企业管理中的广泛应用,催生出了IT治理的概念。IT治理是企业治理的一个子集,与企业治理的目标一样,也是为了应对IT系统所有权和控制权分离带来的问题。IT治理侧重于提高IT效率,通过遵循经过验证的软件开发方法和最佳实践,将IT工作与组织的业务目标保持一致。IT治理是一个由关系和过程构成的体制,主要通过平衡IT过程的风险和回报,增加企业价值,实现企业目标。

然而,IT治理的关注点还主要集中在IT系统的软硬件设施上,强调对“水管”“水泵”和“储水罐”的管理,而水管中的“水”——数据,更像是一个附属品,还没有受到足够的重视。


(二)数据治理:治好“管道”中的“水”

自20世纪90年代以来,人们对组织资产管理的关注点逐步从有形资产扩展到了数据等无形资产。数据质量是发挥数据价值的关键,早期的数据质量管理主要以提高数据的准确性为出发点,而随着人们认识的深入,数据准确性不再是数据质量管理的唯一目标。ISO9000将质量定义为“一组固有特性满足要求的程度”,而数据质量就是数据使用的适用性。数据质量管理的目的是测量、评估、改进和确保数据的适用性,主要包括数据资产的规划、控制和配置等内容。


企业数据管理的责任最初也由IT治理团队承担,但是IT资产和数据资产之间既有相关性又有区别[17]。IT资产是指用于支持那些具有明确定义的任务的自动化技术,包括计算机、通信设备和数据库;而数据资产是对具有显在或潜在价值的事实的客观记录。IT就像水管、水泵和储水罐,而数据就是水管中的水,对水管、水泵和储水罐的管理可以由IT治理团队来负责,但是管道中的水则需要一个跨部门团队来管理,需要管理层代表、业务专家和数据管理员的参与,需要有专门的组织机构、专注领域及概念框架,而IT治理并未完全涵盖数据治理的很多内容。


与很多新兴领域一样,数据治理并没有统一的定义,学者、企业和行业组织都从各自角度对数据治理的概念进行了阐述。较多学者认为,数据治理的核心在于组织的数据相关事务中的决策权及相关职责的分配[20]。Otto总结多位学者的观点后认为,数据治理是对数据资产管理的决策权力和责任所组成的整体。Sonia认为,数据治理是一个由决策权、责任和流程组成的系统,旨在确保对组织的重要数据资产进行正式和一致的管理,DAMA认为数据治理不仅仅是一种规范性框架,还是一个可以被实践的职能模块。


对于数据治理,中国学术界和实践界也存在不同的理解。中国国家标准《信息技术 大数据 术语》(GB/T 35295-2017)以及《数据管理能力成熟度评估模型》(GB/T 36073-2018)都认为,数据治理是“对数据进行处置、格式化和规范化的过程”,而《信息技术服务 治理 第5部分:数据治理规范》(GB/T 34960.5-2018)则认为数据治理是“数据资源及其应用过程中相关管控活动、绩效和风险管理的集合”。虽然以上这些关于数据治理的概念在表述上的侧重点存在一定差异,但其核心内容仍具有一定的相似性。


许多研究还梳理和辨析了“数据治理”和“数据管理”这两个概念之间的区别。虽然部分数据管理研究机构(如DAMA、CMMI)倾向于用“数据管理”来统领数据相关流程,而将数据治理作为流程的一个核心环节,但学界更倾向于认为数据治理是统领整个数据相关工作的“大脑”。数据治理负责决策,数据管理负责执行和反馈,前者对后者负有统领职能,数据治理是对数据管理的管理。管理是做出的决策,治理是做出决策的架构。数据治理规定了在数据管理中需要做出哪些决策以及由谁做出这些决策,而数据管理确保这些决策能够做出并且能够付诸行动。数据治理可以被理解为“数据管理的政策和方法”,确定了数据访问、管理和授权的广泛政策,确定管理所需的方法和程序,并确定使用数据的人员资格和授予数据访问权限的条件。数据管理是一套用于确保数据能够支持利益相关方信息需求的IT程序和技术,而数据治理的核心是所有权、责任、流程、计划和绩效管理,而不是技术。数据治理是一个新的混合质量控制规程,包括数据质量、数据管理、业务流程改进以及合规性和风险管理等要素。


四、公共治理:治谁的水?为谁而治?由谁来治?

与企业数据不同,公共数据治理具有“公共性”特征,不仅仅是一个如何做的技术判断问题,更是一个为什么做的价值判断问题,还需引入公共治理相关的理论和实践,探讨公共数据治理治谁的水,为谁而治和由谁来治等问题。

治理(governance)一词源于拉丁文和古希腊语,原意是控制、引导和操纵。长期以来,治理一词在政治与公共行政领域的含义与“统治”相似。自20世纪90年代以来,消费者、纳税人、公民的需求日益增加和复杂化,加之信息通信技术的发展,使社会呈现出前所未有的多样性与复杂性。此时,政治学家和管理学家“既看到了市场的失效,又看到了国家的失效”,公共治理理论开始出现并被普遍接受,内容包括公共行政体系的转型以及国家的重构。

“治理”的定义有诸多版本,例如罗茨的六种形态和七种定义、赫斯特的五个版本、斯托克的五个论点等等。这些定义并非自相冲突和排斥的,如果把这些概念整合起来,就会形成一个或一套相对比较严密的概念。治理是各种公共或私有的个人和机构管理其共同事务的诸多方式的总和,治理不再依赖政府的权力或强制,而是多元治理的互动,以及行动者的互相影响。治理的本质是各个利益相关方之间的合作,是一个由聚焦正式政治领域和公共部门的结构转向不断增加的私人部门和市民社会的参与并将他们的利益融入的过程,治理意味着国家与社会、市场以新的方式互动,以应对日益增长的社会及其政策议题的复杂性、多样性和动态性。在公共治理理论的影响下,国家与社会关系出现了重构,政府之外的力量被更多受到重视,政府的中心地位在一定程度上被政府、社会和市场的新组合所替代。


公共治理理论的兴起也带来了一种效率与价值兼顾的可能,从“西蒙-沃尔多之争”到新公共管理和新公共行政,工具理性和价值理性的张力一直贯穿于20世纪后半叶的公共管理理论与实践之中,而公共治理理论既强调以各种工具实现对效率的追求,更强调价值理性和公共利益。公共治理理论中的多中心、多方参与、分权化的主张,既与治理的效率追求有关,又更多体现了治理的价值追求,以制度的创新开创一种参与的新传统,进而实现公共价值。

引入公共治理理论,面向公共价值实现的目标,公共数据治理就不仅仅是对“公共数据”的治理,更是“公共的”数据治理,由此进一步对公共数据治理的范围和目标进行探讨和深化。


(一)公共数据治理的范围:治谁的水?

公共数据是重要的公共资源,然而,目前学界和实践界对于“公共数据”的范围还没有公认的定义。过去,具有公共价值的数据资源仅掌握在政府手中,随着信息通信技术与经济社会的发展,越来越多的民间组织、私人企业等都具备了采集了和利用公共数据的能力,并在社会生活中逐渐承担了部分公共服务职能,在医疗、交通、通信、教育等社会生产生活各个领域都产生了大量具有价值的数据。胡凌指出,公共数据在概念上包括三个层次:一是政府或具有准公共职能的机构在行使有明确授权的公共职能过程中自行获取的数据;二是政府部门委托授权特定私营部门或个体行使特定公共职能过程中收集的数据;三是在具有公共属性的领域或空间中,并非通过政府授权职责产生的但涉及公共利益的数据。国有和私营企业受政府委托、得到公共财政支持所创建的数据,以及掌握在这些企业手中但具有重大公共利益的数据也属于公共数据。因此,政府数据并非公共数据的全部,公共数据涉及的主体更多元、客体更多样。

目前,在我国国家层面的立法实践中,《数据安全法》未对公共数据进行明确界定;《电子商务法》《网络安全法》等法律虽然提到了公共数据,但也没有对其内涵进行界定。我国多地的地方性法规对公共数据进行了定义。这些定义可以分为两类:以上海和浙江为代表的地方立法将公共数据界定为各级行政机关以及履行公共管理和服务职能的事业单位在依法履职过程中,采集和产生的各类数据资源;而以山东和深圳为代表的地方立法则扩大了公共数据的范围,将具有公共服务职能、提供公共服务的企业也纳入其中。前者与政府数据界定的范围近似,而后者界定的范围更大,涉及的主体更为多元,也更有利于增进公共利益,实现公共价值。


(二)公共数据治理的目标:为何而治?由谁来治?

随着越来越多的公共企事业单位和社会组织掌握了大量公共数据,“治理”概念中的多元、参与、互动、协商等特征也应在公共数据治理中得到体现。从表面上看,公共数据治理表现为对公共数据资源进行管理和利用的过程,而从深层次看,公共数据治理是回应社会需求、优化公共产品供给、提高公共治理能力的公共价值创造过程。

公共数据治理与政府数据治理的权威来源和基础也并不相同,政府数据资源管理的权威来自部门领导和上级机关,而公共数据治理的权威来源则更为广泛,可包括公共部门、私营部门、社会组织或上述各方的合作。政府数据管理权威的基础主要依靠法律法规和政策,而公共数据治理除了需要法律、法规和政策的保障,还强调各方的认同和共识。从权力运行的向度来看,政府数据资源管理的权力运行方向是自上而下的,而公共数据治理的权力运行方向是多方的、互动的、网络化的。从作用的对象来看,政府数据资源管理的对象仅限于政府部门自身掌握的数据,而公共数据治理的对象则宽泛得多,涵盖了企业等社会主体拥有的公共数据。

因此,公共数据治理不能完全照搬私人部门的做法,对于公共数据治理的绩效评估,也不能像企业数据治理一样仅从财务上的成本收益来进行考察,应体现善治原则,包括问责性、连贯性、有效性、开放性、参与性和透明性。需要避免管理主义倾向,即对3E(经济、效率和效益)的片面追求和对政治价值的忽略,最大限度地协调各利益相关方的诉求,从而增加社会对公共数据治理的共识和认同。正如新公共服务理论所指出的,“公民不只是顾客,他们是所有者或主人”。

综上所述,公共数据治理是以实现公共价值为最终目标,将公共数据视为重要的公共资源,由政府、企业和公民等各个利益相关方共同对公共数据相关事务进行决策和行使权力的行为。


五、公共数据治理的内容框架

从内容框架来看,公共数据治理是一项跨边界的合作,受到多方面因素的影响,包括技术障碍,社会、组织和经济障碍,法律和政策障碍,社会背景与情境等。夏义堃提出了公共部门数据治理的体系结构,其战略层面为领导与愿景,战术层面包括执行能力和管理规范,实施层面包括数据架构、执行基础设施和数据价值周期。郑跃平等从制度、管理、技术和数据四个维度出发构建了政府数据治理的评估指标体系。

基于公共治理理论,面向公共价值实现的目标,梳理和构建了一个公共数据治理的内容框架,包括价值层、利用层、制度层、数据层和环境层五个层面(参见图1)。


(一)价值层

公共数据治理的目标是公共价值的实现,包括经济价值、社会价值、政治价值等。公共价值是公民期望的集合,但集体偏好的达成并不是通过个人偏好的加总,而需要在基于主体间的审慎协商与复杂互动的过程中达成。公共数据治理可能产生的价值包括:优化决策,提高效率,优化服务,促进合作,降低风险[49],提升信任等。

失败的公共数据治理除了可能造成经济损失,还可能带来治理合法性的危机[51]。例如,近年来公共数据安全与隐私保护等问题日益突出,这些问题也可能造成政府合法性危机。尽管企业数据治理也强调合规(compliance)的重要性,但这与公共行政领域的合法性(legitimacy,或译为正当性)是两个概念。合乎法律的未必具有合法性,合法性是指社会秩序和权威被自觉认可和服从的性质和状态。行政体系的稳定运行需要有效性与合法性的兼顾和互相促进,公共数据治理的推进也需要同时考虑公共数据的保值增值与获得社会认可两个方面。


(二)利用层

价值层是公共数据治理的收益(outcome),而公共数据治理的利用层则是产出(output),产出是收益的基础和前提。公共数据治理的产出方式包括数据分析、数据共享、数据开放等多种形式。对公共数据进行跟踪、监测、收集、分析、挖掘、评估并提供对内和对外的数据服务具有巨大的潜力,数据已成为推动公共服务价值创造机制创新的重要力量。数据共享是公共数据治理的重要内容,能够提高公共数据的利用效率,推动部门间业务协同,打造整体性政府。此外,公共数据的利用主体不能仅限于政府体系自身,还应向社会开放公共数据,让更多主体进行增值开发和创新应用,以赋能经济增长和社会发展,促进公众参与和公共价值共创。


(三)数据层

公众往往以为公共部门有足够的能力处理数据,然而由于数据治理的薄弱,情况并非总是如此。数据治理需要基于数据的全生命周期进行的一系列持续的管理活动,关于数据生命周期的治理活动在将数据原则运用到IT基础设施的过程中起着关键作用。Weber等认为,数据治理涵盖数据质量、数据管理、元数据管理、访问权限、决策权限、问责制和数据策略等方面。

具有公共价值的数据资源并非仅仅掌握在政府部门手中,还分散在承担公共管理和服务职能的其他组织手中,要最大限度地发掘数据的公共价值,不能只对政府自身掌握的数据进行治理,还应把治理对象尽可能扩展到与公共利益相关的、来源主体更为全面多元的公共数据。同时,公共数据治理还应面向增进公共价值的目标,保护各利益相关方的合法权益,防止算法歧视、算法杀熟、算法滥用等技术风险,防止技术中心主义或“技术霸权”。


(四)制度层

公共数据治理的制度层可分为规则政策和组织管理两个层面。首先,公共数据治理需要国家法律、法规和政策等基础制度的引导和保障,以确保实现公共价值的方向,近年来我国数据基础制度的建设日益受到重视,“数据二十条”的出台即体现了这一方向。如果技术上的投入不断增加而制度变革缓慢,将难以逃脱管理主义和技术治理的路径依赖,在工具理性和价值理性之间出现失衡,并使投入的边际效益递减,产生“内卷化”问题。此外,公共数据治理还需要公共部门建立与数据治理相适应的组织管理机制,包括战略、组织、领导、沟通、激励、监督、评估等。

与企业数据治理相比,公共数据治理的利益相关方更加广泛、更加复杂,且相互依赖性更加明显。公共数据治理的主体也涉及诸多利益相关方,公共数据治理一个常见的局限性是“把参与局限于数据本身,以及有限的技术专家和数据机构”,在公共数据治理的生态系统中,最薄弱的环节是缺乏将公民反馈引入政策过程的有效机制。公共数据治理不仅是技术官僚、系统开发人员和IT规划者的责任,重要的是要尊重这些政策的多元理性特征,这需要广泛的参与,从而实现各利益相关方的共治与共享。

在公共数据治理中,政府除了对数据本身的责任之外,还承担着宪法法律、共同体价值观、政治规范、职业标准以及公民利益等方面的责任。公民在参与公共数据治理的过程中得到了对资源和决策的更大控制,也为此贡献了时间、专业知识和努力,承担了更多的责任和风险。然而,尽管责任有所分散,但政府仍需要公共数据负责。这无疑对公共数据治理的制度规则和组织管理等方面带来新的挑战。


(五)环境层

环境是公共数据治理和价值实现的基础。公共数据治理要与特定的政治、经济、技术和文化环境相匹配,不存在唯一正确答案,“一个尺码并不适用于所有此情境”(One size does not fit all)。在某个环境中表现极佳的数据治理体系,在另一个环境却可能遭遇失败。原因在于技术受到了组织安排、政治安排和社会安排的中介性影响,并在上述安排中被感知、理解、设计和使用。因此,公共数据治理的在地化(localization)并非权宜之计而是根本的,因为知识是人们创造性参与并且正在形成中的东西,而不是某种既定的、普适的东西,所有知识本质上都是地方性知识。同时,公共数据治理的价值层和利用层也会对环境层形成反馈,例如,公共数据开放的长期效果就包括给经济、社会、环境带来的远期影响。


六、总结与展望

面向公共价值实现的目标,公共数据治理不仅是对公共数据的治理,更是“公共的”数据治理,不仅仅是技术判断的问题,更在于对价值的判断。本文将公共治理理论引入公共数据治理研究,对公共数据治理的范围和目标进行了探讨与深化,并进一步对公共数据治理的内容框架进行了梳理和阐述,从而在价值层、利用层、数据层、制度层和环境层五个层面体现公共数据治理的公共性。

基于公共价值实现的视角,建议学界未来可对公共数据治理的以下问题进行深入探究:公共数据治理中政府、企业与社会等主要利益相关方之间的互动与协作方式及其对公共价值实现的影响;公共数据治理的公共价值创造机理和过程;公共数据治理中的技术“内卷”与价值“落空”困境及其生成机制等。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询