睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

公共数据开放与授权运营:赋能数字经济的双轨策略与目的探讨

时间:2024-05-07来源:差一点成熟浏览数:3

1.引言

公共数据开发利用是推进数据要素市场化配置改革的重要内容,而提高公共数据资源的供给水平是促进公共数据开发利用的起点。2023年国家数据局等部门印发的《“数据要素×”三年行动计划( 2024—2026年)》,要求“加大公共数据资源供给”。目前,公共数据资源供给主要包括数据共享、开放和授权运营等方式。其中,数据共享主要是指公共数据在政府职能部门和公共管理及服务机构之间进行跨层级、跨部门和跨地域的流转。然而,公共数据仅在政府体系内部进行共享,其所能释放的价值是局部和有限的,只有使其能在市场和社会上得到充分供给和高效利用,才能最大程度地释放出其价值红利,全面赋能数字经济和数字社会发展。本文将基于2023年7月以来在上海、浙江、山东、福建、贵州等地进行的调研和讨论,对公共数据资源供给的路径和目的进行一些初步探讨。

2.公共数据资源的供给路径:开放还是运营?

2.1.“公道”待客---公共数据开放

公共数据开放这种数据供给方式是指公共部门向社会公开、公平、无偿地提供具有原始性的、可机读的公共数据,以供其进行再利用的行为。根据世界银行的定义,开放数据是指“能被任何人出于任何目的不受限制地进行自由利用、再利用和分发,并最大程度保持其原始出处和开放性的数据”。其中,“开放性”应具备两个维度的特性:一为技术性开放,即数据应为可机读、非专属性的电子格式,从而能被任何人通过通用、免费的软件获取和利用,数据还应被置于公共服务器上供公众获取,不设密码和防火墙;二为法律性开放,即这些数据应被置于公共领域,或处于自由利用条款下,受到最低程度的限制[1]。纽约大学Gov Lab实验室在对国际上具代表性的多个研究机构、评估指标、政府部门和咨询公司界定的“开放数据”定义进行梳理后发现,最多被强调的开放数据标准包括免费、公开提供、非排他性、可利用结构、开放授权和可再利用等要方面。

近年来,我国已出台多个重要文件对公共数据开放做出明确要求。2017年2月,中央全面深化改革领导小组第三十二次会议审议通过的《关于推进公共信息资源开放的若干意见》指出,要保证开放数据的“完整性、准确性、原始性、机器可读性、非歧视性、及时性,方便公众在线检索、获取和利用。” 2018年1月,中央网信办、发展改革委以及工业和信息化部联合印发《公共信息资源开放试点工作方案》要求试点地区“研究制定公共信息资源开放技术规范,明确开放数据的完整性、机器可读性、格式通用性等要求。” 2020年4月,《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》提出要“推进政府数据开放共享,研究建立促进公共数据开放和数据资源有效流动的制度规范”。2021年3月,《国民经济和社会发展第十四个五年规划和2035年远景目标纲要》要求“扩大基础公共信息数据安全有序开放,探索将公共数据服务纳入公共服务体系,构建统一的国家公共数据开放平台和开发利用端口,优先推动企业登记监管、卫生、交通、气象等高价值数据集向社会开放。”2022年12月,《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》提出“对各级党政机关、企事业单位依法履职或提供公共服务过程中产生的公共数据,加强汇聚共享和开放开发。”

本质上,向社会开放公共数据是政府提供的一种公共服务,是一种基础性均等化的公共数据供给方式。储存在政府后台的公共数据就像盛在茶壶里的茶水,如果政府部门只通过各种内部“通道”将公共数据提供给市场主体,就如同私下用茶壶给客人倒茶,不同客人喝到的茶可能会有浓有淡、有多有少,难免厚此薄彼。而如果先把茶倒进一个“公道杯”里,再将均匀过的茶汤公开公平地倒给客人,就能对每位客人做到一视同仁。公共数据开放平台就像这样一个“公道杯”,政府可以通过这个平台将公共数据公开、公平、普惠、无歧视地开放给各个市场和社会主体。

近年来,我国公共数据开放平台数量以及在这些平台上开放的数量集总量都增长迅速。根据开放数林指数发布的数据,截至2023年8月,我国地级以上公共数据开放平台的数量已从2017年的20个增加到2023年的226个(不含港澳台),其中省级平台26个,副省级与地级平台200个[2]。

在开放数据集总数上,2017年,全国各地方平台仅开放了8,000多个数据集,而到2023 年,这一数字已增长到34万多个,是7年前的41倍[2]。

然而,目前我国公共数据开放仍存在“供应不充分”“供需难匹配”“利用欠成效”等问题。首先,各地数据开放平台上已开放的数据集普遍存在数量少、质量差、颗粒度粗、更新不及时、内容碎片化等问题,高价值却又具有一定敏感性的数据很少开放出来,而已经开放出来的数据却往往利用价值不高,无法充分满足市场和社会主体对公共数据的需求。其次,公共数据供需对接不畅,供方不清楚需方要什么数据,需方也不了解供方有什么数据,公共数据开放平台的运营服务也大多缺乏专业性和稳定性,无法有效促成供需匹配,甚至随时可能“断供” 已开放的数据集。而且,许多已开放数据集未匹配必要的描述说明,缺少元数据和数据字典,可用性较低,难以被利用主体真正理解和有效利用。在以上这些因素的综合影响下,目前基于开放数据形成的应用成果也数量较少、质量欠佳。

综上所述,总体上目前我国公共数据的供给者和利用者之间尚未形成有实效、高质量、可持续的价值共创生态。主要原因在于,推进数据开放利用和供需对接都需要政府部门投入一定的财力人力精力,并对他们的运营服务能力提出了新的要求,但却并不会为他们带来直接的“收益”,反倒会让他们为可能由此带来的数据安全、个人信息保护和数据质量等方面的风险“背锅”担责。因此,对于这样让人既不“省心”也不“放心”、“成本收益”不成比例的工作,政府部门往往会抱着“多一事不如少一事”的态度,开放意愿不强、推进动力不足。

2.2.“温碗”赋能――公共数据授权运营

公共数据授权运营授权运营这种数据供给方式是指公共部门授权第三方对公共数据进行加工处理,将原始数据开发成数据产品和服务后再向社会提供的行为。《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》提出“开展政府数据授权运营试点,鼓励第三方深化对公共数据的挖掘利用。”《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(“数据二十条”)提出“鼓励公共数据在保护个人隐私和确保公共安全的前提下,按照‘原始数据不出域,数据可用不可见’的要求,以模型、核验等产品和服务等形式向社会提供。”2023年国家数据局等部门印发的《“数据要素×”三年行动计划( 2024—2026年)》要求“在重点领域、相关区域组织开展公共数据授权运营。”

授权运营好比古人使用“温碗”对酒进行加热保温的过程:先把热水倒入一个温碗,然后再将酒壶放入温碗,这样温碗里的热水会将热量“赋能”给壶中的酒,却并没有把热水本身倒出去,实现了“原始热水不出碗,热水可用不可得”。同理,政府可以通过运营主体――“温碗”,将蕴藏着热能的原始公共数据加工成产品和服务后再向市场和社会主体提供,在此过程中,虽然原始数据本身并没有直接开放出去,但数据的能量和价值却仍然实现了向外释放。对于承载个人信息和直接开放可能会影响公共安全的公共数据,采用授权运营这种供给方式有助于突破数据开放这种方式在数据安全、数据质量和供需匹配等方面遇到的“瓶颈”,将公共数据开发利用工作向纵深推进。

目前,我国已有多个地方开始探索公共数据授权运营。截至到2024年3月,我国已有五十多个地方正式出台了与公共数据授权运营相关的法规政策或发布了征求意见稿,并有多个地方建设了公共数据授权运营平台或在数据开放平台上开设了授权运营专区。

然而,本文在调研中也发现,授权运营虽被各界寄予厚望,但一些在数据开放过程中遇到的“老问题”在授权运营过程中也仍然存在。例如,授权运营这种形式虽然在一定程度上消减了数据提供部门的数据安全顾虑,但由于权责利不匹配、收支两条线等原因,许多部门仍然认为开展授权运营的“风险大于收益”,对推进公共数据授权运营的动力依旧不足。此外,数据质量问题在授权运营过程中也依然存在。即使有了专业的运营机构对数据进行提质治理,许多公共数据毕竟是政府部门在履行行政职能的过程中出于满足内部业务需要而采集和生成的,而并不是为了外部社会的复用需求而准备的,这些数据在颗粒度、时效性和丰富性等方面都不一定能充分、精准地满足市场主体的各种应用要求。

2.3.协同推进开放与运营

调研发现,数据开放和授权运营这两种公共数据供给方式各有其优势和不足。数据开放这种方式虽然在安全性、可用性和可持续性等方面面临挑战,但其具有的普惠、便捷、公平、门槛低、创新空间大等特点也不应被忽视,而授权运营这种方式虽具有精准、安全、优质、可持续等优势,却也在公平性、便利性和创新潜力上存在局限性。

具体而言,数据开放这种方式的受益面更大,过程更为公平透明,市场和社会主体获取数据的门槛和成本也相对更低;而通过授权运营这种方式获取数据的门槛和成本相对较高,不仅可能会降低数据获取的便利性,还可能会有损公共数据资源供给的公平性,最终造成只有国有企业或民营“大厂”才有权享用公共数据,而中小微型民营企业却只能望“数”兴叹的结果。

同时,数据开放这种直接提供原始数据的方式具有更大的包容性和创新空间,真正的创新往往不是被预先设计出来的,只有容忍一定程度的“不确定性”,才有可能收获预想不到的惊喜。而相较于原始数据,经过加工后的数据产品和服务在利用空间和创新潜力上相对受限,授权运营这种方式在提高了数据供给的安全性和“确定性”的同时,也降低了市场创新活动所必须的开放度和“容错度”。为了有效推进公共数据开发利用,我们既不能只关注市场对数据进行创新利用的活力,而忽视了政府供给数据的动力,也不能只强调提高政府供给数据的动力,却牺牲了市场利用数据的活力。

因此,数据开放和授权运营这两种公共数据供给方式各有其适用的数据类型和应用场景,需要协同推进,发挥各自所长,而不应相互取代或挤压空间。在扩大公共数据资源供给的过程中,可主要从安全性、公益性和成本收益等方面来综合考虑某类数据适合选择哪种数据供给方式,对于不承载个人信息和不影响公共安全的、主要依靠公共财政资金生成的、社会受益面较广的、又不需要再投入较高成本就可向社会直接提供的公共数据,应优先选择数据开放这种方式进行普惠供给,力求“应开尽开”;而对于承载个人信息和影响公共安全的、主要不是依靠公共财政资金生成的、受益面仅限于特定行业产业的、又需要投入较大成本对原始数据进行加工后才能向社会提供的公共数据(毕竟不能让所有纳税人为少部分数据利用主体买单),则可以探索授权运营这种方式来进行有偿供给。

在协同推进数据开放和授权运营的过程中,我们需要特别注意辨别以下两种情况:第一,要分清有些数据是应该开放却还没有开放,还是确实不适合开放?有些地方明明还没有把本可以开放的公共数据“应开尽开”,就宣称这些数据不适合开放,只能通过“授权运营”来提供了。第二,要辨别“安全”是不能开放数据的真实原因,还是只是一个借口?有些部门不愿开放某类数据的真实原因可能是出于保护局部利益,但由于这些理由不便明说,就把“安全”拿来作为不开放数据的“挡箭牌”,然后再借道授权运营来“暗渡陈仓”。对于以上这类开放还“不充分”或把“安全”作为不开放的借口等情况,仍然需要加大力度推进数据开放。

公共数据开放和授权运营这两种数据供给方式虽路径不同,却殊途同归,都是为了扩大公共数据资源供给,释放公共数据的价值。在协同推进这两种公共数据供给方式的过程中,我们需要平衡好公平、效率和安全之间的关系,既不能局限于数据开放这一种方式,也要防止对所有的公共数据,特别是明显不承载个人信息和不影响公共安全的公共数据,都只采用授权运营这一种方式来向社会提供,以“安全”之名将“不出域”“不可见”这种方式扩大化、极端化,这也会成造成一种事实上的“数据懒政”,不利于公共数据的普惠供给和数据经济的高效发展。

3.公共数据资源的供给目的:变现还是赋能?

《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》提出要“合理降低市场主体获取数据的门槛,增强数据要素共享性、普惠性,激励创新创业创造,强化反垄断和反不正当竞争,形成依法规范、共同参与、各取所需、共享红利的发展模式。”《“数据要素×”三年行动计划( 2024—2026年)》在基本原则部分也提出要“充分发挥市场机制作用,强化企业主体地位,推动数据资源有效配置。更好发挥政府作用,扩大公共数据资源供给,维护公平正义,营造良好发展环境。”

因此,在推进公共数据开发利用的过程中,我们亟需厘清和明确扩大公共数据资源供给的最终目的,平衡好“市场化”和“公共性”之间的关系。一方面,公共数据资源供给需要在守住安全底线的前提下,充分引入市场机制来开发数据产品,促进供需对接,把不适合以原始形态直接开放的公共数据的价值释放出来,从而提升公共数据资源供给的动力。考虑到对公共数据进行加工处理涉及到资金和人力投入,对此过程收取适当的费用有其合理性,有利于激励数据运营主体持续开发优质的数据产品和服务。

《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》提出要“合理降低市场主体获取数据的门槛,增强数据要素共享性、普惠性,激励创新创业创造,强化反垄断和反不正当竞争,形成依法规范、共同参与、各取所需、共享红利的发展模式。”《“数据要素×”三年行动计划( 2024—2026年)》在基本原则部分也提出要“充分发挥市场机制作用,强化企业主体地位,推动数据资源有效配置。更好发挥政府作用,扩大公共数据资源供给,维护公平正义,营造良好发展环境。”

因此,在推进公共数据开发利用的过程中,我们亟需厘清和明确扩大公共数据资源供给的最终目的,平衡好“市场化”和“公共性”之间的关系。一方面,公共数据资源供给需要在守住安全底线的前提下,充分引入市场机制来开发数据产品,促进供需对接,把不适合以原始形态直接开放的公共数据的价值释放出来,从而提升公共数据资源供给的动力。考虑到对公共数据进行加工处理涉及到资金和人力投入,对此过程收取适当的费用有其合理性,有利于激励数据运营主体持续开发优质的数据产品和服务。

但另一方面,也要防止增加了动力,却走偏了方向。扩大公共数据资源供给的初心应该是增进而不是损害公共利益,在引入市场机制的过程中,要防止商业利益或部门利益“偷换”了公共利益。公共数据尤其是其中占主体的政府数据是公共部门在依法履职的过程中使用公共财政资金采集生成的,是全社会共有的005资源和财富,应“取之于民”“还之于民”“为民所用”,尽最大可能降低各类市场和社会主体获取公共数据的成本和门槛,确保公共数据资源供给的共享性普惠性。在此过程中,要防止垄断和不正当竞争,警惕将授权运营变为“私相授予”和“垄断经营”, 将“有偿使用”变为“坐地起价”,最终仅使少数主体“坐收红利”,却大大抬高了广大的市场和社会主体获取公共数据的门槛和成本。

在扩大公共数据资源供给的过程中,政府应该算“小账”,还是算“大账”?应着眼于公共数据在短期内和局部范围内为地方或部门实现了多少利益“变现”,搞狭义的所谓“数据财政”?还是应着力使公共数据尽最大可能赋能于市场和社会,从而在推进产业发展、促进就业和提高居民收入等方面创造出更全面和长远的价值,并在更高格局、更广义的层面上实现政府财政收入的增加?要回答这些问题,都需要从根本上明确加大公共数据资源供给的最终目的究竟是为了谋取局部私利,还是为了增进公共利益?如果目的是后者,那以上这些问题的答案也就不言而喻了。

扩大公共数据资源供给好比“放水养鱼”,其价值应来自于养出了多少“鱼”,而不是卖出了多少“水”。在此过程中收取合理的“水费” 是手段,有助于提高供水的动力和质量,但不应将“收水费”本身当做了目的,否则如果因“水”价过高,而导致渔民养不起“鱼”或不愿养“鱼”了,就将“得”不偿“失”,不利于数字经济和数字社会的长远发展。最终,检验一个地方公共数据资源供给水平的标准应该是这个地方的公共数据是否以更大范围、更高品质、更低成本、更为安全、更可持续的方式赋能了数字经济和数字社会的全面发展,实现了公共利益的最大化。

4.结语

两千多年前,都江堰工程打通了水资源的宝瓶口。然而,李冰父子千辛万苦打通宝瓶口的目的并不是“把住”这个唯一的出水口,然后坐地起价“收水费”,最终让李家的子子孙孙赚得盆满钵满。相反,他们将优质的水源通过“宝瓶口” 源源不断地向社会释放出去,流动起来,赋能于成都平原的千行百业和千家万户,造就了农业时代的“天府之国”。回望历史,李冰父子之所以能千百年来被人民世世代代纪念,应该不仅在于他们从技术路径上打通了“宝瓶口”,更在于他们在终极目的上选择了让水资源惠泽四方,而不是占为己有。

正如《老子》所言:“上善若水,水善利万物而不争”,“生而不有,为而不恃,功成而弗居。夫唯弗居,是以不去”。最高的善就像水一样,滋养天下万物,却不与民争利,也不居功自傲,但却又恰恰因为不争利不居功,其功绩无处不在、永不泯灭。在数字时代,我们也应向古人学习,打通公共数据的“宝瓶口”,畅通公共数据资源的大循环,让公共数据“供得出”“流得动”“用得好”,使之成为全社会可以共享共用的公共资源,发挥出其对数字经济和社会的“灌溉”赋能作用和乘数效应,将整个中国打造成数字时代的“天府之国”。

来源:图书情报知识

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询