睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

数据要素交易政策主题挖掘与演化研究

时间:2024-04-01来源:苦涩的记忆浏览数:6

引言

数据作为新型生产要素已深度融入生产、分配、流通、消费乃至社会服务管理等各个领域,不仅引领了生产方式和生活方式的转型升级,更在宏观层面上改变了社会治理的模式和格局。在数据要素市场中,数据要素交易是数据供给方有偿提供数据,数据需求方支付费用,以货币作为交换媒介的数据单向流通形式。由于能够精准对接数据要素市场供需双方的需求,更好地推动数据要素的价值释放,数据要素交易因此逐渐成为当前数据要素流通的重要方式。

尽管近年数据才被我国正式列为生产要素之一,但实际上数据早已在经济社会中扮演了生产要素的角色并发挥了不可替代的作用。就数据要素交易而言,2014 年我国首次将“大数据”写入政府工作报告,数据要素交易行业开始萌芽。“十三五”期间,相关政策密集出台,为包括数据要素交易在内的数据资源配置提供了政策土壤。2020 年,我国明确将数据列为生产要素之一,数据要素交易市场建设由此被提到了新的战略高度。为进一步完善数据要素交易的顶层设计,2022 年,《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(下文简称“《数据二十条》”)指出“建立合规高效、场内外结合的数据要素流通和交易制度”,并从诸多方面提出了具体要求。

数据要素交易政策是数据要素交易市场建设的必要保证,也是数据要素交易市场顶层设计的直接体现。自我国数据要素交易行业起步以来至今已有 10 年时间。期间,相关政策的核心主题存在何种取向,其演化趋向又呈现出何种特征,值得广泛关注与讨论。鉴于此,本文以我国中央与地方发布的相关政策为研究对象,探究政策核心主题的取向与趋向,把握数据要素交易政策发展的内在规律,为完善我国数据要素交易政策体系提供参考,以期促进数据要素市场的健康发展。

1 .相关文献回顾

近年,随着我国数据要素市场培育的兴起,“数据要素交易”成为学术界讨论的热点话题。不过,目前关于数据要素交易政策的研究较少,相关研究主要从揭示政策内容结构、梳理政策中大数据交易产权问题以及探讨数据交易所政策变迁演进逻辑这几个方面展开。现有大多数关于数据要素交易的研究主要集中于以下三个方面。

1.1 数据要素交易的产权探讨

数据要素交易涉及诸多法律问题。其中,由于数据本身的复杂性,数据产权问题一直悬而未决。在交易前,数据的所有权应该归属于掌握数据加工技术的组织者还是数据的生产者,抑或同属两个主体仅占比不同,各界对此仍存在争议。《数据二十条》提出建立数据资源持有权、数据加工使用权和数据产品经营权“三权分置”的数据产权制度框架,不过如何真正落地,形成普适性强的具体方案还不明晰。有学者认为首先需对数据进行分类,然后进行数据产权的结构化分置,具体表现为产权内容的结构性分置与产权客体的类型化实现。由于数据权利配置的动态性,因此,一方面需要给数据资源持有者配置稳定的、具有一定排他性的产权;另一方面对于产出物的数据产品,需要配置相互独立的流通数据使用权。此外,面对当前概念混杂纠缠和平面化思维,应该从客体、主体、内容三层横向对数据与信息、数据的来源者与处理者、来源者所有权与处理者用益权进行分离,并纵向按照将数据生成区分为资源采集、集合加工利用和产品经营三个阶段。虽然当前学界对数据产权问题存在诸多争议,但对于数据产权的动态配置形成了一定共识。

1.2 数据要素交易的平台规制

平台是数据要素交易的重要载体,尽管其已发展较长时间,但仍然存在不少问题,致使交易活动受阻。这些问题主要包括法规制度不健全、市场生态发育不良、相关技术支撑不足以及平台自身单点故障、不透明、不可控以及交易不可追溯等。因此,需要从多个方面对交易平台进行规制。在技术方面,应利用隐私计算、区块链等技术共创共享数据权益,同时以“市场评价贡献”为原则,推动公共数据开放以增强可交易数据供给,并强化平台竞争执法,实现平台互联互通以维护交易公平竞争。在管理方面,则可以从统筹规划、股权结构、许可机制、风险防控、数据供给、标准规范等方面进行管制。不过,若对平台规制力度过大,则极易抑制数据自由流通。为此,应以“包容审慎”为原则,既要对数据来源和数据质量实行包容性监管,又要对数据安全和交易主体实行审慎性监管,以此平衡数据交易安全与数据自由流通之间的关系。此外,由于全球业务的需要,各国目前正积极推进数据跨境流动。为提高对数据跨境风险的防范力度,有必要建立一个跨国的监管机构,强制要求数据的可移植性和可访问性,并监管平台和数据市场中的参与者。

1.3 数据要素交易的隐私保护

由于存在大量隐私数据,数据要素在交易过程中容易对个人、社会乃至国家造成安全隐患。在交易前,由于数据处理不彻底导致数据主体隐私泄露,也可能由于技术能力不够或者人员操作失误导致数据丢失。事实上,目前交易活动主要在场外进行,由于缺乏有效监管,数据隐私泄露同样较为严重。在个人数据隐私保护上,数据交易的组织者、监管者以及关键信息基础设施都应保护个人数据隐私,不仅需要通过立法平衡数据交易与隐私保护,也要完善市场功能责任并利用相关技术防止隐私泄露。此外,现实中监管机构的不统一也不利于数据交易安全,应明确监管数据交易机构的主管部门。除了上述监管主体外,行业、公众在数据隐私保护上也同样重要,应建立政府监管、行业自律、公众监督的一体化监管制度,以行业自律规范为主、政府强力监管为辅、公众舆论监督为补充。在技术层面上,提出了基于区块链的数据保护方案,前者设计了基于区块链的众感数据交易(BCDT)系统,该系统可以激励卖家上传真实数据,而用户可以对卖家的可靠性进行评级,以抑制数据隐私泄露;后者提出了基于区块链的交易方案,并通过仿真验证了该方案在保护交易公平与隐私上的有效性。

综上,现有研究围绕诸多方面对数据要素交易开展了探索,对交易的合规健康具有一定积极意义。但是,现有研究较少聚焦于政策,而有关政策的研究在样本的选择上没有将所有相关的政策文本纳入进来,并且未进一步揭示政策核心主题的取向与趋向。故而,本文提出了数据要素交易政策主题挖掘与演化这一研究命题,以我国数据要素交易相关的政策文本为研究对象,分析其核心主题存在的取向以及呈现的趋向,揭示我国数据要素交易政策的发展规律,完善数据要素交易政策体系,并促进数据要素市场的健康发展。

2 .研究设计

2.1 研究框架

本文以相关政策核心主题的取向与趋向为研究主线,研究步骤如下:①从各政策文件库中搜集我国中央与地方所有相关的政策文件。②对研究样本进行预处理。③对采用的主题分析模型进行训练,并以人工归并相似主题的方式,最终确定政策文本的核心主题。在此基础上,对各主题的具体取向进行深入分析。④依据历年主题占比与相应政策数量,揭示政策文本核心主题的演化趋向。研究框架如图 1 所示。

2.2 研究数据

在收集相关政策文本之前,需要明确数据要素交易的范畴以确定政策检索词。然而,目前学界的有关探讨较少,且尚未统一共识。数据交易是市场经济框架下推动数据要素市场流通的基本方式,强调数据要素的流通以及数据资产的交易。指出数据交易并非将数据作为财产或产品,而是将数据作为服务。提出数据要素交易即数据要素的市场化过程,即需方支付一定对价,供方交付特定数据要素商品或提供特定数据服务。可见,数据要素交易的相关概念较多。不过,由于数据要素强调数据的生产价值,而数据资源、产品、商品、资产、资本、服务实际上可认为是数据生产价值实现中的不同表现形态。由此,“数据资源交易”“数据产品交易”“数据商品交易”“数据资产交易”“数据资本交易”“数据服务交易”本质上均属于数据要素交易的范畴。

基于此,为全面采集相关政策文本,本文结合国家有关政策以及上述有关讨论,以“数据要素”“数据流通”“数据交易”以及“数据资源”“数据产品”“数据商品”“数据资产”“数据资本”“数据服务”为检索词,以“标题”“全文”检索方式,在北大法宝数据库进行检索。同时,以国务院政策文件库、国家法律法规数据库以及各省(自治区、直辖市)政府网站作为补充数据来源,检索时间截至 2024 年 2 月 29 日。将检索到的政策文件按照以下标准进行筛选:①以所有现行有效或即将生效的中央和地方(省级、地市级)政策文本为主;②政策类型为法律、法规、条例、规定、意见、通知、办法等,不含批复、答复、报告等非正式决策文件;③政策文本内容须与数据要素交易相关。经过筛选,共得到政策文本 1269 份,中央政策 55 份,地方政策 1214 份。政策数量历年分布如图 2 所示。大体上看,中央与地方政策数量曲线的走势基本一致。2014—2019 年,二者数量均较少,且数量发展缓慢。2019—2022 年,二者数量陡然上升,数量逐年增多。2022 年至今,二者数量呈现明显的下降趋势。按照历年政策数量及增长趋势,本文将其划分为三个阶段,即萌芽期(2014—2019)、发展期(2019—2022)、趋缓期(2022 至今)。

由于当前数据要素交易的专门政策较少,大量相关政策文本散见于其他政策之中,因此为保证研究的针对性,本文首先使用 Python 程序对非专门政策中与“数据要素交易”相关的段落进行提取,并将其与专门政策文本汇总到同一个文档之中。其次,利用 Jieba 分词工具对政策文本进行分词,并去除停用词、非中文字符以及标点。在此过程中,为保证相关术语的完整性,本文以“数据交易”为检索词,在 CNKI 数据库中以“篇关摘”进行期刊论文检索,获取论文中的关键词,并以此作为分词过程中的自定义词典,避免相关术语被错误切分,从而提高分词的准确率。

2.3 研究方法

本文采用基于深度学习的主题挖掘方法,使用 BERTopic 模型对政策文本的主题进行识别。相比于传统的 LDA(Latent Dirichlet Allocation)、LSA(Latent Semantic Analysis)等基于词袋的主题模型,BERTopic 使用 BERT 预训练语言模型进行文本表征,充分考虑每个词的上下文语义,更准确地实现了对文本特征的提取。同时,该算法的嵌入聚类和主题生成(采词)是解耦的两个阶段,有效解决了传统主题模型基于密度聚类和基于质心采样之间的不一致问题。

BERTopic 的主题数由模型自动迭代生成,本文将分词后的政策文本使用 BERT 预训练模型进行表征并聚类以获得各个主题的表示,并进一步结合各主题层次聚类的结果再次进行归并,将主题数不断缩减,直至各主题间具有明显的区分度,从而得到最终的主题类别。

3. 确定政策文本的主题类别

图 3 展示了经 BERTopic 主题模型聚类与人工归并相似主题后的最终结果,其中簇的大小反映了各主题间的数量差异,其位置代表了表示相关主题类型质心的向量表示在二维平面空间的投影距离。结果显示,最终确定的各主题间距离适中,主题间无重合,呈现较高的区分度。由此,该主题类别划分情况较为合理。根据高频关键词,最终确定服务主体、技术保障、标准规范、安全监管 4 大政策核心主题(见表 1)。

4 .政策文本的主题取向分析

政策主题取向是指政策制定者在制定政策时所关注的焦点或重点,即政策面向的主要对象或解决的主要问题。根据各主题中的所有关键词,可以得到各主题类别的具体取向(见图4)。下文依据代表性政策并结合实践进展对其展开深入分析。

4.1 服务主体

在数据要素交易中,不同服务主体所扮演的角色与承担的职能不尽相同。其中,数据交易所由政府事业单位或国有企业组建,旨在为数据交易双方提供专业咨询、合规审核、交易代理、交易撮合等服务,为交易双方营造可信、规范的交易环境。过去,数据交易所兼具公共与商业两种属性,阻碍了市场公平。在“所商分离”的发展趋势下,市场上围绕数据产品与数据资产开展专门服务的数商逐渐增多。其中,又可分为数据商和第三方服务机构,前者主要从事数据采集、治理、数据资产或产品开发、中介经济、交付等业务,以提升数据要素化效率为目标,后者则主要提供合规认证、评估、公证、审计等服务,以规范市场行为。由此,数据要素交易的服务主体基本包含数据交易所、数据商以及第三方服务机构。从政策主题取向来看,以往,相关政策多关注于数据交易所。近年,在市场需求及政府关切下,政策对数据商及第三方服务机构的重视程度才有所提高。

1)数据交易所。在 2014 年“大数据”被首次写进政府报告之后,我国开始逐步探索数据交易所建设。2015 年,贵阳大数据交易所正式挂牌运营,成为全国首个数据交易所。此后,数据交易所在各地如雨后春笋般涌现,如武汉长江大数据交易中心、武汉东湖大数据交易中心、河北大数据交易中心等。同时,为加快数据要素流通,扩大市场竞争能力,各地依托于数据交易所打造数据交易平台,提供更便捷、高效、安全的一站式服务,如北京大数据交易平台、华中大数据交易平台等。这一时期,数据交易所的发展与相关政策的出台密不可分。2014 年,《贵州省大数据产业发展应用规划纲要(2014—2020 年)》最早提出“建设大数据交换平台与数据交易市场”。中央层面则于 2015 年发布《促进大数据发展行动纲要》,首次指出“引导培育大数据交易市场,开展面向应用的数据交易市场试点,探索开展大数据衍生产品交易”。而后,各地纷纷将“数据交易所建设”纳入大数据产业相关规划之中,由此形成了 2014—2017 年我国数据交易所建设的第一波热潮。不过,由于初期建设经验不足,进入 2018 年后,数据交易所发展出现停滞。为实现数据交易所高质量发展,2020年,《关于构建更加完善的要素市场化配置体制机制的意见》重申要“引导培育大数据交易市场,依法合规开展数据交易”。而后,中央层面《数据二十条》《“数据要素×”三年行动计划(2024―2026 年)》等以及地方层面《广东省数据要素市场化配置改革行动方案》《贵州省数据流通交易管理办法(试行)》《上海市数据交易场所管理实施暂行办法》等文件陆续发布,对数据交易所提出了更具体的规范化要求,推动了我国数据交易所建设的第二波浪潮。北京国际大数据交易所、上海数据交易所等先后成立,截至 2023 年 12 月,全国数据交易所超过 50 家。

2)数据商与第三方服务机构。尽管在数据要素交易中,数商尚属于兴新概念,但在大数据的发展浪潮中,市场上早已形成了一大批大数据相关企业或机构。自 2021 年我国拉开了数据要素市场建设的帷幕后,这些企业或机构逐步探索开展数据要素化业务。从发展情况来看,数据商大多已经具备数据要素化核心环节的服务能力,但业务还未形成规模,而第三方服务机构由于缺少政策依据、操作指引以及经验积累,在数据产品与数据资产专业服务上的发展较为缓慢。为加快数商发展,2022 年《数据二十条》指出要“围绕促进数据要素合规高效、安全有序流通和交易需要,培育一批数据商和第三方专业服务机构”。在此背景下,各地也积极采取行动,探索服务主体的培育路径,如《广东省数据经纪人管理规则(试行)》《深圳市数据商和数据流通交易第三方服务机构管理暂行办法》等。

4.2 技术保障

在数据要素交易过程中,相关技术能够确保数据的安全性、完整性和可用性,为“数据可用不可见”“数据使用可控可计量”提供重要支撑,帮助实现数据的有效流通与交换。近年,随着信息技术的不断演进,数据要素交易市场与新技术的融合发展逐渐深入。从政策主题取向来看,区块链、人工智能、大数据、云计算等技术受到了数据要素交易政策的广泛关注。

2016 年,中央层面《国家发展改革委办公厅关于组织实施促进大数据发展重大工程的通知》以及地方层面《陕西省发展和改革委员会关于组织实施促进大数据发展重大工程有关工作的通知》率先明确提出“完善大数据交易的技术保障措施”。而后,相关规定不断出台。不过,此时的政策对于技术保障的要求较为笼统、空泛。随着技术的不断发展,2019 年,我国决定在山东、江苏、广西、河北、云南、黑龙江等 6 省区设立自由贸易试验区,在总体方案明确提出“推进基于区块链、电子身份(eID)确权认证等技术的大数据可信交易”。自此,各地在数据要素交易的技术应用上加速布局,珠海市、广州市、武汉市等多地先后在数据要素市场化配置改革相关方案中提出要运用可信身份认证、数据签名、接口鉴权、数据溯源、算法核查、区块链、多方安全计算等新技术,保护数据安全。从实践来看,目前数据交易机构不断强化技术保障,例如,北京国际大数据交易所打造的数据交易系统利用隐私计算、区块链及智能合约、数据确权标识、测试沙盒等技术,支持全链条交易服务体系的建设[30],深圳市数据交易有限公司牵头发起国内首个国际化自主可控隐私计算开源社区,打造数据要素生态圈。未来,数据要素交易市场将持续加大技术投入,相关政策也需加强引领,助力完善数据要素交易的技术保障体系。

4.3 标准规范

数据要素交易涉及的要素众多,包含交易标的、交易场所、交易主体、交易行为等。从数据要素交易流程来看,又可大致分为数据准备、数据评估、数据登记、数据审核、数据挂牌、交易磋商、签订合同、交易结算、数据交付等。因此,要实现数据要素交易的全方位、全流程合规,需要建立完备的标准规范体系,为数据要素交易的有序运行提供行动依据。从政策主题取向来看,相关政策较多从整体上关注标准体系建设。

我国对数据要素交易标准规范的探索始于 2014 年,国家标准化管理委员会开始执行国家标准计划《信息技术 数据交易服务平台交易数据描述》《信息技术 数据交易服务平台通用功能要求》,前者是国内首个国家大数据交易标准,规定了数据交易服务平台中数据描述的相关信息及其描述方法,后者规定了数据交易服务平台的功能框架及应有的功能。2017 年,贵阳市在《贵阳市大数据标准建设实施方案》的要求下,开展《信息技术 数据交易服务平台交易数据描述》《信息技术 数据交易服务平台通用功能要求》等标准的验证示范。2019年和 2020 年,这两项标准分别正式实施。此外,2018 年由国家标准化管理委员会负责牵头编制的《信息安全技术 数据交易服务安全要求》也于 2020 年正式实施,该标准规定了数据交易参与方、交易对象、交易平台及交易过程的安全要求。上述标准从平台交易数据、平台功能以及交易服务安全等不同方面为数据要素交易提供了准则。不过,由于数据要素交易的复杂性,这些标准还不足以形成完备的数据要素交易的标准体系,且有待在实践中逐渐完善。2022 年,《贯彻实施〈国家标准化发展纲要〉行动计划》就提出要“研制一批数据安全、数据交易标准,促进数据要素市场培育发展”。同时,各地数据交易所也在积极制定相关标准,如《上海数据交易所数据交易规范(试行)》《深圳数据交易有限公司交易服务指南》等。

4.4 安全监管

数据要素交易过程中存在诸多安全风险,主要包括数据泄露风险以及数据侵权风险。具体而言,一方面,数据本身具有高度敏感性,一旦发生数据泄露,将危害个人隐私、公共利益,甚至是国家安全。加之,由于交易的不完全契约性,数据使用存在不可控的问题,这就进一步增加了数据泄露的可能性。另一方面,目前数据所有权及其相关使用权、收益权和处置权的定义与含义在法律上还未得到明确,在数据要素交易中仍难以平衡数据来源者、数据处理者等不同主体的权益,而存在数据侵权风险。对于数据泄露,相关政策多从数据分级分类、数据安全评估、举报查处机制、打击黑市交易等方面进行应对。对于数据侵权,《数据二十条》创造性地提出了“三权分置”的数据产权制度框架,但未来如何落地还不明晰。不过,无论是数据泄露还是数据侵权,均存在负外部性,而降低这种负外部性的有效手段是加强安全监管。

过去,我国关于数据要素交易安全监管的规定多散见于各地大数据相关政策,如《上海市大数据发展实施意见》要求逐步建立国内领先的大数据交易监管体系。此时,相关政策并未对数据要素交易提出具体的安全监管细则。2020 年,天津市发布的《天津市数据交易管理暂行办法》是我国第一部专门针对数据要素交易进行规范的地方政策,其对监管部门、互联网信息主管部门、数据交易服务机构、国家机关等主体在安全监管上的责任做出了较为具体的规定。2021 年,《数据安全法》作为我国第一部有关数据安全的专门法律,更是从数据安全与发展、数据安全制度、数据安全保护义务等诸多方面,为数据要素交易的安全问题画下了红线,同时也进一步压实了有关主管部门、数据交易服务机构、国家机关在数据要素交易中的责任。随着我国加快数据要素交易市场建设,为应对数据泄露与数据侵权问题愈发突出的问题,各地相关政策也越来越多。例如,《广西数据要素市场化发展管理暂行办法》要求建立健全跨部门协同监管机制,监督管理数据交易、信息披露行为等。再如,《深圳市数据产权登记管理暂行办法》从登记主体、机构、行为以及监督管理等方面对数据产权登记全流程进行了规制,以避免交易中的侵权风险。从实践层面来看,自国家数据管理局成立后,截至 2024 年 2 月 8 日,已有 22 个省级数据局相继成立,旨在统筹本地区包括数据要素交易在内的数据要素市场监督管理等工作。同时,各地数据交易所也均建立了数据安全监管制度。

5 .政策文本的主题趋向分析

对历年政策主题占比及其对应的政策数量进行统计后,得到了二者的时序演化趋向图(见图 5、图 6),其能够反映我国数据要素交易政策核心主题的演化趋向。从整体上看,在占比方面,技术保障呈现上升趋势,标准规范则呈现下降趋势,而安全监管在经历陡然下降之后趋于稳定,服务主体则波动变化明显,且服务主体占比远远高于其他主题,表明其一直是政策的重点关注对象。在数量方面,各个主题的变化趋势与政策样本的总体数量变化较为一致。

在政策萌芽期(2014—2019 年),政策核心主题占比存在较大波动,各主题对应的政策数量也均较少。期间,技术保障呈稳步上升态势,标准规范呈波动变化,安全监管和服务主体变化更为明显。其中,安全监管主题 2014 年占比最高,而后呈现陡然下降的趋势,2015年起开始缓慢增长,而服务主体则经历了快速上升后,开始缓慢增长,之后又出现迅速跌落的状态。结合当时实践进展来看,如前所述,在 2014 年大数据被首次写入政府工作报告以后,数据交易所不断涌现。仅 2015 年和 2016 年,其数量已达到 13 家[33]。不过,由于缺乏统筹规划且实践中存在较大阻碍,如数据确权、规划缺失、可信环境阙如、合规成本较高等,2018 年后新增数据交易所的数量出现骤降,且已有的交易所开始出现关闭的情况。这一时期伊始,相关政策对服务主体给予了较大关注,但在 2017 年以后热度迅速减退,显然政策主题的演化趋向对该时期服务主体的发展产生了很大影响。此外,数据要素交易行业起步后,相关政策最为关注的是安全监管问题。自 2015 年起技术保障、标准规范作为数据要素交易安全的重要抓手开始得到政策重视。总体而言,这一时期,数据要素交易的顶层设计尚处于探索之中。

在政策发展期(2019—2022 年),政策主题占比与上一时期相比波动较小,且各主题对应的政策数量呈现快速增长的态势。在占比上,服务主体在上一时期末下降明显之后开始稳步增长,技术保障在仍然保持较长一段时间的上升趋势后出现回落的状态,安全监管与标准规范则分别呈现缓慢上升和下降的趋势。结合实践情况来看,2019 年,十九届四中全会首次将数据列为生产要素之一,包括数据要素交易在内的数据要素体系化顶层设计正式启动。2020 年,《关于构建更加完善的要素市场化配置体制机制的意见》提出加快培育数据要素市场,数据要素交易行业发展势头明显加快,服务主体,尤其是数据交易所的发展也随之走上了快车道。同时,在技术发展、政策引领以及需求驱动下,各地数据交易所利用隐私计算、区块链、测试沙盒等搭建交易平台,目的在于使交易更加合规高效。进入“十四五”时期,中央层面《数据二十条》以及地方层面数据要素市场化配置等相关政策密集出台,数据要素政策体系架构开始形成。在此背景下,2021—2022 年,我国数据要素交易市场规模由 617.6 亿元增长至 876.8 亿元,年增长率为 42%,相关政策在其中起到了巨大的助推作用。

在政策趋缓期(2022 年至今),各主题占比变化逐渐稳定,且除服务主体外,其余主题占比较为趋同,各主题对应的政策数量下降明显。在占比上,安全监管上升缓慢,服务主体仍然上升明显,标准规范与技术保障则呈现下降趋势。这一时期,尽管政策总体数量明显下滑,但相较而言,地方政策数量仍然不低。在上一时期中央发布的《数据二十条》的影响下,各地持续发力布局数据要素交易市场建设,如《广东省数据流通交易管理办法》《深圳市数据商和数据流通交易第三方服务机构管理暂行办法》《上海市数据交易场所管理实施暂行办法》等。在相关政策的号召下,各地加快了数据交易所的建设步伐,且提高了对数据商以及第三方服务机构等其他服务主体的培育力度。不仅如此,各地在标准规范、安全监管以及技术保障上作了开展了大量工作。显而易见的是,这一时期,我国数据要素交易市场建设仍在继续,尤其是各地方开始探索符合自身实际的数据要素交易市场发展道路。

6 .结论与建议

为探究我国数据要素交易政策核心主题存在的取向与呈现的趋向,揭示政策发展的内在规律,本文利用 BERTopic 模型,对相关政策的核心主题进行了提取,结合代表性政策与实践进展,探讨了每一类主题的具体取向与演化趋向。研究表明,我国数据要素交易政策呈现服务主体、技术保障、标准规范、安全监管 4 个核心主题取向。在政策发展的不同时期,各主题的演化趋向不尽相同,对实践进展产生了较大的影响。基于研究结果,本文对数据要素交易政策的完善提出如下建议:第一,在服务主体上,过去大量政策关注于数据交易所,对数据商以及第三方服务机构重视不足,需加大对其他服务主体的培育,为其更好参与数据要素交易提供政策依据,以形成良好的交易服务生态;第二,在技术保障上,实践层面新兴技术不断涌现与应用,相关政策内容存在一定滞后性,需重视数据要素交易相关技术的研发与投入,同时为降低技术应用的合规风险提供具体指引;第三,在标准规范上,目前数据要素交易标准规范体系还不完备,相关政策也并未明确标准规范的具体内容与实施细则,需加快国家层面标准规范的制定,为全国数据要素交易活动提供行动纲领;第四,在安全监管上,要统一并细化相关政策措施,同时制定交易信息披露制度、交易行为监管制度以及交易风险控制制度,构建全方位安全监管制度体系,以保障各方的合法权益。

本研究的不足之处在于,首先,在研究方法上,利用 BERTopic 模型,从整体上抽取了相关政策文本的核心主题,未能捕捉随时间推进政策核心主题的变化情况;其次,在研究内容上,对政策核心主题的取向与趋向进行了刻画,受制于篇幅,未能对政策内容进行更深入的解读。在今后的研究中,可考虑政策核心主题随时间变化的情况,更细粒度地呈现历年政策核心主题的差异,同时综合采用多种大规模语言模型并构建理论框架,更深层次地揭示政策内容。

来源:情报理论与实践

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询