睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

华矩科技谭海华:数据要素·以质创值—数据要素资产化所面临的问题与挑战

时间:2022-01-21来源:岚风殇浏览数:146

【摘要】数据要素资产化会经历三个关键阶段的演变过程,分别是数据化、数据要素化和数据要素资产化。而其中,数据化过程最主要的特征是数据质量,数据要素化的核心是数据确权,而数据要素资产化更关注价格及流通问题。

演讲目录

相关概念的理解

影响数据要素资产化的几个关键环节

数据质量主要作用与影响

问题、挑战与建议

       谭总:各位来宾、各位朋友,大家好!很高兴能够参加这个峰会,而且能够在这里跟大家分享一下有关数字经济,包括数据要素的这个一些看法。本届峰会的主题是数据要素,以质创值。那基于这个主题我想跟各位分享的是数据要素资产化所面临的问题与挑战。抛砖引玉,在这个问题上谈谈我个人的看法。

       首先简单介绍一下,我是华矩科技的创始人跟董事长,在过往里面基本上是在数据治理,包括大数据这个行业,跟我们的高校、企业界、咨询界都有很多的交流,这个是我的一些背景,我也希望在这个领域里面和更多的朋友一起来交流。

       今天的这个介绍大概会有四个方向,首先是有关这个数据要素一些相关的概念。在目前这个数据、数字化转型、数字经济、数据要素,可以说是蓬勃发展的时候,我们的知识体系以及一些概念上的理解,可能会直接影响到我们的的产业或产品,这是我第一个要跟大家去讲的。另外一个就是说我们会看看数据要素资产化的整个关键环节都有些什么需要关注的。第三个主要谈一下数据质量,在这个数据要素资产化的过程里面,它的主要作用和影响是什么,最后是一些建议跟大家一起分享。

       1.相关概念的理解

       我们中国信通院在前两天刚刚颁布了这个数据资产管理实践白皮书,这个正好跟我的主题非常契合,我也认真看了一下,目前我们这本书里面重点关注的是我们的数据资产管理的实践,当然这跟我今天的这个话题是有一点点出入的,因为今天我讲的这个是数据要素本身的一个资产化,这个也是在业界里面可能很多没有定论的一些问题。

但数据资产管理实践这个相对来讲是成熟的,因为这里涉及到我们的一些平台,包括我们管理的一些思想,我也去看了一下。那这里面其实有好几个概念是跟我们今天讲的是有关联的。那概念上当然我们会看到有几个点,比如说像数字、数据资源、数据要素、数据资产,数据价值评估,数据价值评估跟数据资产评估这个大家是怎么理解的、数据资产的计量,那这里面包括我们的数据要素化、数据资产化应该是怎么去看的。我想这些概念非常多,可以说一方面概念是很丰富的,另一个方面也说明我们研究这个领域有非常多的维度去讨论这个问题。但也有另外一个角度是看我们怎么理清这些概念之间的关联是什么,更清楚的一些认定。

       所以我这里看就面临着第一个挑战,就是说我们怎么去把这个概念更加明晰、统一。在数据治理看来,这个就是一个定义的一致性问题,就是说我们怎么去面对这些概念,这些概念在我们数据要素市场化的这个环节里面,它们之间的前后关系是什么,究竟是什么一个关联点。当然这里面假如说我们对这些问题不清楚或者是混乱的话,也说明了我们在这些问题上还需要更成熟的一些认知来去把这些问题理清,也就是我们在讲数据要素资产化,我们往前走的时候会面临的第一个挑战。

       第二个挑战也是我们第五届数据质量国际研讨会闭门论坛专家的一个共识,我们看到数据资产尚未确立,数据确权问题尚无有效解,缺乏有效的技术手段、支撑手段、高质量的数据资源缺乏、数据共享、流通存在障碍,数据安全跟隐私保护问题越发突出。

       这个普遍认知就是说,在数据要素资产化的这个过程里面,还有很多概念需要理清,包括一些问题要解决。所以这个也是我今天为什么想在这个问题上跟大家分享一下我自己的一些看法,纯粹就是抛砖引玉,谈谈我自己的一些角度、理解。

       2. 影响数据要素资产化的几个关键环节

       那在这里面我们看到谈这个数据要素资产化,我想会有三个关键环节。

       首先是数据化,数据要素化以及数据要素资产化,那为什么我会用这个提法,这是个演变的过程,可能我们不能够笼统地把数据要素化跟数据要素资产化等同一起,也不能把数据化跟数据要素化等同一起,这个是有不同的理解的。那在这个理解里面我想现在我们讨论很多数字化转型最早去做的事情,就是把非数据的变成数据,这个可能就是在我们信息化的时候,我们会提到的无纸办公,这些都是我们讲数据化的一个过程。

       但是我们在谈工业4.0,在谈制造业怎么透过我们的产业链或者透过数据流来进行管控,这个是讲怎么把我们的数据应用到我们的整个流程里面、管控里面,这个也是数据化。包括我们现在还有提到的,我们怎么把这些不同渠道拿到的数据能够进行加工、整理、形成数据,形成这个数据,甚至说这个数据是为我们做数据要素化的一个前提准备工作,我会认为数据化整个过程会在这里。

       那这里面可以说数据化它是我们数据要素化的一个前提,这个前提包括,比如说数据的质量,包括数据最基本的能够进行要素化的一些条件。同样的道理,这个数据要素化我们要重点关注的是什么?包括数据资产它是怎么区分的。那这里我做了一个分析,比如说在数据化里面,我们重点关注的像采集、结构化、异构数据集成、标签、数据质量评定,最后形成我们的数字产品。那这个数字产品可以说是原生态的,可以说就类似我们在很多商品投入、商品流动前,它是个物品,至于说它能不能够进入商品的流通里面,那是另外一回事。所以可以说这是一个产品化的过程,我们说数据化也是一个产品化的过程,这是第一个环节。

       第二个关键环节叫数据的要素化,要素化我们关注什么,关注溯源跟身份认证,因为这个是我们在进行流通的时候,你必须对确权的问题,包括我们在谈区块链怎么来去确认这个要素化的这个身份认定,包括凭证化处理、权属认定,包括行业监管的认定。

       比如说大家都知道,就算一个手机要入网,也有一个入网的认证,你才能够进入这个流通的这个环节里,这个是我们讲的数据要素化的时候,首先要去具备它能够进行资产交易前的这些认定工作,这个我们叫数据要素化。当然还包括安全隐私保护,还有包括我们的价值认定,价值认定跟价格是分开的,这个价值是我们这个商品本身对这个社会所存的价值,这个是价值认定,不是价格认定。所以在数据要素化最主要的一些工作是来进行凭证化,包括权属认定,比如说我的数据权属的认定,是我们进入资产化的时候一个前提工作。

       最后是数据要素资产化,资产化这里面就是资产评估,就是我们讲的包括价格管理、流通管理、市场监管进入到我们的这个过程里面。所以在谈数据要素资产化,我们会看到有这么三个关联的环节,数据化、数据要素化,以及数据要素资产化。

       在这三个环节里面,我们可以找出它的几个特征。


  • 首先数据化的过程最主要特征是质量,也就是说怎么确保高质量的数据进入流通;
  • 数据要素化的核心是确权,这个我们叫数据的确权,就是说它有归属才能够进行交易,没有归属就无从交易;
  • 数据要素的资产化,这个重点是在定价,我怎么进行定价来实现这个数据要素的资产化。


       那这三个关键的环节我们可以讲它们分别解决了我们在整个流通里面的几个问题:


  • 第一个环节我们解决的是怎么确保产品的生产问题,它是能够提供有竞争力的、有价值的产品,这个是我们讲数据化的这个关键环节。
  • 第二个是有关这个市场的准入问题,就是说你要知道这个流通、这个确权,包括这些凭证问题,怎么来去确保我们这些数据的市场准入问题。
  • 第三个就是定价问题,定价问题我想就是说要解决的是价格跟流通问题。


       这三步可以说是我们整个数据要素资产化所关注的问题。

       3.数据质量主要作用与影响

另外我们来看这些数据质量在每一个环节所面临的情况是什么,这个会直接影响到我们数据要素资产化的整个发展。

       在第一阶段数据化的时候,数据质量是它的特征值,但是我们现在在这个数据质量环节里面其实也遇到非常多的技术问题,为什么我统筹讲技术,我觉得这个是产业界所面临的紧迫问题,可能它跟其他的政策无关,纯粹是说我们在解决这些问题的时候,面临到的这种技术问题,是没办法回避的。

       首先是如何实现“快”“省”“准”。

       其中“快”是什么,就是你怎么样能够去快速提升你的数据质量,让优质数据进到流通里。我们举个例子,假如说我们现在做很多数据清洗、做很多数据认定,假如说在你的窗口时间里面,甚至在你从数据产生到进入流通过程中,你的这个窗口时间根本没办法实现。那这种技术瓶颈你是没办法逾越的,这个已经变成了我们在做数据质量一个很关键的点,这是第一个。

       “省”就是成本问题。假如说我们不能够在这个环节里面解决低成本问题的话,整个流通也是很难的,为什么没有人会采纳一个高成本的产品,这个对后面的数据资产化的影响也是极为重大的,大家都可以看得到,像共享单车,你要不是可以低成本去使用这个共享单车的时候,它的推广也没那么快,所以“省”是决定一个产业发展很关键的一个要素。

       另外一个就是“准”,这个作为数据质量来讲,本身数据质量跟下面这几个问题是有关联的。

       包括第二个问题-如何建立有差别的数据质量等级标准,也就是说数据作为商品或者数据作为这种生产要素,它的特点跟其他不一样。那目前我们在“准”这个问题上,在数据质量的标准方面,其实要达成一个能够让交易各方都能接受的标准,甚至是说唯一标准,是很难的。所以我们应该是要建立一个有差别的数据质量的等级标准,这样在整个未来数据要素资产化的过程里面,它能够在它能接受的层面上来发挥,以及有等级标准的话怎么去区别对待,这是第二个问题。

       第三个问题就是说如何建立权威的数据质量评定机构,这个也是在保证数据质量评定进入这个流通的时候,有没有这样的机构来去处理这个东西,这个也是非常关键的。

       第四个就是说怎么建立全流程的数据质量监控,毕竟它是一个流通闭环,你怎么来建立这个流通闭环就是我们提到的数据质量的这个技术问题。

       第二个环节叫数据要素化,数据要素化其实这个我们也关注到它非常核心的几个难点,包括它的技术问题。

       首先是理清这个数据源,这个就是身份问题了,你怎么来证明这个数据的身份归属谁,它是从哪来,怎么证明,包括它是用什么手段、什么技术来去进行这个数据的身份识别,甚至怎么去区分这两个数据是一个来源,包括里面的某两条记录讲的是同一个意义。那这些都是有很多技术所面临的问题的,这个就叫身份识别问题。

       第二如何通过技术实践统一字段的认定,这里我们也提到这个问题。

       第三个就是说如何确定数据价值,价值不是定价,这个价值刚才有提到,其实它跟数据分析能力有关,包括跟数据能力、数据量、数据质量相关,它可能不是单一维度。假如说你对这个数据的挖掘、使用的能力不行,它也可能影响到这个数据的资产价值,所以它是有它的特殊性,怎么来界定这个数据价值,这个是我们在确权的时候一个非常关键的点。

       当然还有一个概念,就是说我们是否可以建立一个叫数据要素的公证处进行公证,有个第三方来去证明我们的数据所属在哪里,有没有可能走到这一步,这个是我想先提出来的一个问题。

       第三个环节就是有关数据定价问题,我们刚讲到的有关数据要素资产化最后一个环节的时候,目前我们所看到的挑战,刚才提到了:

       现在没有统一的定价模型,这个目前还是在研究中;

       另外在这个数据资产定价里面有一个非常特别、跟与众不同的就是,购买者会共同参与制定这个数据价值,那这个定价的特点是与其他要素不一样的;

       第三个就是没有参照物;

       第四个数据的特点是几乎没有成本地复制,甚至这种数据衍生出来,它是怎么样进行定价。

       这些我觉得都是业界需要去考虑、需要去面对的,但是这些问题也是我们面对的一大挑战。

       最后我想讲一讲数据质量管理在这三个环节里面,分别起到的一些关键作用。比如说在数据化的时候,它是来确保产品品质的,在确权的时候它来进行身份识别,在定价的时候,它是给以非常有利的定价参考来协助定价。

       4.问题、挑战与建议

       因为时间的关系没办法展开,但我还是很高兴能够利用这个场合把一些相关的研究,包括我们现在所面临的问题跟大家做一些分享。最后我也给一些观点跟建议:

       首先数据要素市场化任重道远,我相信大家面临的这个难题还是非常大的。

       第二个就是数据治理、信息质量管理技术是有助于加快这个进程的,我刚才提到了,数据要素有很多离不开这个技术,数据技术它来解决一些我们现在可能无法解决的问题,但技术到达一定程度的时候,可能会产生新的一些看法,所以本文所提及的三类技术问题是重点要解决的。

       第三个就是说围绕数据要素资产化的相关工作,我觉得并不代表我们无所作为,目前虽然我们会面临很大的挑战,但是我们有些工作是可以展开的,比如说像第三方数据质量评测机构的一些工作,包括数据公证处的一些工作,虽然目前的数据交易所已经承担了部分职能,但这个工作我觉得还是值得探讨和往前走的,还有一个就是说这个工作需要更多的不同界别的专家一起来进行讨论。

       我想今天这个分享就大概会到这里,也谢谢各位的聆听,谢谢。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询