睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

从“数据”到“数据资产”,都经历了什么?

时间:2024-07-01来源:也许该悲伤浏览数:21

数字化转型任务中,数据,数据资源,数据资产,这些词汇的概念意义都是非常不一样的。

从数据到数据资源,首先经历了成本确认和潜在价值认定的过程,而从数据资源再到数据资产,又经历了数据治理的过程。

所谓数据治理,本质上就是对杂乱、原始的基础数据进行一系列的加工处理,使其数据价值得以“显化”,可以直接为管理或业务活动提供价值。

数据治理本身有非常宽泛的管理学内涵,而如果从数据价值链的视角,把数据本身作为观察对象,或许可以更加清晰地理解数据治理活动对数据变成资产这个过程产生了什么影响。


下面主要从四个步骤来简单介绍:

(一)业务数据同步

首先,需要通过数据采集、同步的方式,把业务系统中的数据表内容迁移到分析域中,实现数据对象从流程支持到决策支持这个基础角色的转变。

例如,在数据仓库的贴源层,尽管只是对业务系统中的数据进行了最基础的复制操作,其内涵也是完全不同的。

这里最大的好处在于,在数据仓库对数据进行分析,并不会对业务系统的正常数据运行产生任何影响,这个过程也叫业务数据化。


(二)业务特征抽取

刚完成的同步的原始数据形态,数据结构和数据规整度不足,很多时候并不利于直接进行分析。

因此,需要对数据进行预处理,去掉可能影响分析结论的误导性记录。同时对业务特征进行抽取和提炼,为后续的数据分析活动以及数据服务创造有利的数字化条件。

其中,对于结构化数据来说,常见的做法是对一些核心业务特征的度量值进行统计计算,比如平均值、最大值、最小值、总数、比例等总体分布指标。

而对于非结构化数据来说,比如文本类数据,通过语义理解、文本分类、知识抽取等自然语言处理技术,可以自动提炼业务标签,获得相应的结构化表征属性。


(三)数据要素重组

除了对业务特征抽取,在数据治理的过程中,还需要数据资源进行汇聚整合。

数据汇聚是把来自不同业务系统(数据源)的数据在新的统一模型中进行统一、集中的重新表示,这里有两个主要目的:

一是实现数据资源的整合与贯通,实现跨业务的数据价值融合,激发更大的数据要素活力和数据场景创新潜力;

二是将数据资源的组织形式转变为更适合业务分析的宽表形式,数据模型的基本结构从面向过程变为面向对象。

(四)数据质量整改

前三个步骤完成了数据要素的初步规整,这里只是考虑了数据的信息表示形式,并没有考虑数据质量。数据质量是保证数据可用性、价值性的关键。

对数据质量进行定期的核查、整改,是数据治理中非常关键的环节,数据质量一般按照六性(一致性、完整性、准确性、唯一性、有效性)维度展开进行分析、整改、提升。

数据质量整改除了在数据仓库(或中台)进行(见效快、不彻底),也可以在各个源端业务系统(干扰正常业务、长期效应)展开。

值得注意的是,数据质量的标准需要紧密结合目标业务应用来定义,需要考虑权衡数据整改活动的“成本-收益”比例。


(五)数据产品开发

在数据整改的基础上,后续可基于优质的数据表资源,围绕具体的业务目标导向,开发各类有价值的数据产品。常见的数据产品包括数据表本身、BI分析模块、业务标签等多种形式。

数据产品一般以“服务化”的方式进行组织内外的资源共享和开放。用户可以通过访问数据服务来访问数据资源和基于数据资源的计算分析能力。

最终,数据表和数据服务,最终都作为数据资产进行审核、备案、公开、运营。

用户可以通过数据资产目录了解企业的数据资产现状,并按照授权情况进行访问,以及开展自主数据应用。


(六)数据资产确权

在成为数据资产之前,还有一个环节非常重要,即数据资产确权。

因为数据资产与其他资产一样,具有价值属性,这就会涉及关于数据价值分配以及责任归属的问题。需要明确在组织中谁对数据有采集权、管理权、访问权,以及最终的收益分配权。

当前,关于数据资产确权的统一标准还在逐步探索的过程中,在不同行业和业务场景中的规则也各具差异性。

但总体而言,数据权益与数据责任是相匹配的,需要结合各相关方的资源投入和业务边界合理明确,这是数据要素市场化不可逾越的关键管理学议题。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询