睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

数据资产管理(下篇):数据资产目录

时间:2023-07-27来源:我太帅了万人爱浏览数:281

数据资产管理(下)

数据资产目录的编制与应用,上期我们介绍了,数据资产盘点。作为数据资产盘点中,一种可视化的价值输出,数据资产目录主要服务于业务部门和数据分析团队。本期介绍数据资产目录的建设方法和特点。根据Gartner给出的定义,数据资产目录是通过发现来创建和维护数据资产清单,描述和组织数据资产的分布的一种工具。

数据资产目录特点

区别于技术人员使用的数据字典,数据资产目录的定位是面向业务的,鼓励业务人员参与建设和使用十分关键,数据资产目录必须是业务人员所熟悉的场景和流程,是客观反映银行目前数据现状的,是可扩展的支持未来取数用数的。

一个使用友好的数据资产目录,能够打通查数/取数环节、打通基础类数据和指标类数据的联系,并通过人工智能和机器学习等先进技术,更好地支持数据的探查和关联推荐。

数据资产目录体系框架

我们在进行数据资产目录构建时,需要结合数据资产类型,定义数据资产的属性,不同资产类型对应不同业务属性,管理属性,应用模式、资产目录视角等,达到千数千面的效果,最终形成数据资产权威、可信、可用的企业级数据资产目录。

以业务领域构建资产目录为例,可以通过资产盘点,梳理银行数据主题分类/核心业务板块,再根据业务要素逐步向下划分二级目录、三级目录,最后到叶子结点的信息项上。信息项的定义也是从业务出发,梳理业务板块都有哪些数据内容,例如客户信息包括:客户名称、联系方式、地址、证件类型、证件号码等。

数据资产分布与映射关系建立

在技术元数据采集的基础上,探索信息项所属系统来源,确认其系统分布情况,将数据资产信息项与物理表/字段间构建映射关系,并确定权威数据来源。对于单个业务系统而言,只需要将主表中经过分析最准的内容映射过来,而不是所有表,避免数据使用者因为多表冗余存储造成混淆。

我们以“客户中文姓名”这一信息项为例,梳理数据来源与系统表映射关系如下:

数据资产目录的应用价值

通过数据资产目录,可以解决数据在哪里、数据谁负责,数据如何用等一系列问题。数据资产目录的准确性,也决定了应用时的效果。

数据在哪里:业务部门能够通过数据目录查询到现有数据资产情况以及索引对应的系统表字段,定位权威系统数据来源。

数据谁负责:数据质量检核规则发现问题时,根据字段所属的数据资产来确定数据质量问题的牵头整改责任归属。

数据如何用:精准定位数据所在系统/表/字段,提升数据提取需求的准确性和效率;打通系统间形成的数据孤岛,实现编码规则等标准的统一规范、使数据互联互通。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询