睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

工作手册:如何实施数据标准管理(上)

时间:2022-06-22来源:我幻化成雨浏览数:345

数据标准,是企业数据治理理论和方法与实际信息系统和数据的桥梁,是数据质量管理、数据安全管理等重要管理措施的关键锚点。然而,数据标准体系在企业具体如何落地,以什么方式和顺序推进,是实际工作中非常重要的问题,良好的数据标准体系也需要在具体环境和组织中找到合适的方法来推进。

数据标准数据治理各项活动的基础。全量的数据在数量上极其庞大甚至庞杂,如果将数据治理的理论和工具直接对应全量数据,成本将难以控制,也难以持续维护和科学管理。数据标准,是企业数据治理理论和方法与实际信息系统和数据的桥梁,是数据质量管理、数据安全管理等重要管理措施的关键锚点。然而,数据标准体系在企业具体如何落地,以什么方式和顺序推进,是实际工作中非常重要的问题,良好的数据标准体系也需要在具体环境和组织中找到合适的方法来推进。同时,数据标准的目标,是基于标准体系对企业信息系统建设和数据化管理过程进行支持、服务和管控。在商业银行的实践中,我们总结为以下三个核心观点:

基础数据在业务层面一致

指标数据在分析层面一致

字典规范在系统层面一致

01 企业通用数据分类框架 业务数字化的过程,就是将企业业务活动过程进行数字化采集的过程。企业的业务活动所产生的数据不是扁平化的,是有着丰富层次的,也是有不同特征和类型的。因此,要进行企业数据标准化,首先就要对企业的数据进行分类研究。在企业数据分类方面,业界有一个相对完整的通用框架,根据数据特性及治理方法的不同对数据进行了分类定义:

内部数据和外部数据;

结构化数据和非结构化数据;

上述数据的元数据。 对于结构化数据,可以进一步划分为基础数据、主数据、事务数据、报告数据、观测数据和规则数据。

1) 基础数据:是用于对其他数据进行分类,在业界也称作参考数据。

2) 主数据:是参与业务事件的主体或资源,是具有高业务价值的、跨流程和跨系统重复使用的数据。

3) 事务数据:是在业务和流程中产生,是业务事件的记录,其本身就是业务运作的一部分。事务数据是具有较强时效性的一次性业务事件,通常在事件结束后不再更新。

4) 报告数据:是指对数据进行处理加工后,用作业务决策依据的数据。它用于支持报告和报表的生成。

5) 观测数据:是通过观测工具获取的数据,观测对象一般为人、事、物、环境。相比传统数据,观测数据通常数据量较大且是过程性的,由机器自动采集生成。

6) 规则数据:是结构化描述业务规则变量(一般为决策表、关联关系表、评分卡等形式)的数据,是实现业务规则的核心数据, 如业务中普遍存在的基线数据。数据分类管理框架如下图所示:

数据分类管理框架图不同分类的数据,其治理方法有所不同,例如:基础数据内容的变更通常会对现有流程、IT 系统产生影响,因此基础数据的管理重点在于变更管理和统一标准管控。主数据的错误可能会导致成百上千的事务数据错误,因此主数据的管理重点是确保同源多用、重点进行数据内容的校验等。 

02 适用于商业银行的结构化数据标准体系 

1.通用数据分类到商业银行数据分类的映射 上文的数据分类为标准化提供了思路,但是就商业银行具体工作而言,还需要进行适度的调整。在商业银行的工作中,为了更多的达成共识,为业务人员和技术开发人员更好的理解,相关的数据分类需要进行一定的本地化。在基础数据方面,尤其是在主数据方面,商业银行更多的是从客户、机构、员工、产品、协议、渠道、资产等主题进行关键数据的管理。一方面是商业银行经历过传统数据仓库建设过程,对类似FS-LDM等概念相对熟悉,另一方面是一些咨询公司也引入过IFW等逻辑模型,相关概念容易理解。同时,人民银行在数据安全分级分类指引中也按照数据主题进行分类。因此,主数据治理是数据标准体系的重要内容,甚至是不可或缺的内容,主数据治理也通常被作为商业银行基础数据管理的基本内容。这其中,同时也覆盖了相应的关键性枚举值代码。不过,枚举值这一重要数据内容,在很多标准理论中,往往被冠以“参考数据”名词,实际上在具体工作中反而不够接地气。重要的枚举值代码,其一部分本身就是商业银行主数据的一部分,因此,这一块也通常被纳入基础数据分类。值得重视的是,业内曾提出了“主数据在交易层面打通”的治理要求,这个和主数据实现跨系统跨业务领域一致的要求是非常契合的。 在指标数据方面,业内通常使用报告数据,而商业银行会使用指标数据这种术语,通过数据加工和维度处理,指标数据贯穿于报表、报告、管理驾驶舱、业务仪表盘已经各种数据应用中,所以,相较于报告数据,指标数据更具共识。在明细数据方面,一方面其具有数据量庞大的特点,另一方面往往和企业的业务术语相结合,也和企业的具体业务流程、产品设计、管理活动相关。具体而言,既可以是业务系统主档数据明细,也可以是具体的交易和流水日志,或是各种业务过程的明细记录,这些数据往往在一个业务领域中出现。因此,企业数据分类需要通过一个构成,映射为商业银行的数据分类,然后进行标准化体系的构建。

2.商业银行结构化数据分类和标准体系 参考关于商业银行数据分类的分析,我们从实践出发制定适用于自身的结构化数据标准体系,具体而言就是包括“两套标准,一套规范”:两套标准指基础数据标准和指标数据标准,一套规范指数据规范(数据字典)。基础数据标准包括主数据和关键代码,这里的主数据指跨系统、跨部门进行共享的核心业务实体数据;关键代码指枚举值数据,包括国标和企业实践。指标数据标准源自各业务部门,在共性的需求上进行提炼,形成公共指标库。指标数据可以分为原子指标、派生指标和组合指标。字典规范是标准的落地实现,要覆盖行内各系统的业务元数据、技术元数据和管理元数据。由基础标准+业务词根+结尾词根拼接而成。“两套数据标准和一套字典规范”的数据分类架构见下图:

商业银行典型数据分类管理框架基础数据标准从技术上要覆盖主数据、关键代码等公用、通用、关键的数据;从业务上要覆盖监管报送、管理驾驶舱等关键应用溯源后的基础数据项。指标数据标准要覆盖业务领域和应用,确保口径统一、溯源清晰。数据字典规范要覆盖业务流程和需求开发活动。

商业银行典型数据标准目标体系

3.商业银行非结构化数据分类 就商业银行的非结构化数据而言,一方面不能简单套用结构化数据的分类和标准,一方面还要结合企业级内容管理的具体情况。通常而言,非结构化数据按照分类包括客户服务过程的音频、视频、文本、影像文件,内部管理过程的文本和文档信息等诸多内容,这一部分数据的管理,更多从个性化、特征值的方面去进行管理。

那么,究竟该如何实施数据标准管理,商业银行在进行基础数据标准、指标数据标准、数据字典规范的管控时,应分别遵循哪些原则,采取什么措施呢,我们下周揭晓,敬请期待。


(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询