睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

如何实施数据标准管理(中)——基础标准和指标标准管理

时间:2022-06-23来源:熊妹妹浏览数:1223

主数据是指用来描述全行核心业务实体的数据,比如客户、机构、员工、产品、协议、事件、渠道、资产、财务、区域。它是具有高业务价值的、可以在全行内跨越各个业务部门被重复使用的数据,且存在于多个异构的应用系统中。

本文将围绕基础数据标准和指标数据标准,展开谈谈在实际工作中如何开展相关管理工作。

01 如何实施基础数据标准管理

商业银行基础数据标准,从数据分类上基本可以覆盖常规的主数据和关键业务枚举值,在实际数据管理过程中,则更应该强调“业务有感”,具体而言就是将基础数据标准管理和业务部门所关注的监管数据管理要求、经营管理数据要求、考核业务分析中的重要数据要求相结合。

(一)基础数据标准体系 1.主数据

主数据是指用来描述全行核心业务实体的数据,比如客户、机构、员工、产品、协议、事件、渠道、资产、财务、区域。它是具有高业务价值的、可以在全行内跨越各个业务部门被重复使用的数据,且存在于多个异构的应用系统中。

上面这个定义相对抽象,在实际工作中,商业银行往往已经通过建设客户信息系统、用户信息系统、产品管理系统等,在一定程度上推进了主数据系统的建设。因此,商业银行的主数据,本质上就是“以谁为准,从谁同步”的数据。其他所有系统都要集中地从某一数据系统获取和同步,并以其为准的数据,就是典型的主数据。代表性的主数据包括客户、机构、员工、产品主档信息。通过系统同步模式获取的主数据,可以在本地进行副本化,只能衍生,不能修改,这个是非主数据系统数据管理的基本原则,也是数据架构管控的基本目标。

商业银行典型的主数据系统如下:

主数据的准入应遵循以下原则:

业务重要性:该数据项为各业务条线、系统、监管报送的关键数据项; 共享性:该数据项被各业务条线、各业务系统间共享; 稳定性:基础标准内容相对稳定,其变化相对交易数据而言缓慢;

可行性:基础标准对象属性的识别应避免过于复杂,以保证数据管理活动的可行性。

识别主数据项的范围,确定主数据的各类属性,包括业务定义、权威系统、主管部门、分类分级等。同时,应梳理和维护主数据项的分布状态与流向,掌握数据采集的源头及调用的系统分布。

2.关键代码

关键代码指代码类数据项,包括数据项的定义、以及代码值域等。

关键代码由国标和企业实践两部分组成。国标如行政区划代码、币种代码、国家和地区代码等。企业实践如产品大类、产品种类、产品小类、客户服务等级、客户风险等级等。

关键代码管理采取如下措施:

1)建立代码管理流程,实现代码的及时更新,尤其是国标的及时更新。

2)新建系统的落标管控,存量系统的SOA对标管控。

(二)基础数据标准管控

下图是企业级数据架构管控流程,其中基础数据标准的管控涉及到数据架构评审、落标管控和数据质量规则监控。

数据架构管控

02 如何实施指标数据标准管理

指标标准是为满足公司各类统计分析、信息报送和经营管理等需要,符合指标标准的准入原则,由各业务部门提出的标准,包括但不限于指标、标签、报表、图表、数据接口等范围。

指标数据的管理目标,一是数据口径统一,避免分歧;二是血缘完整,便于溯源定位;三是维度灵活,便于各种钻取和穿透。

指标标准的准入原则包括:

可行性:指标需适用于分析度量且具备分析价值。 共享性:指标跨业务部门、跨系统使用,在业务层面具有极强的共享作用。 权威性:指标需具有确定的归口部门,能对指标的业务口径进行定义和解释维护。

重要性:指标需反映经营战略方向或者行内重点关注业务领域的指标,对相应领域工作的评价和指导具有重要意义。

(一)指标体系

在传统的指标管理中,指标分散在各业务条线的分析系统中,这种方式存在管理不统一、口径不统一、流程不统一等各种问题。

在构建指标体系的实践中,以维度建模思想为理论基础的标准定义。通过这种标准定义,明确指标口径,消除数据歧义。下面从维度、指标分类两个方面介绍这种标准定义。

1.维度

维度是人们观察事物的角度,反映业务的一类属性。公共维度包括时间、币种、渠道、机构和地域。

维度类型如下图所示:

2.原子指标、派生指标、组合指标

指标类型如下图所示,包括原子指标、派生指标和组合指标。

指标类型

3.指标分类

业务视角:

指标分类-业务视角

技术角度:在指标加工前,需要按照指标标准定义对指标进行分类,并将其拆解成维度和度量。

指标分类-技术视角

(二)指标管理和运营

从需求、开发、运营这三个过程管理角度介绍指标体系的建设和管理过程,包括指标需求分析、指标开发、监测、后评价和下线的全生命周期管理。

1.需求分析

随着数字化转型的不断深入,指标加工需求出现爆发式增长,在需求环节加强对指标的统筹和管控变得越来越重要,而充分的业务调研是需求统筹和管控的基础。首先需要将描述性的业务需求转换为标准的需求模板,实现需求的标准化,然后再定义指标的元信息。标准化的需求和指标的元信息定义包含了基本属性、业务属性、技术属性等。

(来源:金融电子化)

其中,需要重点关注的有以下三点:

(1)在需求提出环节,开展数据需求分析,包括指标的识别和拆解,匹配指标标准,细化指标业务口径定义等。其中一个重要的环节是:业务人员给出业务口径后,需与指标库进行匹配,如果口径相同,需复用已有指标,务必保持口径统一。

(2)需求提出方同时提出数据质量验证方法,包括但不限于往期手工收集数据比对、表内勾稽关系、表间勾稽关系、系统间一致性验证规则等。

(3)需求认责包括指标业务认责和加工点认责。

指标业务认责即对指标业务含义、统计口径进行明确的归口管理。目的是确认指标归口管理部门,且该部门拥有指标在全行范围内的定义权和解释权,该指标的定义和口径在全行范围内使用时需以此为准;

加工点认责即对指标加工区进行明确的归口管理,目的在于保障指标顺利落地实施, 每个指标在全行只有唯一加工点,未来该指标在全行的技术口径统一由该认责加工点的加工结果为准。

2.指标开发

依托数据中台丰富的数据资产积累,以维度建模思想为理论基础,提供自助式、一体化、所见即所得的指标服务,实现了指标口径可解释、血源可追溯、明细可查询,规范指标口径与加工链路,推进标准化、结构化的指标构建,通过多层次的模型设计打造高效的数据服务能力。

多层次模型打造高效数据服务能力

在指标实现时,应考虑到业务人员在各个纬度的统计需要,在机构、产品、时间等维度都需体现,方便在各个维度钻取和穿透。

在指标投产时,加工点在数据中台的指标,开发部门需同步提供指标的加工血缘关系,并且溯源到原始数据提取位置,数据管理部门需制定血缘关系的验证手段。

3.指标运营

指标投产后,可能存在因数据质量、加工逻辑等问题导致的指标数据不准确的情况,为此指标建设团队添加了指标监测模块,将监测条件配置在指标定义中,可以实现规则的可配置和实时监控,确保能够在第一时间发现指标异常情况,有效降低业务影响。


(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询