睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

如何实施数据架构管理

时间:2022-06-27来源:亿信浏览数:498

在企业级建模日益流行的当下,在业务建模、系统建模、流程建模、产品建模等各种建模方法论不断丰富的背景下,数据架构是一个绕不开的关键。如何在商业银行落地“企业级数据架构管理”,与企业的业务流程和IT管理流程形成相适配的管理界面,找到成本最优、效果最好的管控节点,是数据架构管理的核心问题。

架构的本质是解释“组成+关系”,以及围绕这两个核心问题形成的一系列规范和原则。无论是系统架构还是应用架构,都是如此,至于企业级架构,就是在范围层面强调要进行全覆盖,包括广度层面的覆盖和时间维度层面的向后兼容和持续管理。按照这个认识,企业级的数据架构,本质上也是在反馈企业的数据的构成和构成的方式,以及以数据为线索的相关系统和流程之间的关系。同时,因为数据是系统、流程、产品等更为基础性和底层性的载体,数据架构所反映的组成和关系也必然对应了系统、流程和产品的架构。

在企业级建模日益流行的当下,在业务建模、系统建模、流程建模、产品建模等各种建模方法论不断丰富的背景下,数据架构是一个绕不开的关键。如何在商业银行落地“企业级数据架构管理”,与企业的业务流程和IT管理流程形成相适配的管理界面,找到成本最优、效果最好的管控节点,是数据架构管理的核心问题。

01数据架构管理的通用框架研究

1. 数据架构的背景

关于数据架构,此前有多种解读和方案。但是随着业界理论体系的不断完善,以及企业级数据治理工作的不断深入,目前的领先企业、数据治理组织、甚至包括监管机构对数据架构的定义已经逐步统一至四个基本内容,即:数据模型、数据分布、数据集成与共享、数据标准

作为数据架构的制定、管理和维护者,企业的数据架构部门需承担对应的职责,具体而言应该包括:

建立数据模型,包括概念模型、逻辑模型和物理模型; 管控数据分布,包括确定数据源头、主副本数据分布; 明确数据集成关系,包括数据流向、数据交互共享;

梳理企业的数据资产、制定数据标准并持续维护。

成熟的数据架构,可以迅速地将企业的业务需求转换为数据和应用需求,能够管理复杂的数据和信息并传递至整个企业,在数据层面保证业务和技术的一致性,最终为企业改革、转型和提高适应性提供支撑。

表1 数据架构行业参考

2.数据架构内容解析

(1)数据模型

数据模型是数据视角下对现实世界规则的抽象与概括,根据业务需求抽取信息的主要特征,反映业务对象之间的关联关系。

从模型覆盖的内容粒度看,数据模型一般分为主题域模型、概念模型、逻辑模型和物理模型。主题域模型是最高层级的、对数据表达事物本质概念的高度抽象;概念模型是以数据实体及其之间的关系为基本构成单元的模型,通过简化和抽象表达为“实体-关系”(E-R)图;逻辑模型是在概念模型的基础上细化,以数据属性为基本构成单元,数据逻辑在此时替代了实体关系;物理模型则是逻辑模型的落地,是对于真实数据库表的描述,包含了表、视图、字段、数据类型等要素。

(2)数据分布

数据分布是针对组织级数据模型中数据的定义,明确数据在系统、组织和流程等方面的分布关系,定义数据类型,明确权威数据源,为数据相关工作提供参考和规范。通过数据分布关系的梳理,定义数据相关工作的优先级,指定数据的责任人,并进一步优化数据的集成关系。

(3)数据集成与共享

数据集成与共享是建立起组织内各应用系统、各部门之间的集成共享机制,通过组织内部数据集成共享相关制度、标准、技术等方面的管理,促进组织内部数据的互联互通。

数据集成和共享的意义在于识别数据的来龙去脉,使得已经被规整的企业数据真正被使用、有价值,同时也保证数据在使用过程中不变形、数据在生命周期中被维护。

(4)数据标准

数据标准要求企业各部门使用统一化、标准化的语言描述数据,是实现企业数据一致性的关键。数据标准并非孤立一体,而需要演变为渐进的、多面的体系,这个体系应该包括:业务术语、数据标准、字典规范。

业务术语是由业务部门提出的、对于自身业务活动的提炼,最终形成的企业各部门认可的业务词汇。业务术语代表了数据标准的初级形式,通过标准编码、业务定义、分类分级和质量规范,业务术语提炼形成数据标准。在数据标准的基础上,为了对数据模型进行管控而产生了表结构和字段定义规范,即字典规范。

02 适用于商业银行的数据架构管理

行业通行的数据架构四分类,是高度概括的管理架构,在商业银行实际工作中,还需要考虑到银行自身信息化、流程化、数字化不同阶段的情况。商业银行的信息化过程,从各个分行的综合业务系统向总行并表的1.0时代,到总行统一建设以核心业务系统、信贷业务系统、数据仓库系统为代表的大集中2.0时代,再到进一步进行重要主数据系统如客户信息整合和流程化改造的3.0时代,每一个信息化阶段对数据的管理要求有所不同,在数字化程度进一步提高的当下,商业银行的数据架构管理应站在“谁来管,管谁”和“哪里管,管哪里”的角度进行分析。也就是要将简单和高度抽象的“标准、模型、分布、流转”管理针对性的解构,和具体的时间、场景、参与人相结合,把管理目标、管理工具、管理方法说清楚。

实际上数据架构各组成部分之间并非割裂独立的,而是互相影响互相作用的,具体体现如下:

结合企业级数据建模,通过业务建模构建企业级C模型,并通过需求、分析、设计、开发步骤转换为C’模型,最后到D模型物理落地,面向实际应用。通过企业级模型数据分布的梳理,明确数据的权威数据源,确定管理主体、信息采集和存储系统。根据数据分布,围绕数据集成流转关系,形成数据在各个系统之间的流转交互的相关规范原则。

同时以基础数据标准、指标数据标准和字典规范为基础,构建企业数据标准体系,作为数据治理的抓手。

所以商业银行在数据架构管理过程中,应通过编写《数据架构规范》、《数据模型规范》、《数据标准规范》明确管理目标、管控部门职责,对于数据架构四大组成部分制定管理原则并通过流程管控落实到实际工作中去,通过有效的数据架构管控,构建稳定的企业架构,并提升数据能力。

下周,我们将结合实际工作经验分别从管控参照原则、实践落地流程两个维度对数据分布、数据集成与共享的管控进行介绍,敬请期待。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询