睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

主数据管理理论与实施方法

时间:2022-04-18来源:岁忽已暮浏览数:119

在理解主数据、解决数据问题之前,首先,我们要明确到底有哪些数据或哪几类数据?当然,数据按照不同维度、不同语境可以分为不同的类,比如结构化和非结构化化、交易和非交易数据、行业数据和公司数据等。从数据治理或信息化项目的角度,数据一般分为:数据元、元数据、主数据、参考数据、常规数据等。

01 数据治理VS数据管理

在本文开始之前,先解答一个常见疑问,即数据治理与数据管理的关系。虽然当前数据治理的词频热度高于数据管理,但数据治理只是数据管理的一部分。不管是软件能力成熟度模型集成协会(CMMI)发布的数据管理成熟度模型(DMM),还是数据管理协会(DAMA)发布的数据管理知识体系(DMBOK),都有相关说明,比如DMM明确了数据管理工作体系框架,包括数据战略、数据质量、数据运营、平台和架构、数据治理等5大核心域。

虽如此,但数据治理是数据管理不可或缺的重要组成部分。数据治理强调如何让数据资产长期、可持续的发挥价值,因此需要明确职责、流程、权限角色、规范、标准等。

而数据管理范围更广,强调通过人员、流程、技术等方面的协同实现公司层面的数据共享并充分发挥数据价值,数据管理贯穿数据生成、存储、使用、共享、归档、销毁的全生命周期。不同类型的数据比如元数据、主数据等都需要数据治理。

02 数据分类与主数据概念

在理解主数据、解决数据问题之前,首先,我们要明确到底有哪些数据或哪几类数据?当然,数据按照不同维度、不同语境可以分为不同的类,比如结构化和非结构化化、交易和非交易数据、行业数据和公司数据等。从数据治理或信息化项目的角度,数据一般分为:数据元、元数据、主数据、参考数据、常规数据等。

数据(data):根据《信息技术数据元的规范和标准化》(GB/T18391.1-2002),数据是指对事实、概念或指令的一种形式化标示,适用于以人工或自动方式进行通信、解释和处理。

数据元(data element指用一组属性描述定义、标识、表示和允许值的数据单元。在特定的语境中,可以认为是不可再分的最小数据单元,也可以直观理解为数据库表的列,对象、特征、表达是数据元的三要素,比如“今天股市收盘是2500点”数据元,其中“今天股市”就是对象,“收盘”是特性,“2500”是表达。

元数据(MetaData指描述数据的数据,也指帮助查找、存取、使用和管理信息资源的信息。为便于理解元数据和数据元,作者举个例子,比如我们要向中证金融报送两融数据,数据报送接口规范中有许多表,每个表有许多列,每个列有填报要求比如类型、是否为空。每个填报字段可以认为是数据元,而每个填报字段的填报要求可以认为是该字段的元数据,而每个字段可以认为是该表的元数据。也即数据元和元数据本身也是数据,在不同的上下文有不同的定义和理解,本身都是个相对的概念,意识到这点才能很好理解两者的关系。现实中,元数据常见用于描述数据库中所有数据的语境,而数据元通常用在行业标准制定。

参考数据(reference data指数据可能的取值范围及其解释,也即我们常说的数据字典。数据字典虽然很好理解,但行业现实中,由于每个系统有不同的数据字典,甚至同一系统内也有不同数据字典,而且没有统一标准,间接造就了大量的数据孤岛,也需要加强治理。


常规数据(作者自己定义),是与每日业务开展或每个业务人员最为关注的那些数据,比如交易、审计、采购订单、销售订单、报表等等数据,


主数据(master data,通常是不随或很少随时间变化的静态数据,并且与个体活动或流程无关,比如客户、证券标的、金融产品、会计科目等信息,这些信息构成了公司的业务。主数据掌控交易数据如何被处理并决定着决策的精准度。主数据管理,本质上是各业务人员利用IT工具进行协作,来协调、清理、发布和保护企业需要共享的数据资产,保证企业核心信息的一致、准确和安全。主数据也是大数据建设中的重点内容。

为便于大家只管理解四类数据区别,画了一个见图如下,



元数据和参考数据一般与系统或数据库底层设计有关,相对变化频率非常低;而主数据与技术有关,与业务关系更为密切,相对变化频率较低,也是常规数据的基础;而常规数据则变化频繁,只要展业基本都会累加,且实时性要求较高。基于以上分类和分析,作者认为,由于主数据与业务联系紧密且是一般数据基础,加上又有一定变化(频率很低),数据治理的重点领域是上述四类数据中的主数据,这应该也是SAPORACLE等国际巨头反复打磨并推出主数据管理解决方案的原因。


03 主数据管理的难点

主数据管理意义非凡,但是在实践和实施方面还是存在很多的难点,突出表现在以下几个方面:

1)认知不统一,不重视主数据的总体规划,缺乏顶层设计,无法在单位决策层、管理层和业务层等各层级统一思路。

2)各职能部门各自为政,难以在标准和规则层面达成一致,致使主数据代码标准难统一。

3)通用标准主数据(国际标准、国家标准和行业标准产生的主数据)管理分散,缺乏便捷可靠的数据获取渠道,数据获取困难。

4)单位内部已经存在且分散管理的主数据,由于缺乏统一标准和数据关联,大量的数据清洗依靠人为判断,数据清洗难度和风险都很大。

5)企业历史系统和历史数据的数据标准化程度不高,数据清洗难,改造成本高,给主数据系统集成造成较大困难。主数据管理进程需要修改现有的相关生产业务过程和系统,需要从管理学的角度充分调动业务部门密切配合,对组织的业务运营效率和信息决策周期要求较高。

6)主数据管理模式要求业务间有表单数据交换,因此短期内会使得信息架构发生变化,甚至变得更加复杂。

04 主数据管理实施方法

主数据实施要点主要包含主数据规划、制定主数据标准、建立主数据代码库、搭建主数据管理工具、构建运维体系及推广贯标六大部分,其中主数据规划是纲领、制定主数据标准是基础、建立主数据主数据代码库是过程、搭建主数据管理工具是技术手段、构建运维体系是前提,推广贯标是持续保障。

主数据规划:运用方法论并结合企业实际情况,制定主数据整实施路线图。

主数据规划强调将需求分析与系统建模紧密结合,需求分析是系统建模的基础,而业务调研又是需求分析的前提。

在主数据规划咨询的过程中需要参照标准,主要参照的标准有国际标准、国家标准、行业标准、企业标准,确保企业的主数据规划咨询后能够既符合国家相关规定,又具备企业行业特色。

通过现状调研和需求分析等前期工作输出主数据规划成果,该成果主要包括主数据标准化体系架构、主数据集成架构、主数据安全架构(数据脱敏、数据权限)以及运营管理架构(组织、制度、流程、管理规范、质量管理措施等)等内容,此外主数据规划阶段的关键活动是对成果、体系的宣贯,通过宣贯让企业的各级管理人员及员工及时掌握相应的标准、规范,确保整个体系的梳理运行。

制定主数据标准:确定数据范围,与业务部门共同制定主数据标准, 标准内容包括确定分类规范、编码结构、数据模型、属性描述等。

制定主数据标准是建立主数据代码库的基础工作,保障主数据管理工具开发运维以实现系统之间数据共享的前提,也是主数据管理组织及流程顺利开展的关键阶段。制定主数据标准一般遵循简单性、唯一性、可扩展性等相关原则,既要方便当前应用系统的需求,又要考虑未来信息系统发展的需求,此外,制定主数据标准还要根据业务需求的紧急程度分期建设。

主数据制定的过程参考:

1)在理解企业信息化整体规划的基础上,开展主数据标准现状调研,梳理相关业务流程。

2)选取组织架构、业务范围等类似的优秀企业作为标杆进行对比分析,归纳核心管理领域和业务领域的主数据管理需求,确定数据范围和组织范围。

3)要根据各类主数据的特点并结合企业实际情况,与相关业务部门共同讨论制定满足企业应用需求的主数据标准,标准内容主要包括分类规范、编码结构、主数据模型、描述模板、属性取值等。

业务标准的分类是基础,科学合理的分类是制定标准成功的保障,描述标准是数据信息在标准化系统校对的主要依据,其信息的描述是由各信息的属性字段连接而成,可针对数据分类建立标准化的描述模板,有效避免一物多名现象。

建立主数据代码库:按照主数据标准进行数据检查、数据排重、数据编码、数据加载等,建立符合数据标准和规范的主数据代码库。

建立主数据代码库的制定方法可参考以下步骤,第一,确定代码结构;第二,调研、收集各类代码标准;第三,分析、优选各类代码标准并提出规划制定建议;第四,编制规则征求意见;第五;征求部门意见以完善和确认规则;最后,提交规则送审稿。

搭建主数据管理工具:建设主数据管理工具,为主数据的管理提供技术支持,实现主数据查询、申请、修改、审核、发布、冻结、归档等全生命周期管理。

构建运维体系:建立主数据管理和标准管理的运维组织、管理流程、考核机制等,保证主数据标准规范得到有效执行。

推广贯标:统一执行主数据标准规范,扩大主数据标准的应用范围,实现信息系统间的互联互通及共享利用。

05 主数据管理工具

主数据管理工具是主数据标准文本发布、主数据全生命周期管理的重要平台。主数据标准的维护流程和管理措施通过管理平台进行系统实现和控制,以保证标准的唯一性和宣贯的及时性。

主数据管理工具主要包括数据建模、数据整合、数据管理、数据服务基础管理、标准管理等功能模块。

1)主数据建模:主要以主数据标准体系为基准,通过可视化建模工具,定义主数据对象、编码规则、属性值和控制流程等基础要素,构建主数据标准模型。

2)主数据整合:主要利用数据清洗工具及扩展功能,将各系统生成的主数据进行汇集、依据主数据标准和主数据模型定义的规则进行校验、清洗、发布,实现对主数据的全生命周期管理,并整合出统一的、可信任的主数据。

3)主数据管理:按照标准主数据管理规程的要求,通过严格的管理流程,实现主数据创建、审批、发布、修改、冻结和失效等全生命周期管理以及数据字典的管理维护,确保数据的一致性、准确性、实时性和权威性。

4)主数据存储和服务:主数据平台发布的基准数据,集中存储于主数据基准库,提供在线查询和订阅功能,并通过流程驱动和消息驱动的标准接口提供数据共享服务。

5)标准文件资料管理:利用外部公共文档管理系统或内置管理功能,实现标准文件和相关资料的存储管理、版本管理和标准目录管理,配置智能化搜索引擎,实现智能、快捷、精确高效的查询检索功能。

6)基础管理:主要实现对系统中的基础数据进行设置,配置灵活、安全可靠的权限管理及日志管理,包括用户、用户组、角色、资源、流程配置等,以及对各类主数据的进行统计分析,为主数据应用评价提供有力支撑。

06 主数据管理的建议

1、组织架构

如果说数据治理不是技术部门或某一个部门的职责,那么主数据管理更是如此。通过在公司层面成立数据治理小组或机构,比如内嵌在IT治理委员会之中,明确不同部门的主数据管理工作职责,形成主数据管理敏捷团队;建立统一的主数据管理使用规范,合法利用外部数据。

2、建章立制

建立覆盖主数据全生命周期的制度和流程,比如《主数据管理流程》《主数据管理办法》《数据治理制度》等;明确主数据管理相关的清晰角色和职责,建立KPI考核机制。

3、立即行动

主数据管理和经营机构大小无关,且机构越大,主数据管理补起课来,越费力。当然,也不能指望监管机构先出台行业标准或指南,而公司、集团、各个部门在一开始就意识到主数据管理的重要性。需要强调的是,主数据治理与业务关系密切,需要所有业务部门人员参与。

4、系统管理

即便是同一行业,不同公司对主数据的定义也不可能完全一样,主数据的实际范围需要结合公司实际应用和需要来商定。如果主数据管理工作较重或主数据管理已经很精细化,则有必要借助平台或系统来完成主数据的申请、确认、审批、发布等流程。

(本文部分文字内容来源金融科技之道和清水钓翁)
(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询