睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

企业级架构建模系列之七“实体设计原则与方法”

时间:2022-03-27来源:没那麽简单浏览数:798

实体模型使用企业级结构化、标准化的语言,为业务人员提供了业务信息的逻辑视图。与物理模型不同,实体模型更关注业务流程和产品定义,通过实体关系模型反映业务过程。在具体的企业架构设计活动中,应总结一套实体的设计原则和方法,指导建立全行统一标准的业务实体模型。01 什么是实体 实体来源于业务信息需求,是一种基于业务需求管理和维护的抽象或具体的事物,是保存信息的基本数据概念,是业务流程操作的最小单元。实体是一个名词,事物、概念都可以是实体,如人、产品和合约等。实体也可以是用来描述问题答案的基本构成,它回答了企业有什么数据、数据在哪里、数据被谁用、数据来自哪里、如何使用数据等问题,如下表所示:02 实体的分类 实体主要分为以下三种类型:1.基础实体:基本的实体,是形成模型的基础,也称为核心实体;2.属性实体:基础实体的扩展信息,依赖于基础实体,包括描述信息实体、生命周期实体、条件实体等:

1)描述信息实体是核心实体相关的从属实体,描述了核心实体相关的属性类信息;

2)生命周期实体表述了核心实体的状态,状态的变化也是对流程的控制;

3)条件实体是对核心实体的约束性和限制,实现定制化要求以及对流程的控制,是描述类信息的一种特例。3.关系实体:连接相关联的实体,实际也是一种约束,可表述复杂的约束,而且便于扩展。通常在C模型中用于描述实体和实体之间多对多的关系。如下图所示:03 实体的组成 实体模型包括主题域清单、实体关系图、实体清单、属性清单、域、实例组,其中:

1)主题域清单是实体的最高分类,在业务领域内对实体的最高抽象;

2)实体清单包括了实体名称、归属业务对象、以及实体的描述信息;

3)实体关系图是指用关系箭头描述实体之间的业务规则;

4)属性清单是实体的具体描述,实体一般具有多个属性;

5)域是属性值集合的通用表示,用于规范属性的数据类型、长度、取值范围、取值规则等;

6)实例组是指域具有的有限取值范围,而且取值是编码相关的。 04 实体设计原则 识别实体可以通过业务访谈、现状分析或业务需求等方式进行,其关键是理解业务的内涵、关注事务的本质。根据业务关系、业务流程、业务规则等业务概念,识别每个主题域的主要实体。在识别实体时,应遵循以下原则:原则1:C模型实体应包含流程模型和产品模型的核心业务信息,即C模型的实体和属性都能映射到流程模型中的任务和产品模型中的产品条件;原则2:C模型实体应正确表达业务数据的含义及相关业务关系,即C模型要得到业务人员理解与确认;原则3:C模型实体应仅包含基础数据,不包含衍生数据和技术数据;原则4:C模型实体应只归属于唯一一个主题域,不可出现跨主题的实体;原则5:C模型实体应进行一定程度的抽象,使其能灵活支持未来业务需求的变化;原则6:C模型实体设计应借鉴同业先进经验,具备业务前瞻性。 05 实体设计方法 在实体模型设计实践中,一般采用自上而下和自下而上相结合的方法进行建模:方法1-自上而下:业务实体模型用结构化和标准化的方式提供了业务的逻辑视图。从业务视角,分别从流程模型的活动与任务中提炼核心实体,从产品模型的产品条件参数和流程模型的步骤中提炼实体属性,并针对每个实体,在业务领域专家和业务负责人的指导下,识别与其相关的实体,并分析实体间关系基数。方法2-自下而上:从现有系统表获取,将存量物理表抽象提炼为反映业务本质的候选实体,并逐步迭代提升;与流程模型、产品模型相对接,进行候选实体的完整性和正确性提升,进一步扩充实体范围,最终形成各业务领域的高阶实体模型。对于存量库表的识别,要对库表进行分类:

1)按照库表的数据内容可以分为:基础数据表、参数表、代码表、衍生数据表、技术数据表、历史备份表;

2)不能独立存在的数据表要排除在实体范围外,例如技术类,衍生类,历史备份类;

3)对于无法通过现有基础数据加工或者业务关注的数据,可以纳入实体范围,例如客户评级,风险等级等。
(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询

在线咨询

点击进入在线咨询