睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

数据建模方法标准及在装备管理领域中的应用

时间:2022-02-09来源:拥你久暖浏览数:312

数据建模用于定义和分析数据要求,支持信息系统设计的过程。装备管理数据建模主要用于两个方面,一是支撑装备管理信息系统建设和数据交互,二是服务于装备大数据业务分析所需的数据结构框架。技术发展促进信息系统的升级换代,数据是可继承的资产,需要持续维护、管理、分析和挖掘;数据建模是信息系统设计和业务分析的核心要素,直接影响系统的架构设计和技术特性;所以,深入剖析业务本质,抽象对象模型表达,设计科学、合理、可扩展的数据架构和数据模型,是数据资产建设的基础,是业务系统设计的重中之重。作战装备结构复杂、研制周期较长,装备管理涉及要素多,不同装备类型研制管理模式和部门分工不同,依照业务流程设计的信息系统结构和逻辑也不尽相同,在数据交互和关联分析时,出现信息融合困难、关联度低等问题,归根到底还是数据建模是否科学、合理,包括是否顶层设计、合理抽象、横向考虑、适当超前超宽规划等。

体系结构设计方法体系

结构框架是体系结构设计方法学的别名,为开发、描述和沟通体系结构提供指南、模型和规则。最早是上世纪80年代J.A.Zachman提出的企业体系结构框架“扎克曼框架”,面向作战美国国防部先后开发了C4ISR和DoDAF体系结构框架[1],基于美国国防部的信息管理技术架构The Open Group组织开发了面向复杂组织信息系统设计参考的企业架构框架TOGAF等。体系结构框架提供了信息系统设计和实施的一般方法和步骤,其中对数据框架和模型都有不同程度的单独论述,作为方法论都可以作为数据建设自顶向下设计、循环迭代开发的参考,也为数据建模提供了顶层视图和全局思维方式。

01 TOGAF 开放组织结构框架

TOGAF是用于开发组织架构的一套方法和工具,支持最佳实践和一套可重用的架构资产。它将架构域分为四个关键领域:

1)业务架构,定义业务战略和组织,关键业务流程以及治理和标准;

2)应用架构,为部署各个系统提供蓝图,包括应用程序系统之间的交互以及与基本业务流程的关系;

3)数据架构,记录逻辑和物理数据资产的结构以及任何相关的数据管理资源;技术架构,描述了支持关键任务应用部署所需的硬件,软件和网络基础架构[2],如图1所示。其中,数据架构,需要清晰理解业务功能、流程和服务如何使用数据实体,以及在哪里如何创建、存储、传递、转换数据。

图1 TOGAF关键领域架构

图2 DoDAF 体系架构六步法

参考步骤如下:

1)选择参考模型、视角和工具,包括确定总体建模流程、识别所需的数据构建块目录集、识别所需的矩阵和图、识别待收集的需求类型,形成数据目录集、数据权限矩阵、数据实体业务功能矩阵、实体关系图和类图、数据架构视图(概念数据图、逻辑数据图、数据传播图、数据生命周期图、数据迁移图、数据安全图)、数据需求类型等。

2)开发数据架构描述,包括基线描述、目标描述、差距分析、候选路线图、分析架构影响、利益攸关者审视、确定数据架构、定义架构文件,形成业务数据模型、逻辑数据模型、数据管理流程模型、数据实体业务功能矩阵、数据交互需求等。

3)输出结果细化和更新,包括草拟的架构工作说明、数据原则、架构定义文件、架构需求规范,和数据实体/数据组件目录、数据实体/业务功能矩阵、应用/数据矩阵、概念/逻辑数据图、数据传递/安全图、数据迁移图、数据生命周期图。TOGAF给出模板式数据架构设计方法,衔接业务、应用和技术架构,保证需求和架构的整体性、步骤和操作的规范性,且要素齐全,是信息系统正向设计的规范表达,在信息系统设计数据建模过程中可直接参考。

02 DoDAF 美国国防部体系结构框

架美国国防部体系结构框架(DoDAF)2.0版是一套顶层的、全面完整的框架和概念模型,聚焦于关键国防部决策者所需的体系结构数据和信息[3]。DoDAF V2.0提供了体系结构开发6步方法论、DM2本体模型、概念模型和元模型数据组、视角和模型[4-5]。美国国防部 DoDAF是以数据为中心的体系结构设计方法,通过典型的全景、能力、数据和信息、作战、计划、服务、标准、系统等8个视角为各利益相关方提供决策视图,构建了一套数据建模方法支撑数据采集、汇总、分析、展示,包括:

1)基于DM2基础本体的数据建模方法论,将顶级基础本体元素抽象为事物、个体、类型、组合;

2)将整个国防部领域对象概括为条件、规则、活动、资源、能力、计划、位置等 24个关键概念,形成概念级体系结构框架数据元模型,见图3;

3)按照业务概念域描述概念关系,形成执行者、资源流、信息和数据、规则、能力、服务、组织结构、谱系等11个数据组和52个视角模型;在数据交互规范中,给出领域概念和概念关系的全貌。

DoDAF 以数据为中心的体系结构方法,非常适合大数据建设或决策系统建设参考。其定义的DM2基础本体、领域概念、领域概念关系,是自顶向下、高度抽象的建模方法,保证整个数据模型的体系性和一致性;其定义的数据组元模型描述、视图元模型图,是对业务领域实体及关系的描述,信息系统设计数据建模可直接参考。

图3 DoDAF2 概念数据模型

数据建模抽象方法

根据GB 18391和GB 32392中的定义,元数据是定义和描述其他数据的数据,元模型是描述模型的模型。在信息技术标准中,元是相对的概念,是对数据、结构进行抽象的表达,以适应信息系统的设计和开发。

01 元数据概念与标准

GB 18391《信息技术 元数据注册系统》系列标准是对元数据注册系统的一个定义,用于管理数据的语义。包含六个部分:

1)第一部分对数据的表示、概念、含义以及它们之间的关系进行形式化描述,使任何机器都能理解;

2)第二部分确定了一系列原则、方法和程序,用于规范在为各类管理项与一个或多个分类方案间建立关联时至少要的记录信息;

3)第三部分规定了数据元的基本属性,包括定义、说明及内容等,保证对数据元有共同的认识;

4)第四部分规定了构建数据和元数据定义的要求与建议;

5)第五部分规定了对数据元概念、概念域、数据元和值域等管理项的命名和标识;

6)第六部分规定了对不同应用领域的管理项进行注册和赋予国际唯一标识符的规程。标准的第一部分给出了数据元的基本模型,包括数据元概念和表示,其中概念又由对象类和特性组成,见图4。

图4 数据元的基本模型

对象类是我们希望采集和存储数据的事物,对应描写对象模型中的类,对应实体-关系模型中的实体;特性对应类和实体中的属性。这就是信息系统数据建模的抽象用法和基本概念,可直接用于装备管理的数据建模。标准的第三部分给出了数据元属性的常规描述符集,包括名称、定义、约束、条件、最多实例数、数据类型、最大长度、字符集、语言和备注等;和数据元属性的基本属性,包括标识类、定义类、关系类、表示类和管理类等。在数据建模的过程中,定义、关系和表示类的属性是基本要求,标识和管理类的属性在建大系统的数据模型过程也要遵循。

02 元对象设施与标准

GB 32913《信息技术 元对象设施》定义了元模型、接口集合,可以用来定义和操纵一组可互操作的元模型以及它们对应的模型。它是一种抽象语言,用于说明、构建和管理技术中立的元模型;是一种框架,用于实现拥有由元模型描述元数据的存储库和集成框架。MOF 研究的中心主题是元数据管理的可扩展性,提供支持任何种类的分层元数据框架,给出了经典的四层建模体系结构,通过递归地将语义应用到不同层次上,完成语义结构的定义,为元模型扩展以及实现提供体系结构基础,如图5所示。

图5 MOF 典型四层建模结构

每层具体描述如下:

1)信息(对象)层 (M0)的信息包含了用户希望描述的数据。

2)模型层(M1)包含了描述实例层数据的元数据。元数据聚在一起形成了模型。

3)元模型层 (M2)包含定义了元数据结构和语义的描述信息(即元元数据)。元元数据聚在一起形成的元模型是一种抽象语言,可以用来描述不同类型的数据。

4)元元模型层(M3)包含描述元元数据结构和语义的描述信息。换句话说,这是定义不同类型元数据的“抽象语言”。构建适用于装备全寿命周期管理数据建模的元模型,按应用领域泛化形成业务数据模型,对应的装备全寿命周期数据模型的M0、M1、M2层见图6。

图6 MOF 技术映射

1)M0层信息包含了装备管理信息系统存储的各类装备、器材、计划、项目等的具体数据;

2)M1层包含了描述实例层数据的元数据,聚在一起形成预研科研、采购接装、使用维护、退役报废等数据模型;

3)M2元模型层定义装备管理所需的元数据结构和语义的描述信息。装备管理数据建模工作量大、涉及要素众多,建立规范一致的建模规则和具有普适性参考模型意义重大,可保证具体业务领域数据建模过程中的一致性和体系性。DoDAF中的DM2本体模型本质上就是所有数据模型的元模型,支撑各种具体对象和业务的数据建模,保证美国国防部规划、指挥、采办、保障等系统数据汇总分析和共享交互。

数据模型管理与评价

体系架构设计方法强调迭代完善,数据管理和数据模型管理也是其中的一个方面。DAMA国际和GB36073中,都将数据模型迭代设计和评价完善作为一个重要内容。

01 DAMA 数据建模与设计过程

国际数据管理协会(DAMA国际)编制的《DAMA数据管理知识体系指南》将数据建模定义为发现、分析和确定数据需求的过程,用数据模型的精确形式表示和传递这些数据需求。

1)在建模方法中,推荐了关系、多维、面向对象、事实、时间序列和NoSQL等6种表示模式,概念、逻辑、物理等3层模型,描述了数据建模和设计过程的基本概念、目标和原则。

2)在规范化抽象化要求中,DAMA强调规范化和抽象化,规范化强调了每个属性只在一个位置出现,以消除冗余和不一致性,对应于每个层次的主键和外键,阐述了三范式、BCNF 范式和四五范式;抽象化强调了对重要和本质属性的保留,对细节的移除,以便更广泛情况下的扩展性,包括泛化和特化、超类和子类的运用,使模型具有良好的扩展性、减少冗余。

3)在建模活动中,DAMA强调了建模规划、正向逆向建模、模型审核、模型维护等过程,把模型作为长期工作保持最新状态[6]。详细见图7。装备管理领域庞大,其数据模型的确需要一个数据组织进行全寿命周期的管理和维护,一方面保证业务需求对数据的正确理解,另一方面管理数据模型的状态有效性。良好的数据建模能够降低开发和维护成本,增加未来需求重复利用的可能性。

图7 DAMA 数据建模设计

02 能力成熟度模型评价方法

GB 36073《数据管理能力成熟度评估模型》是对组织和机构进行数据管理能力成熟度评估的标准方法,规定了从数据战略、治理、架构、应用、安全、质量、标准和生存周期等8个能力域进行评估。与数据模型有关的在数据架构和数据标准中描述。1)数据架构包括数据模型、数据分布、数据集成与共享、元数据管理等4个部分,其中数据模型从粒度上分为主题域、概念、逻辑和物理模型,从应用上分为组织级和系统应用级数据模型,过程上包括收集和理解数据需求、制定模型规范、开发数据模型、数据模型应用、模型符合性检查、模型变更管理等。2)数据标准包括业务术语、参考数据和主数据、数据元、指标数据等4个部分,业务术语是组织内部理解数据、应用数据的基础,数据元标准保证数据拥有者和使用者对数据有一致的理解。能力成熟度评价模型一定程度上就是数据管理的目标,其中对数据模型的要求就是数据建模的目标。装备管理数据建模也要能够指导装备应用系统的结构设计、编制数据模型规范指导数据模型开发、建立统一数据资源目录方便数据查询应用、跟踪预测需求变化和属性同步更新机制。

装备管理数据建模建议

01 装备数据建模需求目标

不管是TOGAF还是DoDAF,都强调对组织战略目标的支持和系统循环迭代的过程。装备工作的核心问题是解决“任务目标”与“装备资源”之间的矛盾性问题,即围绕面向作战的要求,以作训任务的保障和完成为目标、以装备能力的生成与保持为导向,对各类资源进行优化调配和使用。装备全寿命周期管理数据建模主要面向信息系统研制和大数据建设需求,在业务层面,数据建模应能够表达装备管理计划与状态的偏差、装备系统能力与结构组成;在技术层面,数据模型应能够满足装备系统与管理业务数据间的集成交互、多维跨域的数据横向关联分析和多层次的数据决策支持。

02 装备管理数据资源体系

对应于DAMA和数据管理能力成熟度评价标准,对组织架构、业务流程和数据要素等的全面性、关联性、追溯性等提出整体宏观的要求,如数据目录、数据需求等的组织和记录。装备工作是一个多层次、多维度的业务体系,立体交织,融汇一体。可从三个维度对数据资源体系进行分析梳理:一是管理维度,以规划计划为中心调配资源、安排项目,在规定的时间、经费约束条件下,确保使命任务和战略目标的实现;二是全寿命维度,主要包括需求变更、研制状态、列装部署、使用维护、退役报废等方面;三是对象维度,按照配套形成能力的各类装备资源或管理对象进行细分。系统分析装备全寿命周期管理全业务过程,梳理装备全寿命周期数据来源、分布和形态,形成科学合理地装备数据目录;深入剖析装备内外部数据及其关联,标记数据之间的关联关系,围绕装备管理业务和装备系统能力两条主线,形成范围覆盖全面、要素关联一体的装备全寿命周期数据资源体系[7]。

03 装备管理数据模型设计

GB 18391元数据和GB 32913元模型的建设一般步骤都对数据的描述、模型的抽象、格式的规范等提出要求,尤其是元模型的四层结构及其逐层抽象描述的严谨逻辑,有力保证了整个数据模型的体系性和一致性。首先,根据装备数据资源体系的划分,抽取与装备全寿命周期管理密切相关的对象,并将对象分类和抽象。构建适用于装备管理数据建模的元模型,为数据建模提供规则和约束。参考MOF,构建装备管理元模型,至少包含以下几个元素:

1)对象,包括装备、器材、设备等实体和采购、维修、训练等活动;

2)关系,包括包含、前后时序、重叠、超子等关系;3)属性,对象和关系的描述,如名称、编号(型号)、价格、时间、地点等;4)约束,是业务层面的规则和限制,如制度、规程、有效构型状态等。其次,建立装备管理业务和系统能力两个核心参考模型,抽象概况出装备管理普适性的对象关系,用于具体业务领域数据建模的参考。

1)装备管理业务的核心是在有限资源、时间等约束下,综合军队和研制部门力量,规划开展提升装备技战术指标、装备数量质量、保持和生成装备战斗力的管理活动。

2)装备系统能力的核心是提高装备系统作战能力,包括围绕战斗力生成的装备作战能力、装备编成与作战能力、装备状态保持、人员训练能力等。最后,根据具体业务流程分析结果,满足元模型规则约束,参考装备管理业务或系统能力参考模型,建立每个具体装备业务的数据模型。以维修作业为例,通过顶层战训目标生成维修规划和年度作业计划,并下达给基层维修部队,专业技术人员使用测试设备通过检查确认装备状态,有故障发生时通过隔离、测试等定位故障件,参照维修规程进行复位、换件、调试、测试等操作,保持装备的状态和能力。如图8所示。

图8 装备维修作业数据模型

04 装备管理数据标准化

管理数据管理标准是对数据需求、模型表示、技术要求等以特定形式发布作为共同遵守的准则和依据,GB36073中数据标准是解决不同单位和不同用户之间对业务术语、参考数据和主数据、数数据元、指标数据等定义和理解的一致性问题。装备管理数据标准中的业务术语和数据元标准可以协同制定,同时要给出术语和元数据的管理制度,包括定义、审批、发布、维护的程序,以便在整个组织内统一管理、共享和应用;装备管理数据建模的结果可以定期更新发布,也可以参考GB 32392《互操作性元模型框架MFI》标准对数据模型进行注册管理。装备管理数据标准的建设,需要组织各部门和研发各单位共建共享共用,建议采取以下措施:

1)首先,需要组织制定数据制度办法,确立需求方和技术方的权责关系;

2)其次,需要制定顶层的规则规范,保证各类数据标准相互之间的一致性和规范性;

3)最后,用户单位、需求团队、技术团队之间要通力合作,保证用户要求和技术实现的符合性。

目前某工程数据标准仅定义了对象类和业务类数据模型,覆盖的广度和工程深入度都不够,个别领域的用户参与度、技术单位之间的协调等都比较缺乏,最后的实现和实施效果大打折扣。

结束语

数据建模在信息系统建设的设计阶段,决定了整个数据架构的稳定性、易用性、灵活性和鲁棒性,对后续装备大数据建设影响深远。装备管理信息化建设是常建常新的复杂工程,数据作为信息化建设的成果体现和长期资产,需要体系结构设计保证其全面性、体系性,需要严谨的抽象建模方法保证规范性、可扩展性,需要一整套运行管理机制保证权威性、可持续性,这样的数据才是能够改善运行机制、提升管理效率、提高作战能力的装备资产。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询