首页 亿信华辰大数据知识库 数据集成最常见的两种方法

数据集成最常见的两种方法

|亿信华辰大数据知识库2021-11-18

数据集成最常见的两种方法

由于企业业务需要,每个部门都会建立数据信息系统,但是会存在各个部门的数据以及处理过程呈现分散、孤立,甚至是互相排斥的状态。出现上述问题的原因主要在于各管理信息系统都是孤立的信息系统,即“信息孤岛”。

    由于企业业务需要,每个部门都会建立数据信息系统,但是会存在各个部门的数据以及处理过程呈现分散、孤立,甚至是互相排斥的状态。出现上述问题的原因主要在于各管理信息系统都是孤立的信息系统,即“信息孤岛”。在早期信息系统的建设中,系统在实施过程中都只面向小范围的管理需求,从而在企业或部门中出现一些不同平台、不同技术开发的应用系统。这些系统逐步形成了独立的“信息孤岛”,割裂了业务流程的整体性,使得部门之间不能进行有效的交流。因此,企业信息系统集成问题日益成为信息化建设和研究的重点。本文总结了两种不同出发点的数据集成方法。

基于信息资源规划方法


    信息资源规划是指对企业业务流程所需要的信息,从产生、获取,到处理、存储、传输以及利用进行全面地规划。通过总体数据规划,打好数据管理和资源管理的基础,促进实现集成化的应用开发。
企业信息化建设的主体工程是建设现代信息网络,而现代信息网络的核心与基础则是信息资源网。企业信息资源规划,就是信息资源网建设的规划,是企业信息化建设的基础工程和先导工程。
信息资源规划的要点有:

(1)在总体数据规划过程中建立信息资源管理基础标准,从而落实企业数据环境的改造或重建工作。
(2)工程化的信息资源规划实施方案,在需求分析和系统建模两个阶段的规划过程中执行有关标准规范。
(3)简化需求分析和系统建模方法,确保其科学性和成果的实用性。
(4)业务骨干和系统分析员紧密合作,按周制定规划工作进度,确保按期完成规划任务。
(5)全面利用软件工具支持信息资源规划工作,将标准规范编写到软件工具中,软件工具就会引导规划人员执行标准规范,形成以规划元库为核心的计算机化文档,确保与后续开发工作的无缝衔接。

    可以看出,信息资源规划以企业信息资源为着眼点和出发点,是数据集成实施的一个重要的方法论和实施工具。其实质就是站在战略的角度去思考和整合企业的信息资源,也就是实现了数据集成的要求。它涉及系统工程中的总体数据规划和主题数据库的建立,在这一过程中又运用信息资源管理的标准化方法来组织企业全域的各个数据,从而实现数据的统一化、规范化、交互化、共享化,消除信息孤岛,实现企业全域的数据集成。

基于XML技术的数据集成架构


    主要由五个部分组成,即:应用程序、数据集成中间件、基于XML的虚拟数据源、转换程序和各异构数据源。在基于XML的数据集成构架中,各异构的数据源保存着实际的数据,而集成之后的数据可以看作是保存在基于XML的虚拟数据源中。虚拟数据源可以是物理上存在的,它实际保存将各个异构数据源的数据集成之后的数据。此时的应用程序是通过数据集成中间件直接对虚拟数据源中的数据进行访问。虚拟数据源也可以是物理上不存在的,它只保存有关哪些数据保存在哪个数据源中的信息。在这种情况下,应用程序访问数据要分两步来完成:先通过数据集成中间件从虚拟数据源中取得有关数据的保存信息;再根据这些信息利用数据集成中间件转换程序,从具体的数据源提取所需的数据。

睿治数据集成管理系统

    虽然基于IRP和XML的两种不同的集成方法存在很多不同点,但是,两者并非是对立而不相容的,两者对于企业的信息系统集成来说都是必不可少的。企业信息化过程中的信息孤岛问题,最根本的解决方案是要从战略的角度对信息资源进行规划,IRP是信息化的基础。如果缺乏长远的眼光,单纯依靠XML等开放技术来实现异构数据源的联合,会在很大程度上造成大量数据冗余和垃圾,不利于系统的高效运行。另一方面,随着信息化的纵深发展,对系统的灵活性要求也日益增强。信息资源规划的方法在一定范围内应用效果的确是明显的,但对于过于庞大的系统,如果单纯采用这种方法,也是很难实现的。睿治数据集成管理系统分别运用信息资源规划的方法和基于XML的中间件的方法,实现组织以及跨组织的信息资源整合和信息系统集成。在标准化、统一化的基础上构建出了系统的灵活性以及信息资源的统一和规范。
认为本内容有帮助
0
您可能需要的数据产品
亿信华辰助力政企数字化转型