首页 行业百科 数据库和数据仓库的区别和联系

数据库和数据仓库的区别和联系

|亿信华辰大数据知识库2022-04-20

一、数据库的概念
数据库是数据管理的有效技术,是由一批数据构成的有序集合,这些数据被存放在结构化的数据表里。数据表之间相互关联,反映客观事物间的本质联系。数据库能有效地帮助一个组织或企业科学地管理各类信息资源。
二、数据仓库的概念
数据仓库是指面向主题的,一致的,不同时间的,稳定的数据集合,用于支持经营管理中的决策支持过程。从广义上讲数据仓库是指存储大量历史数据的数据库。每一个记录代表特殊时间点上的一个数据。 它是一种把收集的各种数据转变成有商业价值的信息技术,并把收集的信息体现在报告中。包括收集数据,过滤数据,存储数据,之后把数据应用于分析、报告等应用程序。
三、两者的区别
1)数据库的数据来源来自各种业务系统软件程序的产生的数据,或者是由和这些业务系统软件交互的用户产生的数据。而数据仓库的数据来源则直接是这些业务系统的一个或者多个数据库或者文件,比如SQL Server、Oracle、MySQL、Excel、文本文件等。也可以简单理解为很多个业务系统的数据库往数据仓库输送数据,是各个数据库的集合体,数据仓库的建立是基于这些数据库之上的。
2)数据库在设计的时候很少存放历史数据,通常只是描述某一个业务时刻的数据,随着业务系统的变化而变化;数据仓库为了分析的目的会存放大量的历史数据,因为是每天抽取业务系统数据库的数据每天存放起来,大部分的数据都是静态的。
3)数据库通常服务于业务,数据仓库通常服务于分析。我们通常所提到的数据库一般都是服务于业务应用软件的,不管这些软件是B/S架构还是C/S架构,例如像我们手机上的点餐APP、网上购票的APP,或者企业里面常用到的ERP系统、OA系统等等。特点都是用户在这些软件系统上操作,比如登录、填写个人的信息、修改个人资料、查询一条记录等等。数据通过这些软件程序和背后的数据库进行交互,在底层的数据表上进行增删改查的操作。所以,通常这些数据库是服务于各种各样跑在操作系统之上的各种业务系统、应用软件,更多的面向业务流程、业务管理。
数据仓库更多的是通过各种BI可视化分析工具、ETL工具来访问数据仓库,最终是面向报表查询,数据分析服务的。
四、两者的联系
数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,数据仓库的出现,并不是要取代数据库。数据仓库的本质仍然是数据库,只是为了BI建设和分析的目的在底层表与表的关系建模设计上和传统基于业务系统的数据库建模设计上有很大的差异。传统数据库多增删改,数据仓库多查询分析。传统数据库服务于业务流程,通过业务软件来访问;数据仓库服务于BI分析,通过BI分析软件来访问。
五、如何打造实时数据仓库平台
PetaBase-V作为Vertica基于亿信分析产品的定制版,提供面向海量数据的秒级分析服务,采用无共享大规模并行架构(MPP),可线性扩展集群的计算能力和数据处理容量,基于列式数据库技术,使 PetaBase-V 拥有高性能、高扩展性、高压缩率、高健壮性等特点,可完美解决报表计算慢和明细数据查询等性能问题,实时数据仓库平台主要面向结构化实时存储的应用场景,适合保险,金融等电子化依赖程度高的行业。
认为本内容有帮助
0
您可能需要的数据产品
亿信华辰助力政企数字化转型
customer

在线咨询