- 产品
- 产品解决方案
- 行业解决方案
- 案例
- 数据资产入表
- 赋能中心
- 伙伴
- 关于
时间:2019-01-02来源:商业智能浏览数:1055次
1.什么是商业智能?
术语商业智能统称为用于数据收集,集成,分析和可视化的工具和技术。我们从不同数据源收集的原始数据使用BI技术转换为可理解的数据或有意义的信息。该信息通过查找趋势和模式进行战略性解释,以便通过分析数据揭示的事实支持业务决策。
为简化概念,我们从各种来源收集原始数据,并在商业智能工具的帮助下将其转换为有意义的信息。我们可以将这些数据存储在特定数据结构中的数据文件,数据库,数据仓库或数据湖中。从数据仓库,我们可以以报表,查询的形式检索存储的数据,制作仪表板进行数据分析。我们使用称为ETL(Extract,Transform,Load)的过程来完成此操作。因此,企业高管可以在不同级别上使用提取,转换和加载的数据。他利用这一点通过分析数据揭示的有用见解来吸取见解并为决策提供动力。
2.什么是数据仓库?
数据仓库是将数据存储在数据仓库中的过程,数据仓库是遵循关系数据库模型的数据库。从不同的数据源中选择数据,进行汇总,组织和管理,以便为分析和查询提供有意义的数据洞察。处理和管理我们在企业级别使用的大量数据的整体方法。在这种有益健康的方法中,数据不仅仅是从数据源中获取操作或事务任务,而是以我们用于分析和比较目的的某种方式进行转换。
数据仓库由其他几个术语所知,如决策支持系统(DSS),执行信息系统,管理信息系统,商业智能解决方案,分析应用程序。我们将其称为决策支持系统,因为它提供了有用的见解和模式,这些数据通过分析得出数据,从而使业务中的重要决策变得简单和安全。因此,在几乎所有企业中,数据仓库都与操作数据库分开维护。我们仅将其用于交易目的,这在目的上更客观。
3.数据仓库如何运作?
在正常操作数据库中是完全标准化的数据或处于第三范式(3NF)。在3NF状态中,数据库中表的每个字段在功能上仅依赖于主键,并且不包含任何间接关联。这意味着高度分支数据,因此在这种情况下获取数据是一个缓慢的过程。在数据仓库中,数据被去标准化,即它从3NF转换为2NF,因此被称为大数据。我们称之为大数据,因为数据冗余增加,因此数据大小增加。创建数据仓库的唯一目的是快速检索已处理的数据。此外,提供总计数据,如总数,平均数,一般趋势等,供企业分析和制定有利于其业务和行业运作的决策。
4.数据仓库的组件
数据仓库有几个组件协同工作,使数据仓库成为可能。
运营系统:这些是企业中不同的运营领域,它们有着独特的目的,并为企业的正常运作做出贡献。不同的操作系统可以是营销,销售,企业资源规划(ERP)等。所有这些系统都有自己的规范化数据库。
集成层:不得操纵操作系统中存在的规范化数据。相反,我们将数据复制到集成层暂存区域,在该区域中以特定方式操作和转换它。完成的一项基本操作是将复制的数据转换为单一的标准化格式,因为在操作系统中,数据不以相同的格式存在。例如,在数据字段中,数据可以在一个表中以磅为单位,在另一个表中以美元为单位。
数据仓库:转换后的标准化数据流入下一个元素,称为数据仓库,这是一个非常大的数据库。因此,来自整个企业的数据存储在该数据库中以第二范式具有一定的统一格式和结构。
数据集市:这些是数据仓库中特定于目的的子数据库,仅包含整个大数据的某些部分。在每个数据集市中,只有那些对特定用途有用的数据可用,就像有不同的数据集市用于与营销,财务,管理等相关的分析。这些数据库中的每一个都不会彼此重合或共享他们的数据。在每个中执行的操作不会影响另一个。这使得从数据集市中获取数据比从更大的数据仓库中获取数据要快得多。
数据仓库中的数据集市
数据仓库是一个综合数据库,因为它包含处理过的数据信息,可以直接由BI工具进行分析。与此相反,如果直接从数据源获取原始数据,则可能会遇到数据格式不均匀,数据未结构化且未排序等问题。为了防止所有这些发生,数据仓库充当原始数据库和BI工具之间的中间数据源。数据仓库合并从不同来源获取的数据,并为分析提供结构和含义。它还有助于进行数据挖掘,即在给定数据中查找模式。
5.商业智能和数据仓库
数据仓库和商业智能通常齐头并进,因为数据仓库中提供的数据是商业智能工具使用的核心。亿信BI,华为,Chartio,Looker等BI工具使用来自数据仓库的数据,用于查询,报告,分析和数据挖掘等目的。
在任何企业中,商业智能在其顺利和具有成本效益的运作中发挥着核心作用。因此,BI有助于提高运营效率,包括ERP报告,KPI跟踪,风险管理,产品盈利能力,成本核算,物流等。还有助于客户互动,包括销售分析,销售预测,细分,活动策划,客户盈利能力等等
当用户需要与查询相关的数据时,例如订单何时发货?本月有多少产品X商品已售出?等等。使用在线事务处理从传统数据库中获取数据使用(OLTP)。也就是说,当您需要数据作为直接问题或查询的答案时,就会完成此类数据检索。然而,如果您需要更多主观和整体查询的数据,例如影响订单处理时间的因素,每个产品线对毛利等的贡献,则使用数据仓库。从我们之前的讨论中,我们知道数据仓库存储已处理和聚合的数据,这些数据最适合用作上述主观查询的答案。商业智能工具需要来自数据仓库的此类数据。数据通过在线分析处理(OLAP)传输。事实证明,数据仓库和OLAP是使用OLTP的旧决策应用程序急需的跳转。截至当时,数据质量较差,而非标准化格式的非结构化数据。也,分散的数据和从源头检索数据是一个缓慢的过程。因此,几乎所有企业都转而使用OLAP和数据仓库模型。
6. 商业智能与数据仓库的相关性
数据仓库和BI的体系结构
第1步:从传统数据,工作簿,Excel文件等数据源中提取原始数据。
步骤2 :合并并集成从不同数据源收集的原始数据,以存储在称为数据仓库的特殊数据库中。数据仓库在概念上是一个数据库,但实际上它是一个技术驱动的系统,它包含已处理的数据,元数据存储库等。我们从源获取数据到数据仓库的过程是ETL(Extract,Transform,加载)。这将从原始源中提取原始数据,以不同方式转换或操作它,并将其加载到数据仓库中。
步骤3 :如果您希望将数据仓库中的数据用于特定目的(如市场营销分析,财务分析等),则会创建数据仓库的子集,称为数据集市和数据立方体。从数据仓库到数据集市的数据也通过ETL。
步骤4 :从数据仓库和数据集市,数据被重定向到数据或OLAP多维数据集,这些多维数据集的数据已准备好供前端BI工具或客户端使用。在前端,存在BI工具,例如查询工具,报告,分析和数据挖掘。这些BI工具从OLAP多维数据集中查询数据并将其用于分析。
7.当前的商业智能和数据仓库方案
随着技术的变化和随着时间的推移而变得越来越好,数据仓库的替代品也被引入市场。它们是数据湖,ELT流程和自动化数据仓库,可以加快数据处理和分析速度。像Hadoop这样的数据湖和技术遵循Extract-Load-Transform,它比ETL更灵活。每当BI工具需要数据时,我们从数据湖中获取数据并相应地进行转换以进行分析。但是,企业仍然需要数据仓库进行分析,这需要结构化和处理过的数据。
所以,这就是商业智能和数据仓库。
上一篇:初学者数据分析原理...