亿信华辰

连续3年稳坐商务智能应用榜首

与此同时,亿信华辰在数据治理领域荣登五强

首页关于行业资讯数据可视化

数据可视化之关联分析及其可视化

时间:2019-05-22来源:知乎浏览数:765

随着商业智能,数据可视化这些概念x越来越多被人们所熟知,有很多热情的朋友提出,分享一些数据领域的知识呢?

说说数据可视化

经典案例

数据可视化,亿信华辰

说到商业智能第一经典案例,那我们就必须引出最最著名的故事:啤酒与尿布。

90年代的沃尔玛超市出现了这么一个很有趣的现象:货架上啤酒与尿布竟然放在一起售卖,这看似两者毫不相关的东西,为什么会放在一起售卖呢?

原来,在美国,妇女们经常会嘱咐她们的丈夫下班以后给孩子买一点尿布回来,而丈夫在买完尿布后,大都会顺手买回一瓶自己爱喝的啤酒(由此看出美国人爱喝酒)。

商家通过对一年多的原始交易记录进行详细的分析,发现了这对神奇的组合。于是就毫不犹豫地将尿布与啤酒摆放在一起售卖,通过它们的关联性,互相促进销售。

“啤酒与尿布”的故事一度是营销界的神话,他也成为了商业智能领域传颂的经典,实实在在的让我们体会到数据分析的魅力!


“啤酒与尿布” 这个案例引出的一个概念就是关联分析,而我们将以关联分析作为我们这一系列知识分享的开篇。

什么是关联分析(Affinity Analysis)?

关联分析又称关联挖掘,就是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。

在我们的日常生活中,企业的经营中, 我们常常碰到这样那样的关联性问题:

1. 餐厅里面怎么定义套餐组合?

2. 连接哪两个机场的航线最繁忙和呈现出最高的晚点率?

对于第一个问题,我们就需要用到关联分析的一种典型分析方法 – 购物篮分析。它在零售业,通常用来发现哪些商品在一个事务(transaction)里成交的可能性更大。


首先,让我们举一个简单的例子,来介绍购物篮分析里的关键数据概念:


项集(Items)

在一个购物篮中的一件商品即为一项(Item), 若干项的集合为项集(items), 如{Milk, Bread}构成一个二元项集

支持度(Support)

支持度是指所有项集中同时含有X和Y的概率. 如在全部事务中同时购买了Milk和Bread的概率是2/4=0.5, 即 {Milk->Bread} 的支持度为 50%

置信度(Confidence)

置信度表示在X发生的条件下, Y发生的概率. 如{Milk->Bread} 的置信度为 (2/4)/(3/4)= 0.667



提升度(Lift)

提升度是一个衡量X和Y关联规则强度的重要指标,它反映了商品之间的真实联系。如{Milk->Bread} 的提升度为0.667/(3/4)=0.889

于是,我们可以得到下面的关联模型数据:


接下来就可以看看我们亿信华辰通过数据可视化平台酷屏做出的经典案例,

校情决策支持平台 

为了展现学校的实力,分别从学校概况、师资队伍、教学资源、科学研究、学生发展、就业情况和日常运营的角度来展示。学校概况包括办学条件、师生情况、学科专业和师资力量,再通过荣誉称号、教师编制类别、教职工人数、研究生导师数、高层次人才、职称分布、最高学位分布等展示师资队伍,用教学用房面积、教学经费投入、教学科研仪器、图书资料等来表现教学资源,用著作成果、获奖成果、论文与专利等展现科学研究。

数据可视化平台,酷屏,亿信华辰


快乐分享
功能概览
效果炫酷

内置近百种炫酷组件和3D特效,只有想不到,没有酷屏做不到

开发周期短

提供丰富二次开发接口,组件更新无需重启,周期短、见效快

响应快速

支持动态局部刷新,秒级响应,操作流畅无卡顿

自由布局

拖拽式自由布局,所见即所得的开发体验

操作便捷

内置丰富组件和模板,酷屏制作像拼图一样简单

动态交互

支持钻取、联动等分析功能,动态剖析数据,助力用户决策

© 2020 ESENSOFT 北京亿信华辰软件有限责任公司| 版权所有:京ICP备07017321号 京公网安备11010802016281号|免责声明

联系
电话

您好,商务咨询请联系

咨询热线:400-0011-866转0

手机咨询:137-0121-6790

社区
交流

产品技术问题交流

bbs.esensoft.com

9分钟快速处理问题