- 产品
- 产品解决方案
- 行业解决方案
- 案例
- 数据资产入表
- 赋能中心
- 伙伴
- 关于
时间:2018-12-13来源:亿信华辰浏览数:753次
企业与数据可视化的关系,就好比厨师与菜。如果你是厨师,最重要的肯定是做菜环节,也就分析环节。数据可视化是最后的摆盘环节。
也就说当你的菜做得好吃了,摆盘会是锦上添花,如果你的菜做得难吃,摆盘再好看,那也是下不了口的。如同你的分析报告,你的内容有意义有结论,你把图表做得好看一点,颜色搭配的舒服一点,会给人眼前一亮的感觉。
企业通常会对数据可视化产生误解,以为这仅仅只是面子工程不要也罢,而忽略了可视化能帮助企业做数据分析,支持公司决策。如果可视化沦为了企业的“面子工程”,我想,企业人员就应该反思,是否走入了可视化的误区?一张“不完美”的图表其成因是多方面的,可能是由于数据和图表类型不匹配,也可能是配色等参数设置不当……下面辰哥将介绍6种常见的可视化误区,帮助大家重新审视自己的可视化作品或阅读过程。
你的图表真的与你选择的数据相匹配吗?这是数据可视化的首要考虑因素。针对已有数据,首先想想:我想要展示的是趋势抑或是占比?是分布还是比较?实际上,这个问题才是最难的。
图表的类型多种多样,每一种图表意义和特点不尽相同。如,饼图是展示占比的最佳选择,线图则常用于数据变化趋势,对于大量数据的分布情况则通常用散点图。
可视化不能乱点“鸳鸯谱”,不合适的图表往往不能准确的传达意义和信息。如下图中,我们可以知道是在表示日料中各种菜品的价格走势,从味增汤一路增长到生鱼片,最终跌落至茶碗蒸。这张图表显然用柱状图来表示价格的高低更加合适,而不是用线图来表示趋势。
我们先来看看苹果乔布斯2008年的一次演讲,你能发现其中的“障眼法”吗?
没错,下方Apple手机的市场份额显示为19.5%,看起来比其他手机品牌份额21.2%的占比还要大。(辰哥要在此小小的感叹一下老乔的混淆视听,心机得一匹啊!)乔布斯利用三维图表效果,强调了Apple品牌的数据,能让受众产生混淆。
同样,我们在其他地方也使用过不少的三维图表。但是三维图表在大多数场合并不十分适用。尤其是在强调数据对比分析的应用场景中,三维图表在给读者带来酷炫视觉效果的同时,往往会扭曲数据本身的真实性,从而影响受众对结果的判断。
以如下平面饼图与三维饼图为例,我们来看看三维图是如何施“障眼法”的:
如上图,平面饼图与三维饼图数据一致,但是平面饼图由三个120°等分的扇形构成,而转换成右侧三维饼图后,灰色填充的扇形角度则大于120°,红蓝两色填充的扇形则分别小于120°。这样带来的视觉效果会给人带来错觉,灰色填充的扇形对应的数据大于红蓝两色填充的扇形对应的数据”,而事实上三个扇形对应的数据是相等的。
这个原理其实很简单,人们肉眼所见的三维物体,远小近大。同样,企业在接收三维图表时,也应该保持警惕心理。
地图是可视化中常常需要使用的图例。地理可视化的一个关键点就是通过地理区域的划分,便于读者查看不同地理区域的数据分布情况。通常地图会给不同区域着色(比如渐变色)来展示人口、投票情况以及用地域来划分的其他数据。比如用红色和蓝色分别表示投票的不同结果。但是问题在于,区域的大小不见得与图表的议题相关,有时甚至会有误导之嫌。
我们以美国2012年美国总统大选结果为例,来看一下地图容易产生的误导。很多电视台和网站都在使用这张地图来显示美国2012年总统大选的结果:
根据投票,支持民主党(奥巴马)获胜的州为蓝色,支持共和党(罗姆尼)的州为红色。对于执政党着色,我们比较关心的实际上是支持各党派的人口。但是人口与土地面积不一定是正相关。上图乍一看,全美国,红色的州占了大部分的面积,会让人误以为是红色为代表的共和党获胜。但实际上这些红色的州绝大多数地广人稀,平均人口远远小于蓝色的 州。蓝色的州,有些虽然面积很小,但是人口众多,是决定选举的决定因素。
我们常常看到许多报告使用进阶图表,如“堆叠柱状图”、“堆叠面积图”等等。“堆叠图表”即在同一坐标轴,将数据进行堆叠放置。除了底层的数据,其它数据的起始点并非是0,而是在上一层数据的基础上。
以下房地产行业薪酬报告中的堆叠面积图为例,我们会误以为以下两类数据随着时间的推移似乎都在增大:
然而转化为折线图之后,可以看出房地产行业的薪酬水平实际上是有所下降的。幅度并不是很明显,也似乎有反弹趋势,但是相对堆积图是否更容易能比较出走势与差异呢?
事实上堆叠图的用途更接近于比较相对性(百分比堆叠柱状图就是一个好例子),类似饼图等,同时它有类似线图的走势特性所以适合用来比较各种资料间时序上的比例大小。
我们先来看一组彭博商业周刊( BusinessWeekly )在2011年发表的一组经典图:一座山脉走势与纽约某山案件比率的吻合——这太惊人了!原来纽约谋杀犯罪率跟山的走势相同!
彭博周刊用这一篇图表说明了相关性与因果关系的误用,山脉的走势可以预测犯罪率的变化吗?答案显然是不行。
在制作图表时,你可能会有一些有趣的想法跟发现。比如试着叠合人口数与年收入?好像人越多的地方收入越高。只要你愿意,你可能总会找到某两个事件发展趋势的一致性。但千万要记住:你也许可以发现什么,但这不代表你证明了什么。造谣有风险,编故事需谨慎。
为了图表的美观,图表的细节设置也需要我们费一番功夫。比如柱状图每个柱子之间的间隔太宽或太窄都不好看,应该根据柱宽而设置间隔宽度。而在配色方面,渐变色则是又好看又简单的配色,切忌在可视化中使用花里胡哨而没有实际意义的配色,从而喧宾夺主,将读者对数据本身的注意力转移了。辰哥之前写过一篇关于图表配色的方案,大家可以作为参考:get最chic可视化配色方案,图表也能成为时髦精
看起来好像很复杂的样子,但是憋方鸭!豌豆BI作为亿信华辰打造的一款敏捷自助数据分析工具,完美规避了许多用户制图中可能遇到的问题。我们内置了数十种图表模板,企业任一业务人员无需编程即可上手制作可视化图表,并支持一键选择统计方法,如最大值、最小值、排名、比重、同比、环比、上期、去年同期等,满足各类用户对业务数据综合分析需要。还不赶紧上车!
数据可视化涵盖的内容很多,比较普遍的就是自动化的监控看板,敏捷式开发也是近一两年的热词,意思是不需要每天都做日报、月报、周报。一次开发,自动形成推送。这样可以使数据分析师从中解放出来,更多去思考数据驱动业务发展,而不是困在取数的阶段。
数据分析的最终意义是推动决策,那么如何才能帮助管理层节省这个时间辰哥觉得是非常重要。在合理与适度的运用下,数据可视化就是管理者在和时间赛跑的帮手。