“数据可视化”
是一种使用技术手段表达数据分析师想法的艺术方式
大部分初学者理解的数据可视化≈画图表,这是十分“奶义务”的想法:数据可视化是一个需要理解数据、数据结构、数据交互原理、数据表达逻辑的复杂工作。在数据可视化之前,我们需要对原始数据进行大量的整理及精细化处理工作,这一步的技术平台首选数据库SQL。除了一般图表,数据可视化有两个方向很值得去尝试:商业智能BI与复杂交互式图表。
所以在这儿我推荐一个数据可视化的技能路线:
接下去将以“双十一美妆数据价值挖掘”为案例,分点来介绍大数据分析库—PetaBase、商业智能亿信BI、Echart。
-
为什么很多数据类岗位都要求求职者具备SQL技能?
互联网公司每天都需要处理大量数据,这些数据不可能都存储在某个人的PC上。在这种情况下,方便协同工作的数据库SQL成为通用的数据管理平台。
比如我们来看一个例子 :
“双十一美妆数据价值挖掘”
在数据可视化之前,我们需要对数据进行大量的处理工作,以“双十一淘宝订单数据”为例。
其数据量为27000+,包括7个原始字段:
下图演示的是使用最强大的大数据分析库—PetaBase处理数据的流程(演示是在Sublime中书写SQL语句,在psql中执行代码):
创建数据库并导入csv数据
查看并删除相关缺失值
列明修改及计算双十一商品打折折扣力度
对于SQL,处理几万条乃至更大体量的数据,效率都是非常高,并且代码不长,易于理解。
回到可视化,SQL作为数据可视化工作的第一步,完成了数据管理及清洗工作。
接下来我们来看看另外两条路:用商业智能BI做数据商业价值挖掘 or 用交互式图表表达数据内容。
亿信BI —— 最好用的商业智能工具平台!
如果你是一名市场数据分析师:需要分析产品销量、地区排名、供需关系
或者是一名用户研究分析师:需要了解客户画像、用户组成、用户习惯
亦或是一名产品运营分析师:关注在线人数、用户日活、活动反馈
你都经常需要做一件事——向你的同事、老板、甲方表达你的研究成果。
这个时候商业智能BI是你最好的选择。
商业智能BI是目前各大公司常用的数据工作和数据可视化平台。它可以将数据进行快速准确的整合,并提供出结果图表及决策依据,辅助决策。
而对于BI,目前最主流的工具平台就是亿信BI,适合中国人的大数据分析软件。作为国内自主知识产权的商务智能工具,大数据分析软件亿信BI专为中国式复杂报表量身打造。类Excel在线设计器,支持多级表头、表元合并,多级浮动、分组、斜线表元、多表体等复杂的报表样式。纯Web应用,通过浏览器上简单的拖拽和拾取,即可随心定义任意”格式复杂,信息量大”的中国式复杂报表工具。
接着上面的“淘宝双十一数据案例”,该数据在清洗后,一共有19个品牌3196个商品,那么如果想了解不同品牌在双十一的营销手段(如“最大打折力度”、“销售相关KPI指数”),可以通过亿信BI来创建以下仪表盘:
核心指标及KPI框架设计
相关图表制作
仪表盘设计及结果呈现
BI可以解决大部分可视化业务的需求,但它始终是既定好的图表,只能优化组合,无法自由创作。数据可视化作为一种表达艺术,自然有更自由的工具和更有趣的表达方式
用一张图来讲故事
复杂交互图表是一种蕴含更大体量数据及更复杂数据结构的可视化,可以使读者和可视化图表之间有更好的互动。其形式包括地理空间可视化、层次关系网络可视化、基于时间的多图表可视化等等。
使用Echarts的工作流可以简单概括为:使用SQL将数据处理成合适的格式(这个格式称为JSON),再读懂echarts图表中的JavaScript参数,修改对应参数并加载JSON数据,实现可视化效果。