睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

用数据说话(一)

时间:2022-08-26来源:没那麽简单浏览数:137

判断自己数据化沟通的成效之一,是在meeting或者presentation的最后,看audience能否带着你提供的insights进行一定的决策或者有清晰的下一步规划,这才保证我们的沟通是有效并能解决实际的问题。

01前言

“Claire,我来公司3个月了,你是第一个给我讲清楚这些图表到底是干什么的人。”

“Claire, where do you learn your presentation skills? You did a great job!”

“Your analysis and presentation is very insightful, Claire. I love the way how you presented the findings.”

以上来自我工作中同事、老板对我presentation的评价。在我近三年的数据分析生涯中,数据可视化和presentation一直是工作中的重要部分,present的对象包括但不限于公司内部技术和非技术人员、高管以及客户中的高管。正是这些经验的积累,本文我想针对“用数据说话”这一主题,分享给大家我踩过的坑和有效的用数据沟通的技巧,希望能帮你也在工作中清晰有效的呈现数据。

本文内容受众不只限于数据分析师,因为事实上,不管是金融分析师、产品经理、项目经理、运营专员、市场营销专员或是销售经理,在工作中都或多或少需要向同事、老板、高管、或者客户用数据来展示自己的业绩/项目成果、公司的运行现状或者客户的需求满足。众所周知,数据让你的statement(论据)更具说服力,量化结果也更容易让人留下深刻印象。

但事情没有那么简单,现实是没有良好的沟通表达,对方不一定完全理解你的意思,下面让我们来看看如何“用数据说话”。

02有效数据化沟通的知识点

(一)上下文的重要性

一次好的数据化沟通要从介绍需求背景/上下文开始,比如本次meeting的目标是什么,谁提出了这个分析的需求,需求方想实现什么效果。再者,不同公司、环境、职级的人对同样事物的认知和熟悉程度是不同的,比如说某公司第二季度revenue是$1M,很多人可能并没有概念这个数字的大小、反映的业绩好坏,但如果你加上与去年同期的对比、有没有达到我们的预期(OKR),就会更容易被人理解。

(二)knowing your audience is key(了解你的听众)

通常情况下,对不同audience做的dashboard都是不同的,比如面向公司内部市场和销售团队使用的dashboard,他们希望分析尽量细节(granular),这样他们可以选取对不同客户有效的信息进行pitch(产品推销)或者回答客户关于一些细节指标的提问。但如果dashboard是面向客户企业的非技术人员和C-level的高管来使用,就要更偏向战略宏观角度的分析,作图尤其要注意简单易懂,不仅一张图不要放太多内容,也切忌堆砌图表。

(三)a picture is worth a thousand words(一图胜千言)

有效的图表可以让听众更好的记住你的结论,而一个好的图是不需要使用者思考太多的。下面分享一个技巧和案例:

1. pre-attentive attributes。这是人类大脑对图表处理的一种潜意识表现,比如颜色的不同、深浅,线的长宽大小、方向,形状,2-D散点图等。正是人类的这种信息处理特质,我们应该在数据可视化的时候利用起来,用这些特点来highlight我们想突出的insights。颜色最容易被人们观察到,但不要使用过多颜色,会分散人们的注意力;尽量不使用倾斜的axis label,因为人们需要更多的时间来process,必要时使用缩写;去掉图表的边框而选择用空白来划分边界,因为边框会吸引受众的目光,而我们需要受众的注意力在图标的细节里。

2. 同样的数据,目标不同,选取的图表也应不同。比如我们有麦当劳不同地区不同月份的销售额,如下表(fake data)。

当我想知道哪个地区哪个月销售额最高,一个好的visualization是直接在上表highlight最大值,如下图:

当我想知道哪些数据达到了每月$100K的销售目标,用不同颜色的柱状条形图+目标水平线来展示。注:这里需要先unpivot上表。

(四)数据的粒度(granularity)

任何人都能给出一个数字化的结果,但是注意你数据的level of details/granularity 是保证你结果正确的重要前提。比如下表

同一个电影可能有多个类别,这里不同的类别被分在了不同行。如果要算每个制片厂制作电影的的平均票房,就不能只按制片厂group by算票房的avg,因为同一电影的票房数有重复计算,种类越多的电影,票房的加权也越重。正确的算法是先去重(de-duplicate),保证每个制片厂的每部电影只有一个票房纪录,再按制片厂算票房平均值。

另外,这一点在你需要写SQL进行table join的时候也尤为重要!

(五)actionable next steps

判断自己数据化沟通的成效之一,是在meeting或者presentation的最后,看audience能否带着你提供的insights进行一定的决策或者有清晰的下一步规划,这才保证我们的沟通是有效并能解决实际的问题。

数据分析师在做dashboard时的好习惯

理解你要解决的问题。

先自己想想你需要什么样的数据支持,再看你要从哪些database或者source table 中获取数据。

然后写SQL的时候,对你的结果有一个expectation, run出结果再和自己的expectation比较,起到verify你工作的效果。

数据分析师很重要的一个品质我愿称之为skepticism (怀疑精神)。

很多时候当你看到一个奇怪的结果时(比如近三个月销售额一直在下降),与其立马投入业务分析,不如先去看看这个结果的生成用了哪些数据,进行了哪些数据转化,可视化的操作对不对等等。

如果是数据源头的问题(例如数据捕捉不完整),那就需要先把data pipeline的处理修正,再进行分析。

有时候你甚至会发现业务部门让你做的分析还没开始就结束了…

拿到数据后别急着画图,现实生活中已有的数据很可能不是你直接能用来可视化的数据,你需要进行一定的数据清理和数据转化。

比如算消费者随月份的平均订单花费变化趋势,你一方面要保证纳入计算的数据中销售量>0,另一方面可以观察一下消费者平均订单花费的分布,必要时去掉一些极端值,或者用quantile来表现趋势而不是单一的平均值(易受极值影响)。

03总结

一个好的可视化报表(dashboard)还有很多细节需要注意,数据可视化作为“用数据说话”的重要工具,下一节我们会讲更多的设计细节。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询