睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

整理一套实用的数据分析方法论,超全面!

时间:2022-05-09来源:不落若殇舞浏览数:163

有了数据分析框架后,需要对数据分析框架里的数据进行详细定义规范,确保每一项数据的统计口径是准确无误的。


当前职场中,数据分析不止是一个岗位,更是一种通用且重要的技能。

我们经常会遇到各种数据分析场景:

上线前,老板会说:做一个数据分析?评估下预期。

上线中,功能表现的不理想,老板会说:数据往下掉了,做个数据分析看看为啥?

上线中,功能表现的好,老板会说:做的不错,做个数据报告统一汇报一下。

OMG,你看,不会数据分析,寸步难行!

当然互联网上有非常多数据分析的心法和教程,我大概总结了一下,大致有两类:

一种是偏纯理论形式的;比如如何用spss做主成分分析,专业高大上,怎样应用勒?完全没有时间系统学习有木有!

一种是偏形而上的,告诉你数据分析,首先要基于数据调研,然后数据验证巴拉巴拉的,给你一种道理都懂,依然过不好这一生的错觉。

因为自己从业数据产品多年,数据产品的一个基本工作就是把分析结论抽象成数据产品,帮助业务进行数据洞察;自己也大大小小做过非常多的数据分析,我就在想:是否可以基于自己的经验,总结出一套标准的数据分析方法论,帮助行业内的小伙伴更清晰的知道该如何做一个完整的数据分析?

当然,这次对自己的这套方法论也有一些自我要求:

一定要从实际出发的那种,要有一个案例贯穿始终;

一定要有可复用的结论,并且是不形而上,夸夸其谈的那种。

于是乎便有了此篇文章。

本文将以外卖流量分配分析作为案例,深入讲解如何完整的做一个数据分析。

数据分析的本质是解决某一个业务问题。解决业务问题的前提,一定要想清楚两件事情:

理解问题:想清楚这个问题到底是什么

定义问题:用数据拆解出这个问题

我见过太多小伙伴做数据分析的时候,根本就没搞明白为什么要分析?要分析的这个问题到底是什么?

所以,在分析之前,一定要花时间了解这个数据分析到底解决了什么问题。

这个问题,在定义清楚后,需要和业务方、leader去反复沟通,直到对这个问题清楚的达成共识。

以外卖流量分配举例:

1、理解什么是流量分配?

从市场收回到外卖业务来看,流量分配其实和布局市场的本质是一样的:通过更有效的分发商品、更合理的摆放商家,让用户与商户进行更有效率的交易。

那么,如何更有效的分发商品?如何更合理的摆放商家呢?

需要通过一套分发机制去实现,而分发机制必须依赖于分发渠道去实施。

具体来说,分发渠道可以看作我们线上产品的流量渠道。该有哪些流量渠道,流量渠道里该摆放哪些商家,是我们考虑的重点。

流量渠道作为分发渠道,起到连接商家与用户的作用,同时也是对用户需求及商家供给进行配对。

如下:

用户群体1:渠道1­­­商家1、商家2、商家3

用户群体2­­­:渠道2­­­商家4、商家5、商家6

用户群体3­­­:渠道3­­­商家7、商家8、商家9

流量渠道是为分发机制服务的通道,每一个流量渠道必定有不同分发机制的含义。比如:搜索入口,以搜索关键词为分发机制,建立用户需求与商家供给的匹配。

综上所述:站在平台看流量分配是一件什么样的事情?

以流量渠道作为媒介,通过资源配置实现用户与商户进行更有效率的交易,平台需要做两件事情:

分对人(匹配需求):把合理的流量渠道分配给需要的用户群体,即为现在进行的精准化营销,千人千面。

配对货(匹配供给):每一个流量渠道里分配满足这个用户需求的商家。

2、用数据定义流量分配

首先,思考如何去定义流量?

一般而言,流量是指在某一时间某一地点某一会话从来源到去向的全过程。

其次,思考我们用什么指标去有效的衡量流量:用DAU衡量?用页面去重UV衡量?还是用什么去衡量?

从业务的角度来看,我要统计一天内产生了多少的流量,代表我要统计有多少次用户使用过我的产品。

每日流量,本质上为每日会话数=每日用户数*日均用户使用频次。

最后,思考我们该从哪些角度去衡量流量?

拆解来看,如下表:

知道了数据分析的问题是什么后,需要我们去基于这个问题,梳理一个数据分析框架。在这个分析框架里,我们需要明确分析内容的数据范围以及要分析哪些问题。

1、明确数据范围

数据范围一般分为空间范围与时间范围;具体如下:

2、规划分析框架

基于定义问题环节中对问题的理解,用详细的数据拆解问题,并把这些问题进行归类形成框架。

基于外卖流量分配为例,框架截取如下:

有了数据分析框架后,需要对数据分析框架里的数据进行详细定义规范,确保每一项数据的统计口径是准确无误的。

数据内容主要分为:

1、指标维度定义

详细定义数据分析框架中的每一个指标含义,形成指标字典。

这个指标字典的作用,一方面作为需求文档,是与数据开发评审的依据;另一方面,是一份释义说明,作为分析报告中指标说明的出口。

基于外卖流量分配为例,截取部分指标说明如下:

2、指标维度矩阵设计

需要把指标维度用一个矩阵的方式呈现出来,如果该指标在该维度上有关联,则打勾。

指标维度矩阵的作用是明确指标与维度的关系,也可以帮助我们复验所有指标与维度的关联是否可以满足我们的分析需求,避免后期造成如下badcase:我想从地域的角度观测交易金额指标,却发现取出的数据中,交易金额不支持地域维度的下钻。

基于外卖流量分配为例,截取部分指标维度矩阵如下:

接下来基于分析框架,明确每一个分析问题,需要采用什么样的分析方法进行分析;详情写出分析的标题、度量内容、可视化方法、分析方法,并按数据分析报告(以PPT为例)展示的顺序组织。

基于外卖流量分配为例,截取部分如下:

那我们到底该选取什么样的可视化方法去呈现我们的报告呢?这里参照国外大神的经验,总结了一个万能图表,供大家参考:

完成分析方法的规划后,我们就可以形成一个数据分析的提纲,这个数据分析提纲是非常重要的:

清楚的阐明我们需要分析的问题。这些问题并不是凭空想象的,而是基于定义问题环节、搭建分析框架环节的逻辑推导得出。

清楚的知道分析问题中需要的数据内容。

有一个完整的画面感,明确数据分析最终呈现的样式。

以PPT展示形式为例,甚至可以知道这个报告有多少页,每一页都有哪些内容。

这样,我们基于以上的准备,就可以按部就班的去输出我们的分析报告了。

我在这里的建议是,一定要把任何一个数据分析当成自己的作品一样,高标准高要求的进行产出。这样,不仅可以锻炼我们的撰写报告能力,也可以更好的让业务方对你形成专业可信赖的印象。

基于外卖流量分配为例,截取分析报告如下:

备注:以上所有具体数据均经过虚构处理,请勿作为行业参考。

如上以外卖流量分配为例,详细介绍了数据分析的全流程。

最后,对数据分析的方法论总结如下:

最后,期望这篇文章,可以帮助大家更系统的思考我们做数据分析的目的和流程,如果有好的建议可以留言交流。

- END -


(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询