睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

手把手教你数据分析方法论和业务实战——用户画像篇

时间:2022-07-30来源:萌能量女王浏览数:223

互联网的产品价值离不开用户、需求、场景这三大元素,所以在做产品设计时,要知道用户到底是怎样的一群人,他们的具体情况是什么,他们有什么特别需求,这样才可以设计出对应解决他们需求和痛点的产品功能。

我们经常在淘宝网购物,作为淘宝方,他们想知道用户是什么样的,年龄、性别、城市、收入、购物品牌偏好、购物类型、平时的活跃程度等,这样的一个用户描述就是用户画像分析

在实际工作中,用户画像分析是一个重要的数据分析手段,帮助产品策划人员对产品功能进行迭代,帮助产品运营人员做用户增长。

作为产品策划人员,需要策划一个好的功能,获得用户最大的可见价值与隐形价值、必须价值与增值价值,那么了解用户并做用户画像分析,是数据分析师帮助产品策划做更好的产品设计重要的一个环节。

作为产品运营人员,比如针对用户的拉新、挽留、付费、裂变等的运营,用户画像分析可以帮助产品运营人员去找到他们的潜在用户,从而用各种运营手段去触达。因为,当我们知道群体特征时,也基本可以判定潜在用户也是类似的一群人,这样才可以精准地寻找新用户,提高ROI。

总的来说,用户画像分析就是基于大量的数据,建立用户的属性标签体系,同时利用这种属性标签体系去描述用户。

01用户画像分析的作用

用户画像分析的作用主要有以下几个方面(见图1)。

图1

1、广告投放

在做用户增长时,我们需要在一些外部渠道投放广告,吸引可能的潜在用户,比如,B站在抖音上投放广告。

我们在选择平台进行投放时,有了用户画像分析,就可以精准地进行广告投放,比如,抖音中主要的用户年龄为是18~24岁,那么广告投放时就可以针对这部分用户群体,提高投放的ROI(见图2)。假如我们没有进行用户画像分析,那么可能会出现投了很多次广告,结果没有人点击的情况。

图2

2、精准营销

假如某个电商平台需要做一个活动,给不同层次的用户发放不同的券,就需要利用用户画像分析对用户进行划分,比如,划分成不同付费次数的用户,然后根据不同付费次数发放不同的优惠券。给付费次数在1~10次的用户发放10元优惠券,依此类推(见图3)。

图3

3、个性化推荐

个性化推荐即精确的内容分发,比如,我们在音乐类APP中会看到每日推荐,这是因为运营人员在做点击率预估模型(预测给你推荐的歌曲会不会被点击)时,会考虑用户画像属性,这样才有可能推荐用户喜欢的类型。比如,根据你是“90后”,喜欢伤感的音乐,喜欢周杰伦这些属性,推荐类似的歌曲给你,这就是基于用户画像推荐。

4、风控检测

风控检测主要是金融或者银行业涉及得比较多,常见的问题是银行怎么决定是否放贷给申请人。普遍的解决方法是搭建一个风控预测模型,预测申请人是否有可能不还贷款。模型的背后就有用户画像分析的功劳。用户的收入水平、教育水平、职业、是否有家庭、是否有房子,以及过去的诚信记录,这些画像数据都关系到模型预测是否准确(见图4)。

图4

5、产品设计

互联网的产品价值离不开用户、需求、场景这三大元素,所以在做产品设计时,要知道用户到底是怎样的一群人,他们的具体情况是什么,他们有什么特别需求,这样才可以设计出对应解决他们需求和痛点的产品功能。

在产品功能迭代时,我们需要分析用户画像行为数据,发现用户的流失情况。典型的场景是用漏斗模型分析转化情况,就是基于用户的行为数据发现流失严重的页面,从而优化对应的页面。

比如,我们发现从下载到点击付款的转化率特别低,这可能是付款按钮做得有问题,可以有针对性地优化按钮的位置等。

同时,还可以分析这部分转化率主要是在哪部分用户群体中低,假如发现高龄用户的转化率要比中青年的转化率低很多,则有可能是因为字体的设置及按钮位置不显眼等,或者操作不方便。

6、数据分析

在进行描述性数据分析时,经常需要用户画像的数据,比如,描述抖音中某美食类博主的用户群体特征,可以关注他们观看其他抖音视频的情况,关注其他博主的情况等(见图5)。

图5

简单来说,用户画像分析可以帮助数据分析师更加清晰地刻画用户。

02如何搭建用户画像

用户画像架构如图6所示。

图6

1、数据层

进行用户画像分析的基础是获取完整的数据,互联网数据主要是利用打点,也就是通常所说的数据埋点上报的。整个过程是数据分析师根据业务需要提交数据上报的需求,然后由开发人员埋点,获得数据(见图7)。

图7

除了上报的数据,还有从数据库中同步的数据,一般会存到Hive表中,按照数据仓库的规范,根据主题来放置。其他数据,比如调研的数据,以Excel格式存在,就需要把Excel 数据导入Hive 表中。

2、挖掘层

有了基础数据以后,就进入挖掘层,挖掘层主要做两件事情,一个是数据仓库的构建,另一个是标签的预测,前者是后者的基础。

一般来说,我们会根据数据层的数据表,对这些数据表的数据进行清洗、汇总,然后按照数据仓库的分层思想,比如按照数据原始层、数据清洗层、数据汇总层、数据应用层等进行表的设计(见图8)。

图8

数据原始层中的数据就是上报的数据,没有经过数据清洗处理,是最外层的用户明细数据。

数据清洗层主要是数据原始层的数据经过简单清洗之后的数据,已去除“脏”数据等明显异常的数据。

数据汇总层的数据主要是根据数据分析的需求,针对想要的业务指标(比如,用户一天的听歌时长、歌曲数、歌手数等),按照用户的维度,把用户行为进行聚合,得到用户的轻量指标的聚合表。

数据汇总层的作用主要是可以快速汇总数据,比如,一天的听歌总数、听歌总时长、听歌时长高于1小时的用户数、收藏歌曲数多于100的用户数等的计算。

数据应用层主要面向业务方的需求进行加工,可能是在数据汇总的基础上加工成对应报表的指标需求,比如,每天听歌的人数、次数、时长;搜索的人数、次数、歌曲数等。

按照规范的数据仓库把表格设计完成后,就可以得到一部分用户的年龄、性别、地域的基础属性数据,以及用户浏览、付费、活跃等行为数据。

有些用户的数据无法获取,以QQ音乐为例,我们一般无法获取用户的听歌偏好属性的数据,需要通过机器学习模型对用户的偏好进行预测(见图9)。机器学习的模型预测都是基于数据仓库的数据,完整的数据仓库数据是模型特征构建的基础。

图9

3、服务层

有了数据层和挖掘层以后,用户画像体系基本形成,那么就到了用户画像赋能的阶段。最基础的应用就是利用用户画像宽表的数据,对用户行为进行洞察归因,挖掘行为和属性特征的规律。

另外,比较大型的应用就是搭建用户画像平台,其本质是用户画像表的集成。

用户提取:我们可以利用用户画像平台,快速提取用户数据,比如,提取18~24岁的女性群体,且听过周杰伦歌曲的用户。

分群对比:可以利用用户画像平台进行分群对比。比如,比较音乐类APP中VIP用户和非VIP用户在行为活跃和年龄、性别、地域、注册时间、听歌偏好上的差异。

功能画像分析:可以利用用户画像平台快速进行某个功能的用户画像描述分析,比如,音乐类APP中的每日推荐功能,我们想要知道使用每日推荐的用户是哪些用户群体,以及使用每日推荐不同时长的用户特征分别是怎样的。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询