睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

数据分析师的利器 ——行为埋点数据

时间:2022-05-22来源:你忘了带我走浏览数:590

数字时代,数据的产生和流动速度是21世纪初人类无法想象的。根据国际权威机构Statista的统计和预测,2020年全球数据产生量为47ZB,并预计在2035年达到2142ZB,数据及其衍生应用对于全球互联网、能源、金融、物流、工业等各个领域所带来的价值和发展潜力都已不言而喻。

数字时代,数据的产生和流动速度是21世纪初人类无法想象的。根据国际权威机构Statista的统计和预测,2020年全球数据产生量为47ZB,并预计在2035年达到2142ZB,数据及其衍生应用对于全球互联网、能源、金融、物流、工业等各个领域所带来的价值和发展潜力都已不言而喻。

对于银行等金融机构来说,日常营销、风险控制、业务经营和服务创新过程中对埋点数据的利用程度往往决定着从数据中挖掘出多少价值,而对于数据分析师来说,好的数据埋点是一项事半功倍的利器,那何为“数据埋点”呢?本文以用户行为数据埋点为例给出答案。


01

认识埋点

1.什么是数据埋点

数据埋点是在应用中特定的流程收集信息,便于跟踪应用使用的状况,后续用来进一步优化产品或为运营提供数据支撑。

2.为什么要做数据埋点

埋点数据是一种量化指标,在产品精准化运营和数据深度挖掘应用方面有着巨大潜力,如:

1)产品迭代:产品的迭代离不开运行和用户行为数据,通过分析埋点数据不断指导优化产品,因此数据埋点的质量也影响到数据、产品、运营等环节的质量。

2)精准用户运营:对用户进行精细化运营需要对用户进行有效分层,可基于用户的行为记录分析形成。

3)完善用户画像:包括基本属性(性别、年龄、地区),行为属性(设备操作习惯等)等。

4)产品指标计算:企业内部涉及到常见的核心指标,如日活跃用户数、活跃时长、留存率、付费用户数这些指标均通过埋点的上报并计算完成的。


02

数据埋点的类型和特点

常用数据埋点方式主要分为三类:代码埋点、无埋点和可视化埋点。

1.代码埋点

代码埋点是最为经典的埋点方式,是指以业务分析需求为目标导向,在需要统计的特定位置或页面植入代码,记录行为数据。首先业务人员需明确拟采集的数据指标、定义事件和用户属性,事件是用户具体操作的记录,例如通过按钮的一次点击或多个事件模拟出用户的一次消费支付行为。

通过设置代码埋点从多种终端设备采集上报数据,对事件相关的埋点数据加以分析利用即可赋予或更新用户的基本属性和自定义属性,也就是为用户新增或更新标签信息。

因这种埋点方式目的性强,业务需求十分明确,所以它在精细化分析场景中应用广泛,但是对应地就需要经历完整的埋点需求、任务开发等流程,如果埋点功能发生变更则需要重新经历一次流程,开发效率不容乐观。

代码埋点的实施流程

2.无埋点

无埋点,也称之为全埋点,是指收集所有行为数据,再根据实际分析需求从中选择、提取所需的行为数据。使用这种“简单粗暴”的方案可以一次性满足日后所有的埋点数据需求,极大节省了每次新增数据埋点需求的任务和开发流程,用户友好性强,还可以通过可视化展现宏观指标,能够满足基本的数据分析需求,使用效率相对较高。

但是无埋点只能采集到用户交互数据,无法深入到更细、更深的粒度,仅适合标准化的数据采集;此外APP端采集上报大量数据意味着消耗更多的电量、流量和内存,数据分析师面对海量的埋点数据进行二次梳理和加工也是颇为头疼的。

3.可视化埋点

可视化埋点也被称为无码埋点,是一种所见即所得的埋点方式。它的核心理念是降低实施埋点的门槛,以此来提升原工作流程的效率。最大的优点是业务人员、没有权限触碰代码或不懂编程的人都可以直接在网站或移动应用的界面上操作想要获取的数据,之后系统就能立刻将想要的埋点定义出来,且埋点可以即时生效、检查正误。缺点是无法采集到不可见行为(非点击事件)。

03

常用的埋点指标

1.UV (unique visitor) :是网站独立访客和独立用户,指访问某个web网站的独立IP的数量,通常用于衡量网站流量。

2.PV (page view) :是指网站的页面访问量,统计用户打开网站的次数。

3.DAU (daily active user) :是指日活跃用户,通常是统计一天内用户登录或使用APP产品的用户数(去除重复用户数),WAU和MAU则分别代表周、月活跃用户。

4.转化率 (conversion rate) :指在一个统计周期内完成转化行为的次数占总数的比率,根据转化率可以反映运营活动是否有效。比如某视频会员的打折促销活动,100人打开APP查看了活动,其中60个人完成了支付,转化率即为60%。

5.留存率 (retention rate) :在一定的周期后,每日活跃用户数在第N日仍启动该APP的用户数占比的平均值,其中N通常取2、3、7、14、30,分别对应次日、三日、周、半月和月留存率。

6.跳出率 (bounce rate) :指在只访问了入口页面(例如网站首页)就离开的访问量与所产生总访问量的百分比。跳出率与客户粘性息息相关,通过分析跳出率直接发现页面设计及用户体验的问题。


04

行为埋点数据的应用场景

通过数据埋点获得的数据其本质是一种过程数据,在进行深入分析之前尚不具备任何价值,但这些过程数据中隐含的用户行为信息却蕴藏着无穷的价值,值得深入挖掘以及合理利用。

当前各行各业争相研究机器学习和用户画像,如果说机器学习只是一种用于提升模型预测精度的算法过程,那数据埋点决定了用户标签的准确性和它所带来的业务价值。例如,券商、银行等金融机构可以从用户使用手机银行APP所产生的“金融理财产品类型”及“页面停留时长”的埋点数据中分析提取,为目标客户精准地打上“指数基金”和“风险偏好低”的策略标签,以便后续针对目标客群开展指数型基金等低风险理财产品的拓客营销。

用户埋点数据的灵活使用对保障平台和服务的稳定运行也可以起到关键性支撑作用。如某平台上线试运行,为监测用户的异常行为、验证平台综合查询服务能力,开发人员实施代码埋点对用户操作行为数据和查询时长予以记录,平台管理员不仅可以依据埋点数据分析进行用户数、使用率、月活率等指标的基础统计汇总,还可以抓取出造成数据库或服务器宕机的根本原因,及时杀掉进程确保平台稳定运行;或是以查询任务的平均时长评估出产品的查询响应能力,为未来提高集群规模提供量化依据;亦或通过埋点数据分析出使用频率较高的底层数据和报表资源,合理推测现阶段业务人员在营销、风控等不同领域的分析侧重点和发展方向。

此外,用户埋点数据可以揭示某产品内容的推广及服务情况,能够在一定程度上暴露出产品的潜在弊病或是推广过程中存在的不足。以某APP端的资金配置课程为例,图2中“观众留存率”曲线是指历史播放用户在指定时间点的留存比率,数据埋点的统计间隔为30秒,从留存率曲线可以推测出约60%的人被课程的片头吸引并看完了前30秒,40%的人能够坚持看完了前7分钟的内容,而后近一半的观众关闭了视频;在该视频播放过程中“留存率”曲线分别在2分钟和7分钟呈现出了两个明显的拐点,也意味着第30秒至120秒的课程内容“劝退”了20%的观众,7分钟后的视频内容也没有对观众形成持续的吸引力,通过对行为埋点数据的研判和分析,产品经理和课程讲师可以有的放矢地对课程的推广渠道和内容进行修改和提升。

某资金配置课程观众留存率趋势图


结语

在国家和法律层面,对个人的信息数据采集、大数据滥用等行为的监管越来越严格,企业在采集个人信息应该做到合理告知采集目的、信息来源等,避免过度采集个人信息。在企业产品层面来说,埋点采集到的每一种类型的用户行为数据对产品设计优化、迭代方向选择、业务目标达成等具有很高价值,做好埋点有利于进行数据驱动产品和精细化运营,因此它贯穿了产品的整个生命周期,为产品优化指明方向。


(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询