睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

画像标签数据体系实践

时间:2022-07-11来源:九分帅气浏览数:326

大多数数据分析系统由固定报表+灵活报表组成,其往往支持明确的统计需求,满足特定的业务方。报表中的重点指标拥有较高的口径上的权威性,但可扩展性和可探索性不足,并且慢慢的也会形成各自的数据孤岛。随着业务的发展,往往在挖掘业务痛点、探索解决方案的时候,需要花费更多的资源才能满足日常的分析需求。

前言

提到大数据画像,第一联想往往是电商行业的会员画像、用户画像。

电商企业通过对客户或粉丝进行打标和人群圈取,进行个性化的引流和定向的发券,提高产品销售、并把结果再反馈到画像中分析,形成闭环营销,从而大大提高消费者对产品的认可度和忠诚度。

图:闭环营销示例

当然,属于快递企业的“客户”和电商企业的“客户”显然是不相同的。在快递的生命周期中,对外我们要服务好商家和会员,对内我们要管理好网点和业务员,它们都是属于我们的“客户”。那么,我们是否需要这么一个适合自己的画像分析系统?我们该如何去描绘属于ZTO自己的那个“它”?支撑画像的数仓指标体系又是如何建设的呢?

01画像分析系统的价值

ZTO是一家拥有着庞大的数据资产、善于挖掘数据价值并使其服务于公司各项业务发展的企业,是行业内数字化转型的先行者。通过这么多年的发展,中通已经由以前一家单独的快递企业,发展成现在一体九翼的综合物流服务商,有着行业领先的业务体量和多元的生态圈。并致力于通过技术或者数据的力量把整个生态圈更好地连接在一起,相互交叉赋能。

我们在数字化建设中,建设了拥有EB级别计算能力的大数据平台,并在此基础上搭建了涵盖集团各业务线的数据仓库,重点建设了如网点、财经等数据集市,服务于网络、营运、服务质量、安全、财经、研发等多部门。我们建设了数据驾驶舱和移动驾驶舱等数据分析应用,给业务决策研究提供锚点。并有着专职的分析师团队和大数据仓库团队满足业务上的数据需求。

大多数数据分析系统由固定报表+灵活报表组成,其往往支持明确的统计需求,满足特定的业务方。报表中的重点指标拥有较高的口径上的权威性,但可扩展性和可探索性不足,并且慢慢的也会形成各自的数据孤岛。随着业务的发展,往往在挖掘业务痛点、探索解决方案的时候,需要花费更多的资源才能满足日常的分析需求。

图:常见数据报表形式对比在日常工作中,我们发现围绕着网点、业务员、客户、以及运单自身数据上的统计和分析诉求是比较多且相似的。虽然业务方的指标口径并不统一,但可以通过打标和定义基础标签的方式去抽象数据本身,并通过画像分析工具去让使用者自定义自己的标签,满足个性化的口径探索和圈取,降低和打破数据孤岛。画像分析系统可以大大的提高数据主体交叉分析的探索性和扩展性,也能降低数据使用的成本,提升数据使用效率。

02画像分析系统的目标

画像分析系统的建设过程是梯度的,遵循产品应服务于公司实际业务需求的原则,脚踏实地,通过长期的推广和发现实际的应用点、价值点,不断的迭代,阶梯上升从而建设一个满足ZTO自身需求的画像分析系统。

在画像系统立项之初,我们确定了赋能业务运营、提高用户满意度、统一数据管理、精准可视标签四点内容。

1、赋能业务运营

我们对于画像分析系统的定位之一就是赋能业务运营,通过对于不同主体的数据指标的整合和统一,业务部门可以通过自助拖拉数据标签的方式进行可视化的主体数据的圈取、分析和推送,同时支撑更丰富的明细数据,从而减少各种探索性和业务变化较快的数据需求,从而大幅度提高工作效率。

2、统一数据管理

利用大数据工具和持续的数仓建设,将原来分散在各个业务系统中数据,汇总整合在一起建立全网维度的数据标签,并进行统一的存储,统一管理、统一输出。

3、精准可视标签

在全网数据标签的基础上,让业务人员能够第一时间通过标签的描述就能找所需要的数据。

4、提高用户满意度

1)纵向

围绕标签分析,以主体画像为基础,提供面向非技术人员的自助分析功能,并对于不同的业务场景进行智能分析。

从标签建设角度而言,需要保证少而精,从圈取数据角度而言,需要兼顾多维度分析和交并差,提供简易灵活的自助分析能力,并对标签进行管理,支撑决策复盘,并结合完善的后台配置功能,提高标签的新增、维护和使用效率。

2)横向

在标签体系完善后,围绕分析策略,面向不同的场景进行配置,并通过下发配置的功能,配置不同的下发机制,结合部分定制化的功能,从而对接不用业务部门的不同场景的数据需求。

通过横向扩展标签的应用功能和范围,对接和个性化需求,提供一个既能满足通用功能,又可以对接不同场景的数据开放平台。

03ZTO的画像分析系统

1、画像的主体

对于快消、电商行业,其核心业务以卖货、流量和精准营销为主,应用方向往往为对接广告推送及效果分析、获客成本分析等,整合用户收藏、成交、点击、注册信息、定位、以及衍生加工的标签等多份数据,全方位分析用户各种行为之间的关联性,从而更有效的设计交叉销售、营销内容、人群定向等运营策略。所以其画像主体往往以用户、会员为核心。

而快递业务,我们的业务核心包括面单的使用、快件的揽收和派送、运输环节的降本和增效、渠道和客户的发展和维护、市场的口碑和形象,我们的客户除了散件客户外,其实更多的是对于网点的管理和服务、对于业务员的管理和服务,以及快递路由各环节的管理和服务,如业务员的收发揽派签、网点的成本、收入以及考核等。所以,我们需要去描绘的,主要包括客户(寄件人、发件人、会员等)、网点、业务员、以及运单本身。

画像分析系统规划的主体画像标签包括:运单画像标签、会员客户画像标签、网点画像标签、业务员画像标签。

2、画像标签模型

3、画像的基础标签设计

举例如业务员主体画像来说,

我们有的数据,包括业务员的基本信息,其所属网点的信息,其揽派签的业务数据,参与培训、答题、活动等信息,协议客户及绑定粉丝的相关业务数据,工单投诉的数据等。

综上,其基础标签规划如下主题。

基础信息:业务员信息、所属网点信息,用来描绘业务员个人的基本情况。

业务信息:业务员派件签的内容,用来描绘业务员在工作中的业务情况。

财务:揽派费用、直链派费等,用来描绘业务员的生存情况。

客户:协议客户、粉丝,用来描绘业务员的能力延伸。

行为:服务时效、服务质量、操作质量、学习成长,用来描绘业务员的工作中的行为。

4、画像标签的构建流程

构建流程包括:

梳理需要建立的标签

构建数据清洗逻辑

建立数据集市

计算标签

产品可视化

数据圈取与下发

······

5、指标体系的建设和设计

画像分析系统的重点在应用,属于各业务数据计算统计后的展示和应用的手段和工具,而指标体系的建设则是支撑其的根基,我们这边也以业务员为主题,简单探讨一下指标体系的建设。

5.1、指标体系设计的思路和方法

我们往往对于指标维度的整理和设计,可从两个方向进行

1)自下而上的设计,根据底层业务的功能模块自身业务范围,先定义抽象的主题,再按不同的主题设计符合的指标。如先把业务员拆分到业务、基础属性、行为、服务质量等主题,整理维度组合和维度层级,整理事务过程中所产生的数据的关系,定义出各主题的一级指标,然后根据维度组合和维度层级逐步扩充一级指标,结合加上不同的口径,衍生出二级、三级指标或者衍生指标。这边需要考虑到维度是存在从属关系和互斥关系的,如派件网点从属于对应管区,而一条运单的扫描记录在原始形态由扫描类型和扫描站点以及扫描时间确定,但对于选定了业务员为主维度的时候,扫描指标转换为具体的操作行为的指标,如揽件量、派件量,而站点维度也相应的转换为揽件网点、派件网点。

2)而自上而下的设计,根据实际需求处罚,比如你想探寻一块业务的数据价值,或者结合行业的一些常用指标和以往的需求积累,归纳业务数据可以支撑的指标,整理满足其指标统计的维度组合和维度层级,根据指标本身的口径定义和业务价值进行分组和扩展,并归纳基础指标。

在实际的过程中,我们可以通过如下表,对维度和指标的对应关系的列举和打钩,来帮助我们整理和调整对应的指标定义和维度可达粒度的确认。

5.2、指标体系和基础标签的落地和推广

快递业务描绘的是从寄件人下单、业务员揽收、网点发往中心转运、中心发往末端网点,末端网点业务员派件,收件人签收的整个过程。在目前的业务中,降本增效、提高服务质量、提升口碑形象、以及扩大市场占有度一直是重中之重。经过对日常需求的总结和归纳,我们发现,服务质量和运单的状态统计的诉求较大,并且服务质量包含运输时效、操作质量、客户投诉等各方面,和集团的业务稳固上升和健康发展高度相关。在画像分析系统的早期,从服务质量相关指标和基础标签入手,如来访、投诉等,先重点规划对应主题的标签,并且在前期的试点推广中,也重点面向涉及服务质量相关指标的客户。然后根据实际应用场景的落地效果,逐步增加其他主题的指标内容,再扩展和调整画像分析系统的应用方向。

5.3、业务员主题指标体系的设计示例

1)确认的主体的定义

在ZTO的业务中,业务员特指实际负责揽件派件事务的人员。使用把枪和掌中通等工具扫描完成,有司内统一账户标识。目前,其业务相关方主要为末端网点。其揽派行为可直接影响到如菜鸟、拼多多等的服务评分和收件人、寄件人的品牌感知,基础数据来自于藏经阁。

2)主题涵盖范围

我们希望通过主题的设立,明确划分和建设和业务员自身、行为、业务形态较为相关的表和指标。其涵盖的范围包括业务员的从属和管理、业务员自身的属性、行为、业务指标、服务质量、财务补贴、以及粉丝、协议客户等。以业务员、网点、服务等视角,去了解业务员的业务指数、规范业务员的行为、加强业务员的服务质量水平的管理、提高总部对于业务员的管理和保障,从而对外形成良好的品牌形象。

3)指标体系建设简述

图:业务员业务指标树示例

a)业务员基础属性:对于业务员,加入其所属网点的一些基础信息和业务指标外,我们也对其工龄、年龄本身等原子指标进行分段处理,形成二级指标。

b)业务员业务指标:根据其业务特点,分为揽、派、签量三个原子指标,如揽件件量,根据其揽件订单的渠道,可分为电商平台揽件量,自营揽件量等二级指标,还可根据运单的增值类型,分出标快揽件件量、普通件揽件量、代收件揽收量等二级指标,在此基础上还可以衍生出增值件揽收占比等三级指标。如签收件量,根据其末端投递的场景,可以分为快递超市签收、菜鸟驿站签收、实际(剔除第三方)签收等二级标签,并在此基础上派生出最近N天、本月、本年等三级指标。

c)业务员财务指标:从网点视角,对揽收的运单的相关费用情况,按财务科目分为如中转费、面单费、增值加收费等二级指标,并在此基础上衍生计算出寄件收入、寄件毛利率三级指标。

从网点+业务员自身的视角,在总部直链派费、基础派费、派费补贴等二级指标的基础上,衍生计算业务员的派件收入,派件毛利润等三级指标。从侧面去描绘和分析业务员相关的财务情况。

d)业务员行为:按投诉和异常的相关性,我们确认了客诉、网投和业务员的相关性。其中,客诉按工单类型去拆分二级,如签收未收到、未送货上门工单数据等。再按如网点渠道,衍生出客诉工单占比等三级指标。根据业务员的派件打标量和派件总量,按网点的一二派考核频次,可以衍生出一二派签收达标率等。

e)综合业务指数指标、服务质量指标等,把其作为一二级指标,进一步衍生计算如业务员服务排名,服务分、综合分等三级指,从而形成业务员综合指数类指标。

6、画像分析系统功能概述

画像分析系统的核心流程为:圈数、推数、效果分析

1)圈数

用户标签筛选数据

图:指标筛选

图:数据圈取

图:看板分析

2)推送

推送用户标签数据;

图:标签生成

图:推送策略

3)推送数据的效果分析

图:智能分析

图:智能分析

详细功能及操作如下:

7、画像分析系统应用

1)中通学院,圈取满足特定要求的业务员或网点等,对接场景进行推送。中通学院需要给对于业务或者知识薄弱的业务员,每日按系统判断其薄弱的部分进行正对性推送,掌中通APP上推送不同类型的培训和题目,补足业务员的短板,提升个体的服务意识。

2)派件停滞,圈取派件停滞、签收未收到信息进行预警工单的推送,对接光合系统,提前优先打标对应的数据,做投诉风险的事前处理,从而降低整体的客户工单量。

3)导入分析,导入外部主体数据,结合画像数据进一步圈取和分析。可以满足特定情况的数据和线上数据的交叉分析,如客户提供的一派运单的追踪,或者网点白名单的打标。

4)一票多联,圈取满足口径的指标数据并提供接口访问,对于每日满足特定业务员、网点、以及自身标签条件的运单,将要求业务员派件时需强制派前电联。

5)大促签收追踪,根据条件圈取数据,在运单签收后1小时左右,对有投诉风险的运单收件人进行短信提醒,并提供投诉通道,如果实际发生签收未收到等行为,或者要求送货上门实际未送货上门等行为,可以引导客户走内部流程,并且在更早的时间维度上进行处理。

6)投诉高风险运单预警,通过规则圈取搞投诉可能运单,并推送打标给业务员,提升必要服务点和风险。

7)外呼巡检,对网点或者业务员随机抽样进行自动外呼检查。

8)智能分析报告,对圈取标签结果进行投诉、来访等进一步分析。针对自定义标签重点分析其服务质量和客户来访相关情况。

8、遇到的问题和难点

1)集团业务量的快速提升和业务范围的不断扩大,需要处理的数据量也是在不断的膨胀的。画像系统是依赖于上游数据集市和宽表的数据的,不断扩大的数据量会影响数据结果的时效性,需要不断的优化和维护数仓集市和宽表,以满足画像分析系统的应用的需求。

2)在画像早期的建设中,因为快速推广的诉求和满足实际需求为目的,自定义指标的开放度还是比较小的,缺少统一的规则库,指标的冗余度还比较高,需要对指标进行压缩精简和抽象,并通过功能上的升级,满足用户自定义指标的需求,降低基础指标的管理、维护和新增成本。

9、画像分析系统后续目标

1)根据实际业务方向和重点,调整指标范围和主体,如适当扩大业务员的范围,而把之前的条件放入指标属性中、定义新的主体等。

2)提高指标的通用度,打通主体间的交互,通过功能提升,提高生成标签的交叉分析能力,提升主体和主体直接标签相互引用的便利性。

3)画像数据涉及的业务范围广泛,上游任务众多,需不断的优化和建设,利用Doris对于多表关联的友好,拆分主体宽表,从而提升整体画像的时效和稳定性。

4)基于标签的血缘分析,并做标签相似性分析,减少和打破不同业务方之间的口径壁垒。

5)融入clickhouse组件,扩展更多的高效的即席计算和分析方式,满足不同场景的需求。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询