首先,
数据治理的核心认识是,数据治理是一个持续并且长久的一个过程,不同的产品可以解决比如采集、传输等数据治理层面上的不同问题,但并不存在一款所谓的“
数据治理产品”,可以用来解决所有问题。
其次,数据治理的整体方法论是“从应用倒推”。先确定数据应用、数据资产的需求,接着确定需要哪些数据,之后确定需要从哪种数据源获取数据,最终确定具体的
数据治理方案。
第一步,确定分析需求。通过了解数据使用者需要看哪些指标、用在哪些场景、使用哪些分析模型等方面来了解具体的数据使用需求,完成需求梳理。
第二步,映射数据模型。在该步骤需确定采集的事件和属性,并完成事件设计。
第三步,确定
数据采集技术方案。根据要采的事件和属性,结合现有实际业务系统,去确定到底要从何种系统里以何种技术方案采集数据。
第四步,数据采集与集成。这一步就是指具体的开发、集成工作,包括完成相应的 SDK 集成、数据采集工具的开发、数据 ETL 开发等。
第五步,数据校验和上线。这一步中需要使用必要的测试工具、利用埋点管理平台做数据对比等。
(部分内容来源网络,如有侵权请联系删除)