首页 亿信华辰大数据知识库 数据生命周期6个阶段

数据生命周期6个阶段

|亿信华辰大数据知识库2022-01-07

数据生命周期6个阶段

随着大数据时代的到来,数据总类繁多,来聊一下数据生命周期的6个阶段。

随着大数据时代的到来,以及现代信息化建设程度的加深,企业的业务不断拓展,科技支撑越来越全面,信息系统越来越多,产生和处理的数据会越来越复杂,数据种类更加繁多,结构化数据和非结构化数据共存,而且随着外部数据的加入,这些数据共同形成大数据,大数据规模成几何级增长,它们的管理和存储成本大幅度增加,占据企业IT投资的重要部分。因此,在数据的不同阶段采用不同的存储和处理技术,按照数据的生命周期对其迁移,实现各个阶段的技术成本与价值之比达到最优。


数据生命周期的定义

数据生命周期,通常是指某个集合的数据从产生或获取到销毁的过程。数据生命周期分为静态数据生命周期与动态数据生命周期。企业要实现数据价值的挖掘和应用,需要对数据全生命周期管理加以重视。在数据采集策略和范围、存储和计算、数据整合能力、可视化的程度和分析的广度与深度等方面投入相应资源,然后,针对数据生命周期各个阶段的特点采取不同的管理方法和控制手段,这样才能从数据中挖掘出更多有效的数据价值。


静态数据生命周期

生成期:数据的生成无时无刻不在进行,一旦开始将几乎无法进行人为干预。数据的生成阶段包括Who(由谁生成)、When(生成时间)、Where(生成地点)以及How(如何生成)。为了避免数据生成失控,从而严重影响数据使用的安全性,需要事先指定数据生成规则。
活动期:在活动期,数据将会被用于查询、更新、聚合、复制等各种活动方式。数据活动一般都体现为一定强度的曲线波动,且都符合一定的预期及规范,可以审查和追踪。不是所有数据都具有活动期,不同数据的活动期差异度很大,例如很多临时数据、日志数据等生成后就直接进入归档期。
衰退期:数据活动一段时间后,经过多个阶梯式阶段,数据的使用强度开始逐步下跌。数据活动会日益减少,但当数据价值的再发现或数据安全性事件的发生,数据活动会出现剧烈波动。
归档期:当数据访问进入非常稀疏的阶段,并禁止数据被更新时,就认为其进入归档期。归档数据需要进行周全的保护,因为数据会存在价值再发现的过程,因此归档期的数据可能存在再次进入活动期的可能性。

销毁期:为了降低成本和数据安全风险,当数据已经没有使用或被监管的价值时,就需要被销毁。


动态数据生命周期


数据采集:新数据产生或原数据出现变更时,需要对数据进行采集。数据采集范围的分类可包括:图片数据、语音数据、视频数据、设备地理位置信息、用户上网行为埋点、可穿戴设备等生活信息、网站信息、业务或管理系统日志等。数据的采集既包含在组织机构内部系统中生成的数据,也包含组织机构从外部采集的数据。
数据存储:指非动态数据以任何数字格式进行物理存储的阶段。应当选择合适的存储技术(文件系统、分布式关系数据库、传统关系数据库、消息系统、Nosql存储等),因为,根据数据使用频率不同对时效性、读写查询性能、存储量等差异性要求。
数据处理:指组织机构在内部针对动态数据进行的一系列活动的组合,通常会涉及到元数据管理、ETL、数据清洗、数据模型设计、数据标准、数据质量等。
数据传输:指数据在组织机构内部从一个实体通过网络流动到另一个实体的过程。
数据交换:指数据经由组织机构内部与外部组织机构及个人交互过程中提供数据的阶段。
数据销毁:指通过对数据及数据的存储介质通过相应的操作手段,使数据彻底消失且无法通过任何手段恢复的过程。

传统企业如何做数据生命周期管理

    睿治智能数据治理平台由亿信华辰自主研发,是一款融合数据集成、数据交换、实时计算存储、元数据管理、数据标准管理、数据质量管理、主数据管理、数据资产管理、数据安全管理、数据生命周期管理十大产品模块,覆盖数据全生命周期管理的应用平台,打通数据治理各个环节,十大产品模块可独立或任意组合使用,快速满足政府、企业各类不同的数据治理场景。
认为本内容有帮助
0
您可能需要的数据产品
亿信华辰助力政企数字化转型