睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

数据治理说起来容易,做起来难

时间:2022-09-02来源:互联网浏览数:228

移动互联网和大数据日益发展,沉淀的数据越来越多,数据的质量、使用效率、数据安全等等各类的问题迎面而来。为了让数据发挥最大的价值,数据治理作为数智化战略的一项必要举措,列入了大多数企业的战略行动计划,业界也有“数字转型、治理先行”的说法。但是谈到数据治理,业界有一个普遍的共识,那就是 “数据治理说起来容易,做起来难”。怎么通过数据治理解决这些难题?数据治理究竟难在哪里?华为作为典型的非云原生企业是如何应对的呢?

2018到2021年间全球8300家标杆企业中,全面拥抱数字技术的前10%企业相比后25%企业营收增速超过5倍。数字化转型浪潮下,数据资产将成为关键生产要素支撑未来数据产业化升级,是未来政企实现跨越式发展的必然选择。

根据华为在政企行业多年的深入耕耘和自身转型的实践,我们发现,优质高效的数据底座,是保障政企运营效率持续提升和业务创新升级的重要基石。我们深知打破数据孤岛、确保数据准确、促进数据共享、保障数据隐私与安全,是政企数据治理的关键。当前很多企业数据体系建设呈现出“烟囱化”的趋势,为政企数据治理带来了四大挑战:

进不来 :数据来源复杂,集成难;
质量差 :数据质量要求高,规则校验多,落地难;
出不去 :数据烟囱林立,业务和数据匹配难,共享难;
不放心 :数据安全、交互风险高。

早期的华为是典型的非数字原生企业。从2007年开始,我们通过两个阶段的持续变革,系统地完成了数据管理体系建设,实现业务感知和ROADS体验的数字化转型:

阶段一(2007-2017) :设立数据管理专业组织,建立数据管理框架,发布数据管理政策,通过统一信息架构与标准、有效的数据质量改进机制,提升数据质量,实现数据全流程贯通,业务运作效率整体提升。

阶段二(2017-至今): 建设数据底座,汇聚和联接全域数据,实现数据业务可视、随需共享、敏捷自助、安全透明的目标,支撑准确决策和数据创新,构筑差异化竞争力。

华为经过十多年的实践,我们总结出 “4层保障”和“2个抓手”(信息架构、数据质量) ,实现清洁数据,充分释放数据价值的核心手段。

4层保障包括:
政策保障: 从目的、适用范围、管理原则、问责等方面进行政策制定,公司层面需统一遵从,确保业务与IT共同参与数据治理。
流程保障: 建立数据管理流程,重大决议由企业变革指导委员会决策,通过变革管理体系和流程运营体系落地。
组织保障: 按领域任命数据管理Owner和团队,建立实体化数据管理组织承接数据管理改进目标。
IT落地保障: 建设承载面向“联接共享”的数据底座和数据服务融合的统一IT平台,完成数据全流程流转与价值变现。

2个抓手是指:
信息架构: 构建面向“业务交易”的信息架构,描述业务运作和管理决策所需要的各类数据及其关系,保障企业内统一“数据语言”。
数据质量: 建立数据质量管理框架和运作机制,例行开展公司级数据质量评估,由企业数据管理组织定期发布报告,牵引各业务领域持续改进。

上述的4层保障和2个抓手,构成了企业数据战略资产综合治理体系,能够确保关键数据资产的有清晰的业务管理责任,IT落地有稳定清晰的原则依据,作业人员有规范的流程指导。遇到争议时,有裁决和升级处理机制,治理过程有充足的人力、组织、预算保障。只有建立起有效的数据治理环境,数据的质量和安全才能得到保障,数据的价值才能真正发挥。

作为华为数字化转型的底座,华为云沉淀了大量的实践经验和方案能力,并通过华为云Stack来赋能政企,加速各行各业的数字化转型。在数据治理领域,华为云Stack为政企提供数据湖治理中心服务(DGC)来帮助企业客户快速构建数据运营能力。DGC是数据全生命周期一站式开发运营平台,提供数据集成、数据开发、数据治理、数据服务、数据可视化等功能,支持行业知识库智能化建设,支持大数据存储、大数据计算分析引擎等数据底座。下面我们就来一起看看DGC是怎样应对我们前面提到的挑战:

进的来:简单高效的物理和逻辑数据集成保障数据全面入湖
非数字原生企业发展普遍有较长的 历史 ,随着不同阶段的发展需求,业务系统间存在大量复杂的集成和嵌套,数据来源多样,数据形成孤岛难以集中共享。

数据集成:简单易用的多源异构数据批量和实时接入
DGC能够提供活易用的可视化配置与迁移任务编排,将数据迁移和集成的效率提升数十倍。除主流关系型数据库支持外,还支持对象存储、NoSQL等40余种同/异构数据源及三方大数据平台批量迁移入湖。 DGC物理入湖与HetuEngine跨湖跨仓协同的逻辑入湖 作为两种重要数据集成方式协同互补,满足数据联接和用户数据消费不同场景需求,支撑客户数据湖从离线走向实时,构建物理分散、逻辑统一的逻辑数据湖。

理的清:从源端架构到平台工具端到端数据质量保障

企业级信息架构:结构化的方式实施有效的治理
企业在运转过程中,需要定义业务流程中涉及的人、事、物资源,实施有效的数据治理,确保各类数据在企业业务单元间高效、准确地传递,上下游流程快速执行和运作。企业长期存在信息架构与IT开发实施“两张皮”的现象,数据人员和IT人员缺乏统一协同,企业数据架构混乱,信息架构资产和产品实现逻辑割裂,数据模型资产缺失。

平台工具和服务:一体化开发设计,端到端专业服务,有机联动保障数据质量
结合华为数据治理专家团队与项目实践经验,DGC规范设计实现了一体化设计和开发,不仅确保了元数据验证、发布和注册的一致性,而且实现了产品数据模型管理和资产可视,同时辅以专业的数据治理服务团队、成熟项目管理机制和丰富的实践经验,支撑企业构建高质量的清洁数据架构和能力。在政务大数据中心通过DGC一体化平台和专业服务,完成多个委办局全量数据接入,落地数据分层架构模型设计,完成基础库与主题库的建设,实现委办局数据全流程生命周期设计与落地,涵盖数据架构和模型设计、数据标准设计、数据模型物化、数据质量稽核作业等,助力领导决策支持、宏观经济云图和惠民APP示范应用系统上线。

出得去:通过数据服务和数据地图实现数据自助消费
数据底座建设的目标是便捷地支撑数据消费,确保用户安全可靠地获取数据,并通过灵活的数据分析等方式,按需快捷的消费数据。

数据服务:服务化方式供应数据
通过服务化方式对外提供,用户不再直接集成数据,而是通过聚合应用模型可视化构建,涵盖API发布、管理、运维、售卖的全生命周期管理,作为业务的“可消费产品”的关键要素之一,解决了数据的可供应性。

数据地图:从查询到分析到使用一站式自助
以数据搜索为核心,综合反映数据的来源、数量、质量、分布、标准、流向、关联关系,满足多用户、多场景的数据消费需求,解决了数据“可搜索/可获取性”的难点问题。消费方获取数据后,还支持从数据查询到拖拽式分析的端到端的一站式自助作业,帮助数据消费者结合自身需要获取分析结果,满足业务运营中数据实时可视化需求。

用的安:从模型、制度到平台多维度打造立体化数据安全体系
安全能力模型评估:系统化安全管理抓手
数据安全能力成熟度模型是数据安全建设中的系统化框架,围绕数据全生命周期,结合业务的需求以及监管法规的要求,持续不断的提升组织整体的数据安全能力,提升数据安全水平和行业竞争力,确保数据生产要素安全流通和数字经济 健康 发展。在多个项目中,华为通过安全评估、安全加固等专业服务,助力客户高分通过等保评估,实现数据安全流通。

从制度到工具和服务:统一安全治理框架落地

数据安全治理需要从决策层到技术层,从管理制度到工具支撑和服务体系,自上而下形成贯穿整个组织架构的完整链条。企业组织内的各个层级之间需要对数据安全治理的目标达成共识,确保采取合理和适当的措施;DGC数据安全定义数据密级、认证数据源、对数据动静态脱敏及添加水印等方式以最有效的方式保护数字资产。

企业数字化转型逐步进入深水区,如何提升海量数据治理的效率和准确率,如何将专家经验固化传递都面临巨大的挑战。人工智能与数据治理深度融合将会开启数据治理的新阶段,通过AI加速企业数据生产要素的变现、进一步释放数据价值。

智能数据资产编目
基于AI的智能数据编目系统具备数据的学习、理解和推理能力,帮助团队实现数据自主、简化数据 探索 、实现重要数据资产智能编目推荐。

智能数据标准推荐/去重
通过机器学习技术,自动扫描元数据信息,提炼关键数据项,智能识别新增数据标准、冗余存量数据标准去重,提高智能化程度。

智能重复/异常数据检测
智能重复/异常数据检测技术,将数据根据相似读音、相似数据类型分组,通过模型计算相似度得分,超出规定阈值时,自动异常检测和识别。

智能主外键识别
通过筛选候选主外键时构造特征向量,并调用分类器智能判别该元数据是否为主外键,提升数据模型质量,进而优化和简化后续资产梳理和对外提供数据服务。

数据是物理世界、数字世界和认知世界相互联接转换的纽带,大规模数据交互将构成庞大的政企数据生态。政企数字化转型不能一蹴而就,数据治理亦非一朝一夕之功,治理的数据规模日趋庞大,类型千变万化,手段也更智能丰富,需要我们共同携手从制度、流程、技术、生态多维度一起努力,构建数据智能新世界。
(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询