- 产品
- 产品解决方案
- 行业解决方案
- 案例
- 数据资产入表
- 赋能中心
- 伙伴
- 关于
时间:2018-12-14来源:数据治理浏览数:840次
组织当前正在努力解决的数据分析的核心要素之一是数据治理。如果组织没有花时间构建和实施治理策略,那么组织可以做正确的事情并且仍然想知道为什么他们的分析项目会失败。以下是来自专家的一些(希望)有用的提示,用于构建持续的数据治理框架。
获得正确的数据治理有很多方面,包括拥有合适的人员。大型企业越来越多地聘请首席数据官(CDO)来监督数据治理,特别是在涉及欧盟通用数据保护法规(GDPR)等法规时。虽然较小的公司CDO标题较少,但仍然有人与CDO负有相同的责任 - 并且在列表的顶部确保数据受到管理。
除了人员之外,考虑对成功至关重要的核心数据治理流程也很重要。构建成功的数据治理实践的第一步是了解对组织至关重要的业务驱动因素和业务成果。
“很多时候我们都会注意到客户会直接进入数据战略或数据治理,”他说。“花时间了解您希望推动哪些业务成果,以及您的组织在本地和全球的文化是什么非常重要。”
在数据分析项目中生成,使用和管理的大部分信息都与这些业务成果测量直接相关。“所以认识到你的业务成果是什么,然后围绕它来组织你的数据战略,是第一步,”他说。
从小开始
组织经常犯的一个大错误就是尝试实施一个企业范围的治理项目,该项目立即触及其业务的各个方面。是的,企业范围内的治理策略可能是最终目标,但是大爆炸,海洋型项目很少能在任何IT学科中取得成功。
从数据治理之旅的小步骤开始(MJgraphics / Shutterstock)
为了避免这种错误,Vel建议组织通过为单一业务或域实施治理策略来缓慢开始。一旦他们在该领域成功实施数据治理战略,他们就可以从那里扩展。
“我们经常看到顾客咬的比他们所能咀嚼的更多,所以我们的建议是选择范围更大的东西。” “这可能是您的账单和财务,也可能是您的销售职能。从那里开始,然后扩展并扩大范围,以便达到最终状态,即企业数据治理。“
一旦选择了域并描述了结果,治理过程的下一步就是开始建立组织将依赖的主数据标准来定义他们的数据。
“客户观察到的最常见的挑战之一是定义客户的样子,定义供应商的样子,”。“这很简单,比如你如何定义客户,你如何定义行业分类,你如何定义公司规模,因为销售渠道分配往往是由规模和行业标准驱动的。”
组织可以在实施治理计划时创建自己的数据模型,结构和流程,也可以使用由第三方提供商(包括D&B)建立的标准。“我们强烈建议客户使用参考标准来建立治理,”。
,越来越多的大型企业正在使用语义和图形技术来建立和管理他们的数据定义和模型。“使用语义模型或基于图形的语义模型可以围绕客户,供应商或合作伙伴定义的定义水平比使用传统定义(例如列出名称,地址等)所做的更加强大。 “ 他说。“最大的区别在于你如何捕捉关系,这对你如何围绕该客户或合作伙伴采取行动采取行动至关重要。”
目录:治理代理
组织广泛采用的一种工具来理解其大数据集是目录。数据目录现在很热门,因为它们提供了大量数据集的订单和易于访问,供应商通过推出新的数据目录(几乎每个月)来做出响应。
目录目录越来越多地用于跟踪大数据(cybrain / Shutterstock)
“现在看来,每个人和他们的狗都有一个目录,”数据目录供应商Collibra的CTO和联合创始人Stan Christiaens说。
数据目录销售与治理需求之间存在紧密联系,尽管企业软件购买者可能会质疑他们购买目录作为其数据治理策略的一部分(如果他们甚至有一个)。
“当人们在寻找目录时,在很多情况下他们实际上都在寻找治理类型的功能,”Christiaens说。“他们只是因为他们的生活无法确信实际上是这样称呼的,因为”治理“这个词在组织中具有负面的,类似警察的内涵。”
Christiaens说,当企业买家进行数据目录购物时,他们希望获得业务术语表,数据字典和数据沿袭管理等功能。“所以很多时候,当人们寻找目录时,他们不可避免地会寻找治理类型的功能,”他说,“但他们并不想称之为。”
目录很受欢迎,因为它们与创建,管理,访问,分析和(是)管理数据所涉及的不同业务角色一起工作。Christiaens说像Collibra这样的目录是成功的,因为它们可以满足各种不同的需求。
“参与数据的人物角色非常多样,”他告诉Datanami。“数据架构师将讨论企业数据模型和逻辑模型,而业务人员会说'我关心的只是KPI和报告和指标'。”
目录也是控制数据访问的关键工具,这是治理的另一个不容忽视的方面。“所以你必须一方面迎合不同的角色,另一方面你必须建立这种信任,”克里斯蒂安斯说。“他们需要实施治理控制,但最初只需要很少。但他们确实需要建立。否则,这不是一项可持续的举措。“
联邦治理
当今组织面临的最大治理挑战之一是集中控制和分散行动之间存在的推动和拉动。组织需要对其数据进行集中控制的某些元素,这些元素以大多数分散的方式存在。
联合是在分散的数据世界中保持集中控制的关键
数据目录在某种程度上可以通过提供组织数据的逻辑视图来帮助,无论它是否存在于关系数据库,Hadoop数据湖,NoSQL数据库和云中的S3存储桶中。但是,越来越多的公司需要实施“目录目录”以保持其不断增长的数据集,特别是在云数据存储方面。
根据D&B的Vel,当多个数据集被集成并加入分析用例时,未能遵守集中式数据模型可能会导致糟糕的结果。例如,如果组织计划将意图数据引入营销活动,则如果客户没有确定标识客户的数据,则存在无法正确识别客户的风险。
“必须有一个机制和治理框架,围绕将意图数据或最有可能购买的人数集成到他们的客户或帐户信息中,”。“如果你在没有正确的治理模式的情况下做到这一点,那么将错误的倾向模型或意图数据附加到错误帐户的风险非常高。”
D&B提倡组织拥有全局数据模型,然后为每个业务线或域构建多个本地化数据模型。“很多时候,客户会使用我们的主数据来做这种依恋,这种联系,”“你不能仅仅围绕集中式和全球治理模式来治理框架。根据用例,您可能需要建立该业务功能或该应用程序所必需的本地化模型和框架。“
在许多组织中,治理是一个肮脏的词。正如Collibra的Christiaen指出的那样,许多人将治理与监管合规联系起来,并将其视为有限资源的净流失,而不是增加解决方案。
然而,随着组织继续努力解决他们的分析过程,他们开始意识到他们需要退后一步,从头开始重新思考他们的数据策略。当他们这样做,并从一开始就通过良好的治理计划实施他们的数据战略,他们的成功机会就会大大增加。