睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

金融业的数据治理重要开端:数据流入

时间:2019-01-04来源:尼锅浏览数:591


随着科技的发展,当今社会已经进入到了信息时代的下一阶段,“数据时代”,大数据成为了众多行业的风口,数据自然而然便成为了最重要的基础设施。

金融行业站在历史的分叉口中,内有指数型增长的数据量,外有互联网公司的跨界打击,不得不拥抱大数据时代的到来。其实,金融业从来都没有离开过数据,客户信息,是数据,消费记录,是数据,风控模型等等,都是数据,大数据时代的到来,给金融业带来的不仅仅是数据量的大,也带来数据来源广,数据形式多,应用场景丰富等利好,大数据给金融业带来的升级,使得互联网金融业引得无数英雄竞投身。

但恰恰处于风口,其侧翼则更有被忽视的危险,大量数据的流入流出,对金融业的数据治理和数据安全提出了挑战。良好的数据治理,最需要获得也是第一件应该做的事,就是高层的重视,首先要建立数据管理的相关制度,梳理公司的数据框架,建立数据管理职责体系,落到实务上,就是对数据全生命周期进行充分治理,研究数据的保存和使用场景,防范数据泄露,数据滥用,数据丢失等风险。

数据的生命周期,是指数据从创建(流入)、初始存储,到数据使用和处理,最后到它被删除和回收这一系列过程,上图可以比较形象地体现其流转过程。这个环节中的每一步,都决定了我们使用的数据的质量,最终对业务造成实质性影响。

数据治理的第一步,也是最需要把关的,就是数据的流入。千里之行,始于足下,数据的创建和获取质量决定了数据使用的质量。数据的来源多种多样,有业务产生的客户数据和交易数据,有第三方机构提供的信息数据,还有自己主动收集的分析数据;数据从各处流进来,不能在源头就被污染,被泄露,所以对于数据源头的监管就非常重要。

由业务获得和产生的数据,包含了客户个人信息,消费信息,交易数据等大量的敏感信息,对于这些繁多的数据信息,许多金融机构为其设立了一个中心保管地带,就是俗称的数据仓库或者数据湖,流入的数据被保存在这里,供部门调用。对于流入的数据,我们第一步要做的便是对其进行分类设计,实践上也就是根据访问权限对数据进行分类,按照合规要求对分类标准进行检查。所以在这里就必须着重确保用户隐私,对什么数据是可以被访问和修改的,数据的哪些字段是涉及到隐私需要被保护的须有清晰定义,并根据监管部门出台的个人隐私,网络安全保护等法案进行自查自纠,将数据风险纳入全面风险管理体系,在内部稽查审计中着重监督,建立审查体系。所以我们说,数据治理是一项全公司的任务,从它生命周期的开始便可见一斑。

由第三方机构提供的数据,在如今的金融业可以说越来越常见了,无论是各路央企民企的征信数据,还是金融市场的交易数据,还是用户的消费场景,用户画像等,都是当今金融企业不可或缺的数据。例如普惠金融、普惠保险,其核心是风控,最需要的就是用征信数据,如今的征信市场,如鹏元征信,芝麻信用等征信机构正如火如荼地发展着。那么第三方机构的数据质量和业务稳定性就成为了数据流入管理的关键。建立对第三方机构的数据质量监控,动态测评机制,全行业商情监测和预警机制,才能有效保障公司的第三方数据源的高质量和稳定性。其实关于第三方机构管理还有很深的可研究性,就不详细铺开了。

第三种数据源就是由各部门基于各种目的而主动收集的大数据,主要用于市场分析,业务发展等。对于这种数据,除了要考虑到监管合规和隐私保护,还要考虑到商业授权等业务安全因素;其次,这种数据包含有大量文本,多媒体等非结构化数据,对于其合理的整合和存储需要提前考虑IT基础设施的最优化建设,尽可能提取和保留数据中有价值的部分,提供数据使用的效率。

金融业的数据治理是一门非常深的学问,是一门结构化和体系化的科学;数据流入作为数据治理成功的第一步,唯具有高度重视,谨慎治理的态度,才能让数据大厦,万丈高楼平地起。



(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询