睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

数据权益保护的“TEAM”标签管理体系

时间:2024-03-13来源:于戏王浏览数:7

前言

挖掘金融业数据资源巨大价值的同时必须确保数据安全,注重对数据主体和数据持有者合法权益的保护。为解决这一过程中的实践难点,本文基于区块链技术,设计数据集动态标签管理“TEAM”体系——一个集Tagging(打标)、Ensuring(保障)、Authorization(授权)、Monitoring(监控)四大功能于一体的保护体系。该体系旨在使公共数据、企业数据、个人数据等各类数据信息在流通与价值释放过程中,能够得到与其安全需求相匹配的“贴身”保护。


数据权益保护的难点及解决思路

金融行业汇聚了包括金融业务数据、企业经营数据、消费者数据、公共数据等在内的各种数据。这些数据来源广泛、涉及主体众多、类别多样,经过汇集、整理、分析、交易后可产生巨大经济和社会价值,为数据主体和持有者带来各种可能的实用价值与经济收益。但与此同时,如果这些数据应用不当,也很容易触发数据权益侵犯和数据安全违规等风险。

各类金融机构在数据收集、获取的过程中,通常会采用必要的措施和审查确保数据采集的合法性和合理性。但是数据在获取之后的处理与流通过程中,普遍缺少有效的管理与监控。从金融机构视角看,因为缺少对数据全生命周期的可控管理,在合规要求下难以对海量的数据进行进一步开发和开放。从监管机构视角看,目前很难全面监督数据处理者对数据的使用和流转是否具有合法授权以及是否匹配其安全等级。要解决这些问题,就需要设计一套可行的数据权益保护与跟踪方案。

本文基于区块链技术,通过建立一套标准化的数据权益保护标签与运行规则,供所有参与数据应用与流通的数据提供方和数据需求方共同遵守,以此保证数据使用的安全性、一致性与合法性,达成对数据主体和持有者权益的持续保护。在数据开放及应用过程中,参与者通过数据集标签即可获得相关授权,并在数据处理过程中对标签信息进行追加,以实现对数据权益的遵守、记录和传递。围绕这一思路,需要建立配套的数据权益保护标签管理体系,形成对数据权益保护的全面高效保障机制。


数据权益保护的“TEAM”管理体系

数据权益的保护既依赖于技术的实现,更有赖于管理措施和机制的完善,需要技术与管理相配合。本文提出的“TEAM”体系,旨在为金融业的数据共享、流通、应用提供一个全面的、可行的解决方案(见图1)。

图1  基于动态标签管理的数据权益保护“TEAM”体系


Tagging(打标):为数据资源提供全生命周期跟踪保护

由于在数据资源的开发与流通中普遍处理的是数据的集合,因此,该方案将打标对象设定为数据集,特别是没有对个人数据进行去标识化或匿名化处理的数据集。一个集中的数据具有基本相同或相似的结构、安全级别、权益标准和应用价值。分析数据集中的数据规模、类型、风险属性、涉及主体,确定其安全分级、限定使用场景、是否可再次流转、是否可用于数据集联合、是否可智能分析和自动化决策等因素,根据这些分析结果为数据集配置标准化的标签。基于区块链技术,在数据集的流通过程中对标签进行动态化、去中心化、不可篡改的管理、记录和跟踪。


打标过程有两个关键点。

(1)第一个关键点,是标签的标准化设计。由于金融行业数据的内容、形式、存储结构、应用场景等复杂多变,因此,需要针对不同的数据集安全级别、数据结构、内容属性以及业务场景,设计出灵活兼容的标签标准,以满足成本、效益、安全的三者平衡。数据标签需包含以下信息。

数据集描述信息:包括数据的规模、结构、内容、范围等信息;

数据主体授权信息:包括授权期限、使用范围、权限内容、权限变更信息等;

数据持有者授权信息:包括数据持有者信息以及对数据再流传使用的权限约束信息;

数据应用约束信息:包括数据集的可应用范围、场景、处理方式等信息;

数据安全等级信息:包括数据集的安全等级、保护级别、保护措施等信息;

数据集防篡改及加密信息:包括根据数据集中的内容形成哈希值,作为数据集验证码,以确保整个数据集的不可篡改性,并采用加密技术保护数据集标签,使之只能被合法的数据使用者进行解读和续写;

数据传输路径跟踪信息:包括记录数据集收集、处理、应用等环节的参与者信息以及数据集的流转和处理信息。


(2)第二个关键点,是标签的全生命周期动态管理,旨在有效约束数据使用的场景、限制数据集或其中部分数据在非授权情况下传播扩散等。标签将跟随数据集从创建直至数据集生命周期结束。在数据集应用流通的各个节点,数据处理者应对标签进行信息追加和维护。

数据标签伴随数据集的自始至终,当数据集的生命周期结束时,在出现以下情况时,标签才会进行归档封存或删除处理:数据集彻底删除;完全融入新的数据集,重新评估形成新标签;数据集分装为两个或多个子集,重新评估打标;数据集结构、规模、重要信息发生变化,重新评估打标(见图2)。

图2  数据权益保护标签的内容及基本使用过程

支持打标环节的主要技术除了区块链技术,还有自然语言处理、机器学习等。需要配套的管理措施有数据分类分级、数据影响评估等。特别是需要大量使用自然语言处理算法对特征字段进行分类打标、敏感分级;利用机器学习技术,结合业务规则和合规策略,使得数据集的打标实现自动化、智能化、标准化。


Ensuring(保障):为数据资源合法开发提供有效监管机制

数据集标签为数据资源的开发应用提供了最直接、便捷的安全监管方法,有助于形成数据流通上下游机构自查、数据交易机构核查、数据和金融监管部门审查的三层数据流通安全审核机制。各层审核的范围可以包括且不限于数据流通与应用中各参与方的数据来源、数据使用范围、授权期限、技术与安全保障能力等是否与数据集标签一致以及数据集标签是否与数据集内容一致。

除了借助于动态标签管理机制,Ensuring保障功能模块还要依赖于数据流通与管理机制的完善,建立数据权益管理的载体与平台,有以下几种方式:一是政府部门或金融监管部门牵头建立金融数据中心和数据权益保护区块链基础设施,发挥政府、监管机构公信、公正、公开的作用;二是数据交易所、数据中介等对数据流通的上下游参与方进行审核;三是金融机构建立健全内部相关制度措施。


Authorization(授权):实现数据权益的管理与激励

在取得数据主体或数据原持有者合法授权后,数据获取方还需要建立对数据授权的跟踪管理,以便有效实现对数据授权的控制、撤销、变更等需求。将数据集动态标签与数据治理体系中的数据资产管理元数据管理等模块相融合,建立数据权益管理机制、多方授权机制等,权益动态标签成为权益管理机制的实现载体和基础。

授权管理模块的相关支持措施还包括:对一揽子授权同意进行细化管理,如权益期限、信息授权分级等;提供对数据授权的查询、撤销方法;同时从政府和监管部门角度设置具有公允性的数据权益保障机制,使金融数据的收集与处理不仅拥有数据主体的授权,而且也遵循数据伦理与法律道德(见图3)。

图3 数据权益保护标签管理与数据治理体系的融合

Monitoring(监控):全网扫描以侦察数据流通的异常

数据集的标签管理也能帮助网络安全机构和金融机构侦察识别无授权使用的数据集,提供防数据泄露、查找数据泄露证据、处置泄露风险的手段。

对金融机构而言,还需在现有的网络安全防护、终端防护、数据库安全管理、防数据泄露等措施和体系的基础上,完善对数据集标签的监控功能,做好数据权益保护的全面监管。


结束语

数字经济发展过程中,金融行业数据开放共享将产生巨大的社会价值和经济价值,数据权益标签的标准化设计有助于加快数据开放共享的进程。未来,随着数据价值的不断挖掘和量化,数据主体及数据持有者对数据的经济价值分配、权益分配等问题也可以基于本文所探讨的动态标签管理机制进行扩展与研究。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询