数据资产入表解决方案

高效数据资产入表规划,专业数据合规,精确成本分摊,释放数据价值,助力国央企和上市公司一站式数据资产入表。

数据资产入表解决方案

高效数据资产入表规划,专业数据合规,精确成本分摊,释放数据价值,助力国央企和上市公司一站式数据资产入表。

数据的确权、流通、入表与监管研究

时间:2023-12-26来源:互联网浏览数:42

本文是系列文章的第一篇——数据与确权。

先说结论:按照现代信息系统的基本工作机理,数据是指有一定结构和含义的二进制数字集合;数据可以分为指令类数据和非指令类数据;非指令类数据可以进一步分为:原始数据(次原始数据),模型数据,结论类数据,自动执行类数据。依据数据的分类和数据处理的特点,对非指令类数据提出数据所有权确权的4条规则:

确权规则一:原始数据(次原始数据)中完全取决于实体本身的属性、状态,逻辑上不依赖特定数值化活动的数据属于对应的主体(被数值化的主体或物的拥有者);原始数据中依赖于特定数值化活动的数据,属于对应主体和实施数值化活动的主体,数据可以去关联后分属相关主体。

确权规则二:主体(人或机构)的原始数据(及次原始数据)的所有权无法改变,但可以设置类似“用益物权”的权利;物的原始数据(次原始数据)的所有权随物的所有权变化而变化;数据集按照“按份共有”的原理确定权属。

确权规则三:结果数据的权属在遵守规则一、二的前提下,可依照《民法典》“添附”规定确定权属(或权益)的归属,默认属于输入数据所有者和处理者共同。

确权规则四:新产生的模型数据、统计/推测/预测结论、研判/决策结论、自动执行数据按照规则三确权,后续可以改变。

一、数据与数据分类

现代信息系统都是基于现代数字计算机技术构建的,因此计算机体系的特点决定信息系统中数据的特点,因此后面的讨论中不在区分信息系统和计算机系统。 

在现代计算机系统中只有二进制的数。人们设计这些系统时,赋予了这些二进制数一定的结构(即:数的排列方式)和含义(即:编码规则),这些有结构和含义的二进制数字集构成为数据。 

数据基本可以分为两大类,即:指令类数据和非指令类数据。 

指令类数据就是直接控制电子开关工作的数据。计算机系统就是通过指令实现基本的四则运算、逻辑判断的。 

计算机里面除了指令类数据之外都是非指令类数据。 

编程人员按照一定的处理逻辑,编排计算机的各种指令,就构成为“计算机程序”。

计算机程序是“指令类数据”最主要的形式。 现代信息系统与现实世界的关系可以抽象为如下模型:

图片

数据存在于“赛博空间”中,“赛博空间”是一个“人造”空间,现实空间与赛博空间的交互,本质仍是人与世界的交互作用,这一特性决定了赛博空间的所有规律都与现实空间有着本质和联系,这也是数据相关问题研究和分析的最基本原则。 

现实空间主要由人、组织和物所构成。 

现实空间和赛博空间有三个非常重要的作用点,即:编程、数值化、现实化。 

人通过“编程”活动,在赛博空间形成指令类数据集,用于对赛博空间内的数据进行处理。 

赛博空间的非指令类数据主要分为“原始数据”和“衍生数据”两大类。“原始数据”是现实空间对象在赛博空间的最初始“映射“,”衍生数据“则是”原始数据“和其他数据在赛博空间内处理后生成的数据。 

考虑到数据“处理”过程的特点,上述模型可以进一步细化为如下图:

图片

现实空间的实体对象可以分为:人、组织、物(包括:自然物和人造物)。人和组织又被称为主体对象,简称为主体。 

现实空间的实体通过数值化过程,其状态、属性等会被赛博空间的数据所表示和记录,这些最原始的数据就构成为“原始数据”。数值化的手段一般有两种,一种是人工输入的方式实现原始数据的采集,另一种是使用工具完成原始数据的采集(如:各种数字传感器)。

原始数据一般会涉及实体的当前状态、属性、关联关系等,也包括原始数据产生(或采集)的时间、地点等。数值化活动一般会发生在两种情况下,一种是在基于信息系统的业务活动中,另一种则是专门的数据采集活动。 原始数据可能因为各种原因,需要进一步的清洗、整理、校准、汇集等,才能形成对现实对象更为真实、全面的反应,这些经过进一步处理的后形成的、对现实实体反映的数据称为“次原始数据”。理论上,对同一现实对象,按照时间顺序排列的原始数据和次原始数据就构成为该对象的“历史数据”,再结合对应的空间信息,就构成该现实对象在赛博空间的“完整反应“。 

原始数据和次原始数据与现实空间对象的固有关联关系是不可改变和消除的,这是赛博空间所有数据处理的基础。后面关于原始数据和次原始数据的确权规则就是根据这一特点制定的。 

人们为了发现规律、分析问题,会汇集各类原始和次原始数据,对其进行分析和处理——即:建模过程,从而可以形成用于分析各种规格和模型的模型数据。模型类数据往往承载了人们发现的现实世界的事实或变化规律与规则。

使用模型数据,可以对原始和次原始数据进行各种处理,主要有两类:一是分析,包括:统计类分析、推测预测类分析,其结果则为各类统计类数据,对未来的推测类数据;二是决策,使用模型,针对原始数据或次原始数据所反应的现实情况,做出某些方面的决策,结果即为:结论类数据。 

在很多场景下(如自控控制、自动驾驶),结论类数据会被进一步处理成可以自动执行的数据。 

现实化环节是赛博空间数据作用于现实世界的关键环节。数据主要通过两种途径影响现实世界,一是通过影响人的行为,人们根据主动或被动接收到的、由数据转化而来的、可理解的信息或指令,做出行为或直接执行决策;二是可自动执行数据被输入到各类自动执行装置中,触发形成各种可以影响现实世界的物理、化学过程。 

小结一下本节的结论:赛博空间数据可以分为指令类数据和非指令类数据,非指令类数据可以进一步分为原始数据、次原始数据、模型类数据、统计预测类数据、决策结论类数据、自动执行类数据。各类数据有与现实实体有着特有的关联关系,这些关系决定了其所有权确权的规则(见第二节)。现实空间和赛博空间的三个交互点,这些节点以及赛博空间内的处理过程构成数据所有者数据相关的基础权利(见第三节)。

二、数据确权规则

数据所有权是数据其他相关权利的基础,因此本节重点描述数据所有权的确权规则。 数据分为指令类数据和非指令类数据。 对指令类数据而言,其主要的形式就是“计算机程序”,又被称为“软件”,在知识产权相关的法律中,相关权利的保护有明确规定。本文不再做讨论。 对非指令数据而言,针对第一节中描述的不同种类数据,提出如下所有权确权规则:

确权规则一:原始数据中(次原始数据)完全取决于实体本身的属性、状态,逻辑上不依赖特定数值化活动的数据属于对应的主体(被数值化的主体,或物的拥有者);原始数据中依赖于特定数值化活动的数据,属于对应主体和实施数值化活动的主体,数据可以去关联后分属相关主体。 

数值化活动是现实空间与赛博空间交互的重要环节之一,原始数据是数值化活动的结果。数值化活动涉及三类主体,即:实施数值化活动的主体、被数值化的主体(人或机构)、被数值化的物的所有者。 

原始数据和次原始数据与现实实体有着固有和不可分割的关联关系,因此原始数据和次原始数据中完全取决于实体本身的属性、状态,逻辑上不依赖特定数值化活动的数据属于对应的主体(或客体的拥有者)。比如:人的姓名、年龄、性别,物的重量、体积等。这些属性、状态可能会被不同的主体多次数字化,这些属性、状态也可能会随时间变化,但无论被如何数值化、如何变化,这些属性、状态与对应实体的关联关系是无法改变的,如果关联关系一旦被改变,数据就失去了价值。所以,此类数据天生决定了属于对应主体,即:被数值化的主体或被数值化的物的所有者。 

原始数据还包括大量的与数值化活动相关的数据。数值化活动会发生在两种场景下,即:业务活动和专门数据采集活动。这些活动的数据与实施数值化活动的主体和被数值化主体之间有着固有的关联关系,因此这些数据属于实施数字化活动的主体和对应主体共有。例如:在网站平台上的原始访问记录属于访问者和网站所共有。对于共有的原始数据,如果将其与某一主体去关联后,则该数据属于剩下所关联的主体。(关于数据去关联的规则,另文讨论)。

确权规则二:主体(人或机构)的原始数据(及次原始数据)的所有权无法改变,但可以设置类似“用益物权”的权利;物的原始数据(次原始数据)的所有权随物的所有权变化而变化;数据集按照“按份共有”的原理确定权属。

主体固有属性、状态所形成的原始数据(即:主体固有原始数据),因其与特定主体(人/机构)特有的不可改变的关联关系,其所有权是无法改变的。即使这些数据被去标识后,这种关联关系也是无法改变的,因此其所有权也是无法改变的。 

物的原始数据根据物的归属关系,属于物的所有主体。如果物的所有主体发生变化,物的原始数据所有权也相应改变。 

对于不同权属的具有相同或类似结构数据汇聚成的“数据集”,可以按照“按份共有”的原理确定该“数据集“权属比例。 

对于无法改变所有权的原始数据和次原始数据,可以通过法律、合同等手段设置类似“用益物权”的权利。通过类似“用益物权”的权利设置,不仅可以解决主体消失(如:人死亡后)后,其固有原始数据和次原始数据开发利用的问题,也可以为物的权属转移导致的数据权属变化提供一种解决的方法。

确权规则三:结果数据的归属在遵守规则一、二的前提下,可依照《民法典》“添附”规定确定权属(或权益)的归属,默认属于输入数据所有者和处理者共同。 

结果数据是指对输入数据进行处理所所生成的数据,结果数据的确权涉及输入数据的所有者和数据处理者两类主体。 

次原始数据是对原始数据综合处理(如:清洗、纠正、去重等)后形成的结果数据,但次原始数据处理的目的是更为准确反应现实实体的属性、状态及其历史变迁,因此需要按照规则一、二对次原始数据归属进行确权。 

除次原始数据外,其他的结果数据,在没有法律规定、主体之间也没有协议约定的情况下,《民法典》中“添附“是可以适用的规则。如果按照添附规则仍无法确定权属的,结果数据默认由数据所有者和处理者共同拥有。 

《民法典》中将“添附”分为了三种情况,即:加工、附合和混合。《民法典》中的”加工”,非常类似于简单的数据收集、汇集工作,结果数据往往是输入数据的简单“合并”和简单变换,或者结果数据只是输入数据的子集和简单变换;“附合”则非常类似结果数据中“嵌入了”部分(或全部)的输入数据,一旦将所嵌入的输入数据剔除掉,结果数据就失去了使用价值;“加工“对应于结果数据中不包括任何的输入数据的情况。 

确权规则四:新产生的模型数据、统计/推测/预测结论、研判/决策结论、自动执行数据按照规则三确权,后续可以改变。 

模型类数据、各种统计类/分析类/决策类/结论类数据、自动执行数据都是基于一定的输入数据,经处理后生成的,可以根据规则三进行确权。这些数据的所有权可被改变,即:这些数据的所有权可以转让。

三、数据的所有权与其他权利

所有权是数据的基本属性,也是数据其他权利的基础。辨析数据相关的其他权利与所有权之间的关系,则是数据合理流通、合理利用的基础。 

从第一节的模型可以看到,非指令类数据相关的基本权利可以分为三个,即:数值化的权利、处理的权利和现实化的权利。赛博空间的数据只有两个用途:被处理以产生新的数据,被现实化以影响现实世界。 

另外和数据相关的还有一个权利就是,数据的持有权。这是由数据的特点所决定的。数据是存在于赛博空间的,因此数据都需要依附一定的载体而存在。在现代网络化的信息系统中,这些物理载体的所有者和数据的所有者可能并不是同一个主体,从而产生了数据的持有者与数据的所有者并不是同一个主体的情况——数据持有权。数据在载体上的存在可能有两种情况:密文态和明文态。 

另外,持有权和处理权之间有着非常微妙的关系:处理者必须持有数据才可能对数据进行处理,这是现代信息技术特点所决定的。在同态计算技术没有成熟之前,处理者还必须明文持有数据。 

本节讨论这四项权利数据所有者对这四项权利授权情况。

(1)数值化的权利

数值化的权利决定了现实世界实体能否被赛博空间的数据所描述和反应,因此该权利属于现实空间的主体和物的所有者,即:“现实主体“。 现实主体在业务交互场景中,为保证业务的完成,在业务交互的过程中隐含将数值化的权利授予了业务运营者,从而能够实现业务的交互,共同完成相关的业务活动。在这种场景下,现实主体的隐含授权仅仅是业务完成所需的最少量数据,这就是很多法律、法规中提出“最小必要原则”的根本原因。除业务的“最小必要原则”外,现实主体还会根据相关法律规定的监管要求,隐含授权采集一些额外的信息。

换另一句话说就是:现实主体对数字化权利的授权仅仅限于业务“最小必须“和”法律监管”两个方面。 现实主体在专门的数据采集场景中,则是根据与数据采集者达成的协议,授权数据采集者数值化的权利。 在实际社会活动中,存在业务运营者(或数据采集者)超授权进行数值化活动的情况(即:超范围采集数据)。另外,对一些特殊的数值化活动(如:摄像、录音等)则存在直接和间接侵犯现实主体数值化权利的情况(即:未经授权的数字录音、录像)。

(2)处理的权利

对原始数据和次原始数据而言,数据所有者的授权往往是基于业务交互隐含完成的,换另一个角度来说,原始数据和次原始数据的所有者是基于业务交互的必须,授权业务提供者对原始数据和次原始数据进行处理的。从严格的意义上来说,数据主体并未授权业务提供者对这些原始数据和次原始数据进行业务活动不直接相关的处理,更没有授权进行无关的处理。至于何为业务相关的处理,需要在实践中给出更为清晰和明确的界定。这对于现实主体和业务提供者才是公允的。 对模型类数据和其他数据而言,只需其所有者授权,相关处理者即可进行进一步的处理,生成新的数据。

(3)现实化的权利

现实化是一个非常特殊的环节,是赛博空间数据作用于现实空间的关键环节,因此其授权需要更为细致,才有利于保护数据所有者的权益,同时也有利于防止数据被滥用。 对可现实化的数据而言,数据拥有者首先应考虑被授权者的身份,并将实施现实化的手段、方式、时间、物理和逻辑地域(或位置)、过程、对现实空间的作用范围等因素作为授权的内容。

(4)持有的权利

前面提到了持有权利和处理权利之间的微妙关系,因此,当数据所有者授予处理权的时候,就意味着授予了明文持有的权利。 常见的单独数据持有权利授权发生在存储的委托数据传输、数据存储、数据备份、数据恢复等服务场景中。在这些场景中,被授权者只是持有数据,不会对数据做任何处理。 在明文数据持有的场景,数据所有人与授权持有人可能只有合同和协议的约束,并没有更加有效的技术保护手段,因此数据存在被非授权复制的风险,从而损害数据所有者的权益。 在密文持有数据的场景中,如果相关技术手段(尤其是密码技术)得到了有效和正确的使用,可以有效降低数据非授权复制的风险,有效保护所有者权益。 

在实际社会活动中,存在利用免费明文数据持有服务(如:各类免费网盘服务)换取数据处理授权的商业模式。在此类商业模式中,并没有对数据处理范围清晰和明确界定,因此此模式存在对数据所有者权益侵害的风险。

四、一些场景案例

下面提供两个场景中数据权属的确定案例。这两个案例描述了按照前面所述规则,场景中所产生的主体原始数据和次原始数据的归属。

(1)网站购物的原始数据和次原始数据归属

人们在一个购物网站浏览时,与购物网站进行了很多的互动,这些互动会产生大量的原始数据,这些数据一般可以分为两类:记录购物者与网站交互行为的数据,比如:登录网站的时间、浏览的货品记录等;以及购物者提供的自身特有的数据,以便网站完成相关服务,常见的有:个人的身份信息、身体尺寸信息、物流地址等信息。 

按照前面的确权规则,“记录购物者与网站交互行为的数据“应属于网站和购物者共同拥有。网站可以在去除购物者标识后,将这些数据转化为网站自己拥有。对购物者也是一样,购物者可以将自己的网上购物记录,去掉网站标识后,转化为自己的数据。 

至于购物者特有的信息,则属于购物者所有。 举例来说: 比如网站的一条记录“某时间段、某IP地址、某账号用户、浏览了A、B、C……等商品“,就是属于网站和用户共有的数据。网站可以在去除”某IP地址“和”某账号用户“后,将该数据转化为自己所拥有的数据。 对用户而言,有一条记录“某个时间段、在某网站、浏览了A、B、C……等商品“,也是属于用户和网站共同拥有。用户可以在去除”在某网站“信息后,将该条数据转化成自己所有。

(2)病人医院就诊的数据归属

随着医院信息化覆盖的范围原来越广,病人在医院就医越来越方便,整个就诊过程在医院的信息系统中留下了大量的数据。这些数基本可以分为两类,一类是病人与医院设施、医生交互所产生的数据,比如:挂号的记录、医生的诊断、处方等,这些数据应该是属于医院和病人共有的;另外一类是病人症状、身体状态等的记录,这些数据一些来自与医生的询问、观察,一些来自于各种医疗检查设备、仪器的检测,如:X光片子、血检的各项结果等,这些数据应属于病人,而非医院,根据本文前面的确权规则,这些数据完全取决于病人,而非医院的检测手段,病人为诊断和治疗而允许医院对这些数据的采集(数值化)和处理,但这些数据仅仅与病人相关,病人在任何一家规范的医院进行检测都会得到同样的数据。这也是很多地方进行的检测信息跨医院互通使用的基础。

本文是系列文章的第二篇——数据与流通。 先说结论:数据在不同主体(人/机构)控制的赛博子空间之间的流动,构成为数据流通;为一定经济目的而实施的数据流通则为数据交易;不是所有的数据服务都是数据流通,只有服务接受者自主决定数据处理方式的才是数据流通。 数据流通规则分为通用规则和分类规则两类。

流通通用规则一:默认约定下,流通或交易的数据只能被使用者使用,不能被使用者再次流通或交易,除非与数据所有者另有约定,使用者依据约定再流通或再交易。

流通通用规则二:默认约定下,共有数据的流通或交易授权和收益分配,应由共有人商定。

流通通用规则三:数据交易分为使用权交易、所有权的交易;使用权交易以次数为基本计量单位;所有权交易只适用于所有权可以转移的数据,默认情况下,所有权转移不影响原所有人做出的数据使用的授权,也不应损害相关方的合法权益。 

分类规则需要针对原始数据和次原始数据、模型数据、统计/推测类数据、研判/决策类数据分别制定。

一、数据的流动、流通、交易、服务

如本系列文章第一篇——数据与确权中所述:现代信息系统所承载的数据是存在于赛博空间的,是按照人所规定的排列规则和编码规则组织在一起的二进制数,也可以称为“数据集”。现实世界里纸面上写、谈话中提到的数据不是本文讨论的对象。 赛博空间并非是一个统一的空间,而是由很多子空间构成(即:不同的信息系统)。

当一批数据从一个子空间进入另一个子空间时,就构成“数据流动”。不同的子空间可能会有不同的排列规则和编码规则,在数据流动时两个子空间必须遵守共同的排列规则和编码规则,才能实现数据流动,这就是各种网络通信协议、数据交换标准格式存在的原因。 

如第一篇所说:非指令类数据存在于赛博空间的用途只有两个:被处理以生成衍生数据、被现实化以影响现实世界。现实情况下,数据流动并不一定是为了处理,比如:通信过程,数据从通信终端进入通信网络,是一种数据流动,但严格意义上的通信网络并不会处理终端所发送的数据以生成新的数据,而只是将数据送到接收终端。从理论上来看,通信网络和专门的存储设施,只是赛博空间的物理载体,其作用是支撑子空间之间的数据流动和承载子空间的数据。因此,本文讨论的数据流动是指为数据处理和现实化而发生的不同子空间之间的数据流动。 

现实世界中,子空间可能被不同的现实主体(人或组织)所建设、拥有和运营,在不同现实主体控制子空间之间的数据流动就是数据流通,即数据在不同主体之间的流通。与数据流动一样,本文讨论的数据流通也是指为数据处理和现实化而发生的、在不同主体之间的流通行为。

与数据流动不同,数据流通更关注数据在相关主体之间的流动,数据流通会涉及相关主体控制的多个子空间的数据流动。 现实主体之间如果为一定的经济目的而进行数据流通,则为数据交易。 在各种涉及数据的文献中还有一个术语:数据服务。这里的服务一般会有两种含义:一种是技术层面的,是指计算机程序之间的一种交互(或架构)方式,即:客户端——服务端架构,信息系统通过服务架构实现网络化、分布式的系统部署和信息处理功能;另一种是商业模式层面的,即:利用信息技术,实现的一种不可以存储、及时交付成果的商业模式。

两种含义的服务下,都会涉及到数据在不同子空间之间的流动,但是否都是本文所讨论的数据流通和交易,则需要从服务接受者对所接收数据的处理权限范围和程度来判断,只有那些服务接受者能够自主决定对数据的处理方式、手段、逻辑(或者说,自主决定用于处理数据的”程序”)的才是本文讨论的数据流通和交易。 本文讨论的所有规则均针对非指令类数据。

二、数据流通规则解决的问题

在经济学家对数据要素流动的研究中发现,制约数据要素流动的因素主要有四个:数据涉及多种社会主体,而且无法控制数据使用者对数据的二次传播,导致数据权属确定复杂;数据要素权益在相关主体之间缺乏有效和公允的分配机制;缺乏数据价值评估手段;面临以个人隐私保护为代表的安全风险挑战。 本文拟从交易规则方面提出上述问题的解决方案。

 “数据的二次传播”是损害数据所有者权益的主要因素,这是本文提出数据流通通用规则一的根本原因。通用规则一配合第一篇中的数据确权规则,可以作为解决第一个制约因素的基础。 “公允的权益分配机制”是数据要素流动激励机制的核心内容,配合第一篇的确权规则,本文提出了通用规则二。通用规则二内容是基本常识,但在现实中却是被大家无意或故意忽视。

这其中既有客观原因(如:实际操作难度),也有主观原因(怕既得利益受到损害)。但我们认为:结合合理的确权规则,基于现有法律规定的基本规则(如:民法典),是可以找到合理和公允的权益分配规则和机制的。 “缺乏有效和客观的价值评估方法”是数据流通落地实操的难点。

本文在通用规则三中尝试从交易“标的物”——使用权交易和所有权交易、使用权交易基本计量单位、所有权转让对既有权益影响三个方面做出交易约定,以支撑流通交易过程中对数据价值的评估。本文还针对不同种类数据特点,提出了其成本和收益应关注的点。 

 “安全风险挑战”也是数据流通必须面对和解决的挑战。本文在规则三中提出了要避免损害各方合法权益的约定,同时在分类数据交易规则内容中,明确提出了根据数据分类对数据交易双方资质、数据使用合规性的约定内容。安全风险问题的解决仅仅依靠数据交易规则是不够的,还需要监管机制、技术和支撑设施等的全面保障(本系列文章的第四篇会就监管方法进行讨论)。

三、数据流通规则

数据流通和交易规则分为通用规则和分类规则两类。 通用规则是数据流通和交易均应遵守的规则,也是保护数据相关方合法权益的基础。

流通通用规则一:默认约定下,流通或交易的数据只能被使用者使用,不能被使用者再次流通或交易,除非与数据所有者另有约定,使用者依据约定再流通或再交易。 这一规则实质是保护数据所有者和使用者(包括持有者)权益的,同时规范数据使用者行为的,尤其是明文持有者。数据流通意味着数据从所有者控制的子空间,为授权的数据处理而流入使用者控制的子空间。如果数据使用者将所获得数据再次进行流通和交易,显然就会损害数据所有者的权益。本规则就是为防止这种情况的发生而制定的。

流通通用规则二:默认约定下,共有数据的流通或交易授权和收益分配,应由共有人商定。 从本系列文章提出的确权规则可以看到,无论是原始数据还是衍生数据,都存在大量的共有情况。这是本规则制定的根本原因。从现实实践来看,对现有很多数据持有者来说,尤其对一些已经持有大量数据的持有者来说,按照确权规则与所有共有者进行协商不具有现实可操作性。对这种情况而言,应由各方代表,制定一个合理与公允的存量共有数据流通授权和交易收益的规则。对于新增数据,则应预先商定好相关的规则。

流通通用规则三:数据交易分为使用权交易、所有权的交易;使用权交易以次数为基本计量单位;所有权交易只适用于所有权可以转移的数据,默认情况下,所有权转移不影响原所有人做出的数据使用的授权,也不应损害相关方的合法权益。 

这是对数据交易规则的进一步细化,也是为数据价值评估和入表奠定基础。  

使用权交易是指数据所有者以收费的方式对其他主体授予对其所拥有数据进行处理(或现实化)的权利。就处理权利而言,这种授权应该还包括对衍生数据所有权以及相关权益的约定,否则就应按照确权规则确定衍生数据的权属。对一个数据集而言,使用次数作为使用权交易是比较合理的基本计量单位。至于每次使用的费用如何确定,则跟数据内容及其获取成本,以及期望的交易次数和收益有关。

对原始数据而言,其成本主要由数值化成本、存储成本、交付成本组成,且原始数据一般会在实施数值化主体控制的子空间中产生。对衍生数据而言,其成本主要由输入数据授权使用费用、处理成本、存储成本、交付成本等构成。对现实化权利而言,授权费用除考虑数据获取费用外,还应考虑数据现实化后经济效益的合理分配。 所有权交易,只适用于所有权可以转让的数据。数据所有权一旦转移,原所有人将失去授权数据流通和交易的权利,且在未得到新所有人授权的情况下,也不能对数据进行处理(或现实化)。所有权转移后,原所有人做出的数据授权可能还有效,这些授权不受数据所有权转移的影响。

由于通用规则一的存在,新所有人的权益也会得到有效保障。 在上述通用规则的基础上,还需针对原始数据和次原始数据、模型数据、统计/推测类数据、研判/决策类数据分别制定对应的具体流通和交易规则。之所以需要这样做,是因为这些数据的特点和潜在应用场景差异较大。

从我们的研究来看,甚至针对每一类数据提出实际可操作的规则都有难度,而需要根据一定领域、行业,分别研究制定。下面描述的并非实际可操作的分类流通和交易规则,而是这些规则制定的一般内容和制定的原则。 分类流通和交易规则至少要包括如下内容:流通或交易双方的资格/资质要求、数据质量指标、数据使用授权合规性要求和审计要求,可选内容包括:交易定价规则、纠纷处置。下面针对不同种类的数据,说明其流通和交易规则制定需考虑的要点。 对原始类数据和次原始数据而言,要综合考虑数据内容、数据所有者、数据持有者、流通/交易双方的情况。

因为原始数据和次原始数据反应了现实对象(人、机构、物)的属性、状态、关联关系、变迁历史等信息,而且不同数据集在这些信息的精度、准确度等方面还有差别。现实空间不同物的所有者也有很多种类,除了自然人外,按照所有制还可以分为:企业所有、事业单位所有、政府所有、集体所有、国家所有和其他机构所有等多种类型。举例来说,按照我国法律,土地资源为国有或集体所有,因此土地相关的大地测绘数据(这是次原始数据)按照确权规则就应该为国家和集体所有。现代GPS技术的发展,测绘的门槛已经很低,很多人、机构都会因为各种原因而持有一定的测绘数据。这些数据的精度、范围差异很大。

显然这些数据是不能随意进行流通和交易的。按照现行的法律和规定,这些次原始数据可以在一定的应用场景采集后,结合其他数据进行处理,完成应用业务后,就应被删除。只有专门资质的企业和机构之间才能进行这些次原始数据的大规模流通。因此,在原始数据和次原始数据的流通和交易规则中,最重要的就是对流通和交易双方资质、及其所能交易的数据内容进行规范。 

对模型类数据来说,更多要考虑数据使用合规性的因素制定流通和交易规则。举例来说,有一些与人的生物学特性相关的模型,会涉及伦理问题,因此在具体的交易规则中应在使用授权合规上予以规定。 对于统计/预测类数据、研判/决策类数据,这些数据基本都有着很大的现实化价值,因此流通和交易规则要充分关注这一点,尤其在定价规则上,应尽可能充分考虑各方的权益合理分配。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
产品功能
丰富的数据资产类型

该平台支持多种资源的定义和规划,包括数据库和文件等结构化和非结构化资源,并封装逻辑资源为数据产品,以全面盘点企业数据生产要素。

智能的目录活化管理

可配置的资产目录详细描述数据资源的各类信息,与元数据集成,实现批量盘点和自动更新,以应对资源变更。

多样的数据服务方式

平台管理的数据资源可快速开发多种服务,包括数据查询、下载、API、分析产品授权等高附加值服务。

全流程数据安全管控

平台内置自定义数据资产服务工作流,可根据权责划定服务审批对象,同时支持数据权限控制。数据消费者获取的数据会按照分级分类要求进行脱敏和加密处理。

可视化数据资产服务门户

平台盘点的数据资产以数据商品形式在门户中对用户开放,用户可通过分类、标签、评级和关键字检索查找资产并发起服务申请。

customer

在线咨询