睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额》报告中,连续四年蝉联数据治理解决方案市场份额第一。

可信数据空间通用架构图全解

时间:2025-11-03来源:与数据同行浏览数:4

想象一下,不同企业、政府机构都拥有自己的宝贵数据。过去要合作,要么数据拷贝风险极高,要么集中到平台担心被滥用。

可信数据空间彻底改变了这种模式。它在各个"数据城堡"之间建立了一个高度互信、规则透明的"经济特区":

• 数据主权至上:数据永远保留在自己手中,你拥有绝对控制权

• 规则共治:成员共同商定并遵守治理框架,保证公平合规

• 价值交换:数据价值可以安全流通和融合,创造新价值

下面这张可信数据空间架构图(二级图,三级图见文末),正是这个"数据特区"的建设蓝图。

数据提供方:企业、政府机构、医疗机构、工业物联网平台等数据拥有者,希望在确保安全合规前提下释放数据价值。

数据消费方:业务应用、数据分析平台、AI/ML平台等,希望利用数据优化业务。

连接器:每个参与方配备的关键组件,相当于派驻在"数据特区"边境的"海关"。负责执行策略、安全通信、记录日志,是保障数据主权的技术基石。

架构图右侧的紫色支柱代表"治理、风险与合规",是贯穿所有技术环节的"根本大法"。包括:

• 法规遵从与政策:符合数据安全法、GDPR等法律法规

• 标准与认证体系:采用国际标准,成员资质认证

• 生态治理与仲裁:治理委员会制定规则,解决纠纷

• 风险管理与审计:持续监控风险,确保合规

这个治理支柱将商业信任、法律信任转化为机器可执行的技术信任。

L1 数据服务层

面向数据消费者的"应用商店"和"交易大厅":

• 数据产品管理:将原始数据打包成标准化产品

• 数据发现服务:让消费者轻松找到需要的数据

• 合约管理服务:双方签订电子使用合同

• 访问控制服务:发放访问令牌

L2 可信机制层

整个架构的信任核心,提供四大能力:

• 身份与信任锚:为参与方颁发无法伪造的数字身份

• 隐私保护与计算:通过联邦学习、安全多方计算、可信执行环境等技术,实现"数据可用不可见"

• 策略执行与使用控制:自动严格执行合约条款

• 存证与溯源体系:为每次数据操作盖上不可篡改的时间戳

L3 数据空间基础层

数据空间的"通信协议"和"基础工具集":

• 元数据代理与目录:管理所有数据产品的说明书

• 数据连接器核心框架:确保所有连接器遵循统一标准

• 密钥与证书管理:安全管理加密和身份认证的密钥

• 互操作协议:实现跨空间联邦协作

L4 基础设施与运行环境

最底层的物理或虚拟资源,包括云计算、网络、存储和可信硬件等。

一家药企想训练AI模型预测新药疗效,但需要两家三甲医院的患者数据。问题来了:医院不能把病历直接给药企,这违法!怎么办?

答案就是下面这张流程图展示的"可信数据空间"方案。

在开始之前,先认识图中的"演员":

蓝色方框 = 医院A

紫色方框 = 医院B

红色方框 = 药企

蓝色虚线 = 控制面(身份验证、授权指令)

绿色实线 = 数据面(真正的数据流动或计算)

步骤1:准备与发布

通俗理解:医院"摆摊"上架商品

两家医院不会真的上传患者数据,而是在数据空间里发布一个"数据产品目录",就像在淘宝开店但只放商品介绍,货还在自己仓库里。

这个"产品目录"包括:

数据说明书:有多少患者、什么类型的数据 使用规则:只能用于AI训练,不能下载,不能查看原始数据

关键技术:调用L1层的"数据产品管理"功能,在符合《个人信息保护法》的框架下完成发布。

步骤2:发现与协商

通俗理解:买家找货、讨价还价、签合同

药企在数据空间的"搜索引擎"里输入关键词"癌症+基因数据",找到了两家医院的产品。

接下来三方坐下来谈判:

药企说明:我要训练什么模型、用多久 医院确认:你只能这样用,不能那样用 三方签署智能合约:把上述约定变成代码,自动执行

这份合约就像外卖订单,一旦签了,系统会自动监督执行,谁也别想违约。

关键技术:合约内容会被区块链存证,确保不可篡改。

步骤3:身份验证与授权(控制面)

通俗理解:三方亮"身份证",门卫查验通行证

当药企真正启动AI训练任务时,魔法开始了。但在数据动起来之前,必须先过"安检"。

三方的连接器(想象成派驻的外交官)进入控制面:

各自出示数字身份证(DID),证明"我是我" 策略引擎调出第2步签的合约,检查"这次操作在允许范围内吗?" 验证通过后,发放一次性"访问令牌"(就像演唱会门票)

重点:整个过程只是"握手"和"验证身份",一个字节的患者数据都没动!

这就是控制面与数据面分离的精髓——先谈好规矩,再办事。

关键技术:分布式身份(DID)+ 策略引擎自动判断

步骤4:安全计算执行(数据面)

通俗理解:数据留在家里,只让"计算"出门

控制面亮绿灯后,数据面被激活。这一步是整个流程的核心,我们分三个小环节看:

药企把一个"空白"的AI模型(就像未经训练的新手)发给两家医院。

模型在医院A的服务器上,用医院A的患者数据训练了一轮 病历数据一步都没离开医院! 就像在保险箱里加工 训练完后,只提取"模型参数"(一串加密数字),这些数字本身看不出任何患者信息 医院B做同样的事

打个比方:就像你请两个大厨(医院)用他们的独家食材(数据)做菜(训练),但你不能进厨房、不能看食材,大厨只告诉你"需要加3克盐、5克糖"(模型参数)。

两家医院把加密的"模型参数"发回药企 药企把两份参数融合,生成一个更强大的新模型 这个过程重复多轮,模型越来越聪明

技术黑话翻译:这个过程叫"联邦学习"(Federated Learning),整个计算还可以在"可信执行环境"(TEE,一种加密芯片)里进行,就像给保险箱再套一层金库。

关键成果:数据可用不可见!

步骤5:结果获取与审计

通俗理解:拿成果、留证据

最终,药企拿到了一个融合两家医院数据"智慧"的高性能AI模型,可以精准预测药效。

但是:

药企从头到尾没看到一条病历 医院的数据一直在自己服务器里 每一次操作都被忠实记录,监管部门随时可查

就像外卖订单:

你吃到了饭(拿到模型) 商家原料没丢(数据没泄露) 平台有完整配送记录(审计日志)

关键技术:区块链存证 + 审计日志,确保"事后可追溯"

通过这五步,可信数据空间实现了:

✓ 数据主权:医院始终掌控数据,药企无法接触✓ 数据可用不可见:数据价值被利用,但数据本身不出域✓ 使用可控可计量:智能合约自动执行,每次使用都有记录✓ 流通可信可追溯:全程加密、存证,监管无忧

大家可以看到,可信数据空间不仅是技术框架,更是一种全新的、基于信任的数据协作哲学。理解并拥抱可信数据空间,将是开启下一个数据价值时代的钥匙。

希望对你有所启示。

附录:三级架构蓝图

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询

在线咨询

点击进入在线咨询