睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额》报告中,连续四年蝉联数据治理解决方案市场份额领先。

国家数据局官方解读:高质量数据集建设六大行动!

时间:2026-05-04来源:数据资产学习浏览数:11

第九届数字中国峰会,国家数据局局长刘烈宏在高质量数据集数和据标注论坛致辞,2026为我国数据要素价值释放年,高质量数据集实施方案修改完善后将尽快印发,六大行动主要内容包括:

1. 强基扩容行动,为AI训练和发展提供充足“燃料”

人工智能正从大语言模型向多模态模型、从基础模型向行业模型、从内容生成向智能体自主决策、从数字智能向具身智能演进,对数据集供给规模、质量和形态提出了更高要求。强基扩容行动主要内容,一是聚焦科学研究、工业制造、医疗卫生等重点领域,以及低空经济、具身智能等创新领域,持续拓展行业资源。二是通过先行先试、链主带动、公共数据授权运营等方式,扩大供给规模。三是顺应人工智能发展范式,围绕智能体、具身智能、世界模型等领域,布局前沿领域数据集建设。四是强化与数据基础设施的有机联动,推动数据集安全存储、可信流通、高效应用。


2. 标注攻坚行动,数据标注专业化、智能化、体系化发展

数据标注就是对未经处理的原始数据进行添加说明、解释、分类或编码的过程,是推动建设行业高质量数据集关键环节,呈现出“技术密集型”和“知识密集型”的趋势。标注攻坚行动主要内容,一是发展人机协同的智能化标注和专家型标注服务,全面提升数据标注水平。二是梯次布局数据标注创新试验区,因地制宜引导创新能力强、发展基础好、产业特色优的地区开展建设。三是建设专职与兼职相结合的专业标注人才队伍,扩大数据标注人才供给。


3. 提质增效行动,降低训练推理成本,提升模型性能

2025年,用于人工智能训练和推理的数据总量为199.48艾字节(EB),同比增长42.86%,推理数据首超训练数据量,数据赋能人工智能迈入规模化应用的新阶段。提质增效行动主要内容:一是加强数据清洗、增强、标注、对齐、质检等关键技术攻关,以智能化手段重塑数据加工链路。二是加快推进高质量数据集格式、类型、标注、质量测评等相关国家标准研制和应用落地。三是持续完善“数据质量验证+模型应用反馈”的测评方法,推动高质量数据集质量测评结果互认,着力打造技术可行、实用便捷、质量保障的AI-Ready高质量数据集。


4. 应用赋能行动,数据集建设与实际应用深度融合

“人工智能+”到哪里,行业高质量数据集建设就到哪里。应用赋能行动主要内容,一是以模型应用牵引数据供给、以数据驱动模型迭代,推动形成“数据飞轮”应用闭环。二是打造一批集“数据集生产加工和流通利用、支撑模型训练应用”于一体的数据赋能工厂,和一批“数据×智能体”示范工程,加速推动人工智能应用落地。三是强化与各行业领域的有效衔接,推动建设特色鲜明的数据集,持续繁荣数据集协同发展的生态。


5. 管理服务行动,推进数据集建设体系更加规范有序

提升数据集质量与可用性,打破“数据孤岛”“数据烟囱”,充分释放数据要素乘数效应的重要支撑。管理服务行动主要内容,一是建立健全数据集全生命周期管理体系,打造国家数据集管理服务平台,实现数据集目录、供需等信息互联互通。二是进一步探索面向人工智能发展的数据权益相关制度,打造权责清晰、合规包容的制度环境。三是坚持伦理先行与公平普惠,防范数据偏见与歧视等风险。


6. 价值释放行动,实现数据集有偿使用的价值闭环

数据集价值包含要素价值和应用价值,是数据集真正流通起来、用起来,深度赋能千行百业最直接方式。价值释放行动主要内容,一是鼓励“以数换数”、“数模互换”等多种应用模式,推动行业高质量数据集跨行业、跨领域、跨场景融合利用。二是推动数据集在数据交易所等平台挂牌交易,探索词元交易等新型交易模式,打造可量化、可定价的数据集价值体系。三是探索行业高质量数据集资产化创新路径,拓宽数据价值转化渠道。四是培育为高质量数据付费的市场共识,支持数据资产等无形资产投资。数据资产服务营联合体简介 凝聚行业专家、企业及咨询评估机构,提供数据培训、项目实施、平台建设、数据资产开发利用等多维度一体化服务,从DCMM诊断、咨询、证书到数据要素价值释放全过程技术服务!
(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询

在线咨询

点击进入在线咨询

联系客服

扫描下方二维码,添加客服

亿信微信二维码

扫码添加好友,获取专业咨询服务