- 产品
- 产品解决方案
- 行业解决方案
- 案例
- 数据资产入表
- 赋能中心
- 伙伴
- 关于
时间:2025-10-28来源:亿信华辰浏览数:0次
2025年10月24日,由DAC全球数据资产理事会与湖北省电子信息产品质量监督检验院联合主办,亿信华辰、长沙翼游、高颂数科共同承办的 “高质量数据集建设与数据资产化实践峰会” 在武汉隆重举行。本次峰会以深入贯彻落实国家“数据二十条”精神为核心目标,聚焦高质量数据集建设、全国一体化数据市场培育、湖北省数据要素市场体系建设等关键议题,旨在推动数据产业生态繁荣发展,助力武汉打造全国数字经济一线城市。
 
 
作为国内领先的智能数据产品与服务提供商,亿信华辰受邀出席并发表主题演讲,分享在企业数据质量管控与高质量数据集建设领域的前沿思考与实践经验,引发业界广泛关注。
	
政策引领,高质量数据集成AI发展核心支撑
当前,人工智能正加速进入大模型时代,而高质量数据集已成为决定大模型性能的关键燃料。国家层面高度重视数据要素价值释放,《“数据要素×”三年行动计划》《关于促进数据标注产业高质量发展的实施意见》《国家数据基础设施建设指引》等一系列政策相继出台,明确将高质量数据集建设提升至国家战略高度。
国务院国资委已发布首批30项中央企业高质量数据集,北京、上海、湖北等地也纷纷推进地方性高质量数据集建设。湖北省于2024年底发布首批10个行业高质量数据集,总量达394.1T,覆盖科技创新、医疗健康、交通运输等多个重点领域。
然而,在快速发展的同时,高质量数据集建设仍面临场景脱节、供给不足、标准缺失、合规风险、评价体系不完善等诸多挑战。如何系统化、工程化地构建高质量数据集,成为政企各界亟待破解的难题。
构建高质量数据集建设路径
	
会上,亿信华辰资深咨询专家吴倩发表了题为《企业数据质量管控体系与高质量数据集建设路径》的主题演讲,系统阐述了企业在AI时代下构建高质量数据集的方法论与实践框架。
 
 
吴倩指出,高质量数据集是经过采集、加工处理后,可直接用于训练AI模型,并能有效提升模型性能的数据集合,具备高技术含量、高知识密度、高价值应用的“三高”特征。其建设必须从“为数据而数据”的作坊式模式,转向工程化、系统化、标准化的现代数据工程模式。
为此,亿信华辰提出以“一个体系+一个平台+四项能力域”为核心的高质量数据集建设整体解决方案:
依托DCMM(数据管理能力成熟度评估模型)和高质量数据集评估指标框架,构建覆盖项目管理、组织架构、制度规范、人才管理四大维度的大模型数据管理体系,确保数据工程高效协同、合规可控。
围绕数据集全生命周期,重点建设四大核心能力:
数据汇聚:实现多源异构数据的统一接入与存储。 质量控制:建立五维数据标准体系(基础、技术、业务、管理、安全),实现数据“可用、可信、可联、可溯”。 资源运营:通过分级分类、版本管理、开放共享,提升数据资产流通效率。 开发维护:涵盖数据采集、处理、标注、质检、合成等关键环节,支持预训练、微调、对齐等模型训练阶段。基于亿信华辰自主研发的睿治数据治理平台与ABI数据分析平台,构建高质量数据集开发平台,集成数据采集、标准管理、数据处理、智能标注、质量测评、资产运营等功能模块,实现质量评估指标的工程化落地。
平台采用“自动化为主+人工校核为辅”的检测方式,构建涵盖说明文档、数据本体、模型应用三大维度的评价指标体系,为数据集的质量提升提供客观依据。
	
 
场景驱动,AI for Data与Data for AI双向赋能
亿信华辰强调,高质量数据集建设必须以应用场景为驱动,实现业务目标与数据工程的深度融合。公司已通过AI for Data(利用AI提升数据治理效率)与Data for AI(利用高质量数据赋能AI模型)的双向赋能,打造“数据-知识-智能”闭环。
此次峰会不仅是思想碰撞的盛会,更是合作启航的起点。亿信华辰将继续发挥在数据治理、数据分析、AI融合领域的技术优势与实践经验,携手政府、企业、科研机构等各方力量,共同推进高质量数据集建设,完善数据资产化服务体系,助力数据要素市场化配置改革,为数字中国建设贡献智慧与力量。
END
	 
 
                                                    下一篇:暂时没有了