首页 行业百科 人工智能 2.0 时代的数据治理 - 序

人工智能 2.0 时代的数据治理 - 序

|亿信华辰大数据知识库2026-01-30

人工智能 2.0 时代的数据治理 - 序

2025 年春节,可能是中国有史以来科技味最浓的一个春节。DeepSeek 引发科技海啸,成为全球探讨最多的话题,其出现的意义似乎超越了 AI 本身,成为发展中国家后发制人的信心载体。DeepSeek 像一把祛魅之剑,斩出了一条中国特色的低算力、高智商、低成本的人工智能之路。

2025 年春节,可能是中国有史以来科技味最浓的一个春节。DeepSeek 引发科技海啸,成为全球探讨最多的话题,其出现的意义似乎超越了 AI 本身,成为发展中国家后发制人的信心载体。DeepSeek 像一把祛魅之剑,斩出了一条中国特色的低算力、高智商、低成本的人工智能之路。


几乎同时,2025 年 2 月 19 日,国家数据局在北京召开高质量数据集建设工作启动会。会议深入学习贯彻习近平总书记关于发展数字经济的重要论述精神,贯彻落实党的二十大和二十届二中、三中全会精神,积极推进落实“人工智能 +”行动,推动高质量数据集建设,高效赋能行业发展。


2025 年 5 月 8 日,在美国华盛顿特区,OpenAI 首席执行官萨姆·奥尔特曼等人出席主题为“赢得人工智能竞赛:加强美国的计算和创新能力”的听证会。出席此次听证会的高管分别是 OpenAI 首席执行官萨姆·奥尔特曼、超威首席执行官苏姿丰、AI 初创公司 CoreWeave 联合创始人兼首席执行官迈克尔·英特拉特,以及微软副董事长兼总裁布拉德·史密斯。几位高管在听证会上警告称,美国出口管制可能迫使其他国家转向中国技术。苏姿丰表示,“若无法让全球采用我们的技术,其他替代方案必将出现。”迈克尔·英特拉特表示,“管制可能会在不经意间限制美国技术和专业知识出口的机会,产生不利影响。”布拉德·史密斯认为,美国要赢得人工智能竞赛,就必须在人工智能技术栈的每个层面支持私营部门发展,同时与全球盟友和伙伴国家建立合作。萨姆·奥尔特曼还警告称,在人工智能领域,美国现在仍处于领先地位,但对中国的领先优势并没有那么大。


与此同时,DeepSeek 一体机火遍中国大江南北,一场声势浩大的一体机发布潮席卷而来,华为、联想等大厂争相推出“一体机”,央国企“豪购”成为新常态,券商更是高呼“五千亿蓝海”在望。据不完全统计,目前已有近百家企业基于 DeepSeek 技术推出了一体机产品,这些产品覆盖了政务、金融、医疗等多个领域。DeepSeek 在算力折叠术、数据瘦身法、生态捆绑杀这样的成本碾压三连招下,成为大模型领域的“价格屠夫”,以低成本、高推理性能、全栈国产化适配,解决了企业“数据不出域、模型私有化”的核心痛点,使得 AI 的应用场景得到了前所未有的拓展。


2025 年 5 月,美国众议院通过的《HR1》法案规定,自本法案生效之日起十年内,任何州或地方政府不得实施、执行关于人工智能模型、人工智能系统或自动化决策系统的任何法律或规定。也就是说,美国将在 AI 领域史无前例地放开法律管制。这场监管与自由的博弈,究竟是 AI 的黄金时代,还是潘多拉魔盒的开启?


我国当前整个 AI 发展重心已经由基础大模型向智能体演进。人工智能通用大模型市场格局已基本稳定,企业普遍希望能够将大模型落地到实际生产中,以产生更大价值,而智能体被认为是当下大模型应用与落地的重要方式。2025 年,智能体聚焦商业化场景,并且在垂直行业领域加速渗透,如金融领域出现智能风控体、智能投研助手,制造领域推出工业大脑、预测性维护系统等,法律领域出现问答智能体,智能体或大模型正从“辅助工具”跃升至“核心生产力”。


人工智能 1.0 是千模大战,各大巨头争夺人工智能的基础设施底层建筑;进入人工智能 2.0 时代,各类面向商业应用场景的智能体应用百花齐放,大家比拼的是业务价值的释放,甚至出现了不好用不收钱的“按结果付费”的新型商业模式,成为人工智能 2.0 时代的“新卷王”。


有价值的技术进步必然以推动生产力进步为标志,反之,不能推动生产力进步的技术是没有价值的。这场 AI 技术带来的狂欢,最终将落实到扎扎实实的业务场景当中。各类大模型的确让 AI 更聪明了,但在企业落地层面,模型之间的差异正在迅速缩小。真正拉开差距的,是企业是否拥有能够与大模型深度结合的高质量私有数据——AI 只有读懂企业自己的数据,才能发挥真正的业务价值。


人工智能 2.0 时代,数据治理工作不仅没有过时,反而更加凸显基础性、核心性的作用。数据是生成式人工智能发展的基础,是决定生成式人工智能的能力和价值观的核心要素,为塑造企业新时代的竞争优势提供了新机遇。


为了保障数据治理机制落地,数据治理过程中使用了各种工具和技术手段。目前,数据治理还存在若干问题。一方面,工具功能不足。当前数据治理工具的功能未能与时俱进,版本迭代缓慢,彼此相对独立,难以应对数据快速增长的复杂局面,不能保证数据收集、存储、处理、共享环节的高效运行,削弱了数据治理机制塑造和落地实践的可能性。另一方面,工具使用能力不足。工具使用者依旧采用传统方式或者传统工具进行数据治理,对新治理工具缺乏了解与认知,缺乏使用和优化数据治理工具的技能。


人工智能 2.0 时代,企业高质量数据语料的匮乏与需求日益增长的低成本算力之间的矛盾成为制约企业人工智能应用价值释放的最主要矛盾。我们要清醒地看到,国内 80% 的企业数据治理工作仍未有效开展,盲目地、一窝蜂地上大模型一体机走跨越式发展的道路是行不通的。


企业的大量非结构化数据未经数据治理是“有毒”的,未经过萃取、提纯、消毒而直接“投喂”给大模型,将把大模型训练成像东邪西毒一样走火入魔。古老的 GIGO(Garbage In, Garbage Out)法则在人工智能时代仍然有效。大模型的幻觉现象本质上是搜索匹配算法失败后的随机数填充。也就是说,缺乏海量高质量的数据语料训练必然导致大模型一本正经地胡说八道。


人工智能 2.0 时代,数据治理将成为企业竞争的基础性能力。笔者大胆预言,人工智能应用的未来最终比拼的既不是大模型的底座能力,也不是各类智能体的开发能力,而是企业对自身数据的知识提炼、治理、应用的水平。谁能够扎扎实实做好本企业的知识管理和数据治理,尤其是面向人工智能大模型语料“投喂”的各种高质量数据集的开发和应用,谁就能赢得最终的竞争胜利。


本书正是在这样的背景下诞生的,我们试图用过去几年数据治理的案例实践萃取中国经验,讲好中国故事。其中,不少数据治理案例在实践过程中其实走了不少弯路,我们也试图把踩过的坑、蹚过的雷给产业界的朋友进行总结分享。希望大家在人工智能 2.0 的狂热时代,既能昂首挺胸满怀信心向前看,也能脚踏实地走稳脚下的路。
毛大群
亿信华辰总经理
睿治智能数据治理平台由亿信华辰自主研发,参照DAMA/DCMM理论体系,结合企业治理实践经验,专为企业数据治理、数据资产管理解决方案提供统一的全链路治理平台。同时,在IDC发布的《中国数据治理市场份额》报告中,连续4年稳居中国数据治理解决方案市场份额第一。
认为本内容有帮助
0
您可能需要的数据产品
亿信华辰助力政企数字化转型
customer

在线咨询

在线咨询

点击进入在线咨询