睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

行业大模型平台建设框架、关键技术及应用实践

时间:2025-07-15来源:软件定义世界(SDX)浏览数:4

我国钢铁工业是国民经济的重要基础产业,是国家经济建设的中流砥柱,是建设现代化强国的重要支撑。钢铁工业历经起步时期、加速时期、高速时期和全面发展时期,目前进入周期性调整阶段,呈现“三高三低”的复杂局面,表现为高产出、高成本与高排放并存,同时遭遇低需求、低价格和低效率的挑战,面临着阶段性供需矛盾加大、行业利润下降等困难。传统的生产管理和调度方法已难以满足当前高效、低碳生产的需求,为钢铁行业的智能化转型带来了新的机遇和挑战。钢铁流程行业亟需通过提高生产质量、降低生产成本、提升生产效率,来应对复杂的生产与管理挑战。


钢铁行业正处于产业转型的关键阶段,以大模型为代表的新一代人工智能(AI)技术已成为推动产业变革和行业转型的核心动力。面对科技的飞速进步,我国制定了差异化的发展战略,着重发展行业垂直领域的工业大模型,以实现精准赋能,提升行业竞争力。由于工业领域场景具有专业化、多元化、碎片化的明显特征,依靠单一的基础大模型并不能很好适应各类工业领域需求,因此需要打造钢铁行业大模型及平台,深入理解并精准服务于行业独特需求。


人工智能技术在钢铁领域的应用面临诸多挑战,难以充分满足行业的复杂需求,主要体现以下三个方面:

一是缺乏赋能钢铁行业的体系化方法。目前业内对于人工智能技术的应用都还是零星点状的,在以人工智能的全局视角策划钢铁行业转型升级路径方面缺少体系化的方法和模式,亟需探索如何加强人工智能与钢铁行业的深度融合,以人工智能技术重构业务内涵,实现全新业务形态与模式,推动钢铁行业的整体转型和升级。

二是高质量工业领域语料库匮乏。工业数据规模量大,但普遍质量水平较低,大规模多源异构数据融合问题以及数据孤岛问题仍难以克服,无法满足行业大模型训练要求。工业数据产业服务生态的建设不完善,工业知识、工业数据的语料化缺少专业的方法论和技术工具,工业数据确权、治理、标注、合成、质量评估、隐私保护等相关标准不足。数据专业人才紧缺,特别是具备行业不同业务领域专业知识的语料标注人员欠缺。

三是解决方案工程化能力薄弱。人工智能大模型工业化应用需要解决适用性、工程化、规模化的问题,需解决与现有系统统筹考虑整体架构与功能设计,解决系统、数据、功能集成,以及训练、推理一体化问题,解决规模化应用推广等问题。

综上所述,为了钢铁行业的应用和发展需求,将大模型真正融入钢铁行业流程中,亟需研究行业大模型建设模式,研发适用于钢铁行业的大模型及平台。本文基于中国宝武的数智化转型实践,从一体化解决方案的角度,提出了钢铁行业大模型平台构建的总体架构,并研究了钢铁行业大模型平台建设所需的十大关键技术以及在生产制造和经营管理的典型应用场景,最后对钢铁行业大模型的发展进行了展望。


1 总体架构和建设思路

钢铁行业大模型,专门针对钢铁行业特点和需求,融合了机器学习、深度学习等先进人工智能算法,旨在处理钢铁行业中的复杂任务和海量数据,为钢铁生产、管理、决策等环节提供智能化支持。通过将大模型服务融入现有的工业互联网平台,构建钢铁行业大模型平台,实现从单点应用、局部优化到业务贯通和协同发展的智能化升级,打造高效率、低成本、绿色化的工业智能解决方案,可以在更广泛的工业场景发挥作用,提升人工智能应用的普及率,极大促进智能化升级进程。


1.1 总体架构

钢铁行业大模型平台,基于通用模型(包括语言、视觉等)及专用模型(包括预测、决策等),融合钢铁知识库、语料库、样本库,互联企业各类应用系统,汇聚工业大数据,形成算力、数据、算法一体化管理以及中心训练、边缘推理、场景应用一站式闭环的综合性人工智能平台。钢铁行业大模型平台整体架构如图 1 所示。

图 1 钢铁行业大模型平台整体架构

其中,数智基座实现了“五个统一”,即统一算力资源、统一数据治理、统一模型管理、统一模型评价、统一发布部署,对算力、数据和模型进行高效整合与管理。在算力方面,建立起兼容异构算力资源的管理和调度体系,能够充分调动不同类型的计算资源,满足大模型训练和推理的多样化需求,为模型的高效运行提供了有力的支撑。


在模型层面,形成“M0 基础模型 - M1 垂类模型 - M2 领域模型”的分层架构体系。

基础模型层(M0):该层集成社会成熟基模,整合自然语言处理、视觉识别等通用 AI 技术,为整个模型体系提供基础能力。通过对海量通用数据的学习,M0 层具备了强大的跨领域知识理解和处理能力,为上层模型提供了广泛的知识储备和技术支撑。

垂类模型层(M1):基于钢铁行业的专业知识、专业数据以及企业内部丰富的业务数据,训练出适用于钢铁生产各个环节的通用和专用模型。这些模型深度融合了钢铁行业的工艺特点、生产流程和管理需求,能够精准地处理钢铁行业中的复杂任务,为钢铁生产提供专业的智能化支持。


领域模型层(M2):针对冶金、轧制、制造管理、经营管理等具体生产和管理环节的独特需求,开发定制化解决方案。通过将 M1 层的垂类模型与实际应用场景紧密结合,实现对各个业务环节的精细化管理和优化。例如,在轧制环节,根据 M1 层模型提供的工艺参数预测和质量控制模型,实现对轧制过程的精准控制,提高产品质量和生产效率;在企业管理环节,利用相关模型进行数据分析和决策支持,优化企业资源配置,提升企业的整体运营效率。另外,钢铁行业大模型平台提供统一 AI 门户及智能体开发平台的 MaaS 模型服务,为各类 AI 应用的开发与部署提供了便捷的途径,开发者可以快速构建和部署个性化的 AI 应用,进一步拓展了钢铁行业大模型在不同场景下的应用范围。


1.2 建设思路

依托于现有的技术积累,建设 “五位一体”的综合能力体系,通过通专融合(通用模型和专业模型)、业技融合(行业知识和 AI 技术)、数实融合(数字技术和实体制造)“三融合一”,支持钢铁行业人工智能应用场景需求,促进人工智能更高水平应用,推动钢铁产业智能化创新与发展。总体建设思路如图 2 所示。


1.2.1 “五位一体”

通过对平台、数据、算力、模型、场景五要素的系统性建设,在数智基座、模型研发和场景应用等方面提供全方位的支撑,形成一体化、集成化人工智能+钢铁解决方案,大幅降低钢铁行业模型研发门槛与成本,让人工智能技术更好融入行业。


1.2.2 “三融合一”

通专融合:钢铁行业大模型将通用模型与专业模型相结合,使得模型不仅具备广泛的适用性,还能够针对钢铁行业的特定需求进行深度定制,使得大模型能够更好地适应行业特点,提高解决方案的有效性。

业技融合:钢铁行业大模型通过整合行业知识和 AI 技术,实现了业务需求与技术能力的深度结合,不仅提升大模型的技术含量,也使得模型能够更好地服务于业务发展,推动钢铁行业的智能化转型。

数实融合:钢铁行业大模型通过数字技术与实体制造的结合,实现了数据驱动的智能制造。钢铁企业能够利用大模型进行生产流程优化、资源配置优化和能源消耗降低,从而提高生产效率和降低成本。

图 2 建设思路

1.2.3 “分层构建”行业垂类大模型

采用 M0 基础模型层、M1 垂类模型层和 M2 领域模型层的分层架构,基础模型提供通用智能,行业垂类模型提供专业洞察,领域场景模型提供定制解决方案,三者协同、逐层优化模型性能,将通用大模型与钢铁行业数据充分融合,有效解决通用大模型不懂行业的问题,推动场景落地。

1.2.4 行业高质量语料库构建

研究行业高质量语料库构建技术,研发语料工具链,制定相关标准和规范,示范构建涵盖钢铁行业多个领域的万亿规模多模态高质量语料库,为模型训练和应用提供示范模式。

1.2.5 “1+X”场景支撑

通过“1 套钢铁行业大模型平台”,全面支撑“X 个人工智能应用场景”,用于企业智慧制造、智慧治理、智慧服务等主题场景,以及高炉大模型、转炉大模型、配煤配矿大模型、云表检大模型、研发设计大模型等领域模型,为钢铁企业提供一体化、集成化的人工智能+钢铁解决方案。


2 技术路线

核心技术以自主可控为原则,围绕人工智能、机器学习、人机交互、云计算、边缘计算等多个技术前沿方向,研究训练-推理-场景一体化的智能化架构技术、行业大模型分层构建技术、行业高质量语料库构建技术、大规模异构算力集约化调度技术、面向通用场景预测模型构建技术、面向多目标复杂场景的决策模型构建及动态优化技术、端-边-云协同的实时智能控制模型构建技术、基于人/物/业务相联接的混合增强智能技术、基于智能体的人机交互技术、模型即服务(MaaS)模式及实现技术等十项关键技术,如图 3 所示。

图 3 关键技术


2.1 “训练-推理-场景”一体化的智能化架构技术

消费类大模型用于工业侧,普遍会存在数据和场景的复杂度、能力可用性、技术成熟度、结果可靠性等难点,需要提高人工智能系统的整体效率、灵活性和实用性,使模型能够更快速、准确地适应不同的应用场景,解决适用性、工程化、规模化的问题。通过打通基础平台、AI 技术与业务应用的分层协同链路,建立通用模型与专业模型的协同进化机制,形成覆盖“训练-推理-场景落地”全链条的智能化架构(如图 4 所示),为超大型企业智能化转型提供可量化的技术实现路径。

图4 智能化架构技术

架构体系通过全生命周期管理机制,实现工业 AI 模型从创建、训练到评估、部署、监控、优化的全流程数字化管控,使模型研发效率、运行效果与运营质量可量化、可追溯、可优化。

云边一体技术的深度融合,既满足云端资源集约化训练的效率需求,又能通过边缘计算实现生产现场的低延迟响应与数据闭环,确保工业现场高效稳定。模型分层分类构建技术则通过行业知识解耦与特征工程标准化,降低工业领域模型研发门槛,同时建立以生产效率提升、质量成本优化为核心的价值导向评价体系,推动模型泛化能力与场景适配性的双向提升。

该智能化框架通过知识沉淀机制将工艺经验、操作规范转化为可复用的模型资产,使大模型能力与行业特性深度融合,形成 “数据积累 - 模型优化 - 场景迭代” 的良性循环,推动工业 AI 从单点试验走向系统级生产力变革,为流程型制造业的智能化转型提供标准化技术底座。


2.2 行业垂类大模型分层构建技术

钢铁行业面临提高生产效率、降低生产成本、提升产品质量和保障生产安全的重大需求。在此背景下需要通过数智技术创新,帮助钢铁企业突破困境。传统人工智能技术面临算法精度低、模型开发周期长、人工标注工作量大、场景碎片化等问题,导致算法通用性差,模型难以批量生产。通用大模型技术的诞生,虽然能解决通用场景下,传统人工智能应用的问题,但离工业场景的落地还存在较大距离。因此需要研究大模型分层构建技术(如图 5 所示),使工业人工智能模型开发从“作坊式”走向“工业化”范式。

图 5 模型分层构建体系

语言模型方面,构建“M1 钢铁语言模型”,解决通用模型钢铁领域知识学习不足问题,提升模型在钢铁领域的知识理解以及指令遵从的准确性,同时具备跨基座模型迁移的通用性。基于海量钢铁及通用知识,融合高炉、炼钢等钢铁语料,进行持续预训练,增强行业基础知识理解能力;基于应用场景实际交互数据以及问答语料,进行监督微调,增强行业指令追随能力;构建综合钢铁知识、场景能力以及通用能力的垂类模型测评技术。

视觉模型方面,基于国内开源生态,采用 Transformer 模型结构,通过“基础-行业-场景”三级递进式架构,逐层优化模型性能,实现钢铁生产视觉数据的全链条高效处理。通过自监督学习、对比学习等无监督技术从海量未标注数据中萃取通用特征,借助模型蒸馏技术完成教师模型到学生模型的知识迁移,在保障模型性能的同时实现轻量化部署。该架构不仅构建了自动化工作流以降低开发门槛、减少专业人员依赖,更通过行业经验沉淀逐步建立标准化体系,助力生产质量监控、安全生产管理、物流管理等核心场景的智能化改造。


2.3 行业高质量语料库构建技术

可以依托企业大数据中心建设进行扩展,针对钢铁行业垂类大模型训练和相关智能体应用所需要的高质量、多样性语料的需求,构建了 IT/OT 等结构化数据之外,文本、图像、语音、视频等非结构化数据的管理、嵌入、审核、标注等机制,实现完整的从源数据采集、清洗加工到高质量语料入库的全新语料库构建模式。同时,研发融合了语料库、知识图谱、向量数据库的,面向大模型应用开发用户的语料访问、加工、训练等应用接口,形成涵盖软件研发、财务经营、生产制造等业务领域的钢铁知识库、语料库、样本库。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询

在线咨询

点击进入在线咨询