睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

浅谈工业数据的收集、处理与分析

时间:2022-10-03来源:山治程浏览数:227

工业数智化近些年来广受关注,相关需求也逐步增加,是发展比较好的一个方向。工业数智化近些年来广受关注,相关需求也逐步增加,是发展比较好的一个方向。

导读:工业数智化近些年来广受关注,相关需求也逐步增加,是发展比较好的一个方向。本次分享题目为数据技术助力工业企业数智化转型的实践与思考,将围绕下面四点展开。

01 数智化转型的缘起

1. 工业数智化转型正当时

近年来,各种场合常出现“工业大数据”、“工业互联网”、“工业智能”、“新基建”等一系列热词,体现了国家对制造业高质量发展的诉求。从十四五开始,特别是近几年,大家把数智化与实业相结合提上了日程。从现象上看,国内大厂纷纷投身工业制造业。数智化无论对于提升业务价值,还是对国家经济建设,都是一件有价值有意义的事情。

随着企业对数字化的认知越来越清晰,对工业数智化的战略越来越明确,企业的诉求也在发生转变。中国的工业企业经过近几十年的发展,自动化、信息化,以及一些基础的数据系统建设在不同的行业中慢慢地推进。近两年,工业企业会更多地在数字化和智能化的道路上迈进。对于企业而言,会更多关注提质增效、节能降耗等能够给企业带来实际价值,并且能够落地的方向。

2. 工业自动化、信息化、数智化

下图是对工业领域中自动化信息化、数字化和智能化的概念和内容的梳理,帮助企业理解数智化的工作,即在自动化和信息化基础之上推动的数字化的工作和未来智能化的工作。澄清这三者的区别和关系,可以让企业认知到,这三者并不是谁可以取代谁的关系,而是不断循序渐进、做加法、做优化的过程。

自动化、信息化谈的更多是把企业的最佳实践固化到流程管理、经营管理的系统中去,比如PLM/MES/ERP。现在的数字化则更多是以业务为主导,帮助企业更好地利用数据,挖掘数据背后的价值,并与业务结合,为企业带来以数据为基础的价值创新。智能化是未来企业和工业制造业一个更长远更全局的目标,它是在数字化的基础之上,实现企业内部各个部门的、产业链上下游的、跨产业链跨行业跨区域的全局最优。目前这一步还是在路上,需要一步一步地走。

3. 工业数智化的典型场景

典型的工业数智化场景有一些可能为大家所熟悉,一类是设备可靠性分析,例如故障的预警预测。从健康评估开始,逐层深入,可以到企业内部生产资料的优化、设备运行的优化、生产制造过程的优化、质量的控制。再往上,会涉及到能源互联网、产业互联、产业上下游的供应链等方面,例如从备件、物流、配送等不同维度来实现产业链或不同领域之间的优化。在不同的行业、不同的领域,都有大量的数字化的场景和数字化的应用需求。

4. 工业数智化的关注点

与消费互联网不太一样,这个赛道还是一片蓝海,在全球范围内基本上还处于探索的阶段。企业的关注点也在不断变化。开始的时候,关注点是在平台上面,怎样帮助企业搭建大数据及互联网平台,怎样把工业领域的数据收集起来、管理起来,为企业未来的数字化打下数据基础。也可以看到陆陆续续出现了工业大数据平台、工业互联网平台。再往前走,企业最关注的是这件事情的价值

怎样在传统行业中突出和体现数智化的价值?如何把数据和产业进行结合?在此基础上,我们做了智能化的落地。工业数字化已经开启了第三个阶段。这一过程并非一蹴而就,不是有了一些数字化的应用,就完成了数字化。这只是起步,未来结合业务的发展,模式的创新,才有未来的业务发展。并且要长期持续,能够快速地响应企业的需求,随着企业的变化而变化。

5. 工业数智化业务愿景

大家逐渐认识,不管如何讲数字化技术,最终还是要把它与核心业务相结合。让数据在企业内外部的业务当中,从提质增效、节能降耗、业务模式创新当中去发挥价值,最终为业务发展打开新的业务模式。如何通过数据的汇集和数据知识的挖掘和流动产生价值,这是不同的行业、不同的企业现都在共同思考的一些问题。

02  数智化实践

1. 工业数智化领域的认识概况

工业数智化其实是企业数字化或者企业大的转型概念下的一个领域。但其实在工业领域里面,数智化其实还可以再细分。从业务场景去展开,从核心的高技术产品、装备的研发,到生产制造的过程,再到市场营销,以及整个设备和物联网的服务,在整个产业链过程中,每一块都有大量的需求,而且都有各自的关注点和目标。对于企业内部,特别是对管理层而言,还涉及数字化和智能化的管理。这几块结合起来勾勒出了工业数智化的领域。当然还可以细分,比如供应链中的金融化,能耗方面在双碳目标下的节能降耗等等。不同场景关注点的不同,导致了技术路线的选择和业务目标的选择,以及用户群体都会不一样。从我们创新中心的角度,我们更多的关注在数智化制造,和基于工业设备、高技术装备的数智化服务。

2. 数智化研发案例

先来看一个数智化研发案例。在涉及到各专业学科的交叉过程当中,背后都会有大量的研发类的数据需要被统一的管理起来,并且能够快速为研发过程提供支撑。

过去在传统的工业软件架构中,会用一些关系型的数据库。比如原来的风电比较粗放,一个风电厂在平原上有一些风机。但现在风机在山地在海上,它每一个点位的风向以及湍流强度是不一样的,所以每个点位都需要去进行精细化的设计,这对设计提出了更高的要求。为了让这些设备能够更高效地在这些点位上运行,并且做到最合理的成本,我们需要对每一个点结合风况进行精准地运转。因此在这个过程当中,有大量的仿真数据,需要去进行相应后处理,再进行精准的设计。数据量也非常大,通常几轮批次运行下来会超过PB级别。

设备的生产制造也是一个产业协同过程,从上游零部件,到我们的整机厂商,以前是各自为政,但现在有了统一的数据平台。这样统一的、以数据驱动的,协同研发的过程,可以保证协同、统一的来做全局的优化,从而把设备运行、制造成本,以及周期降低下来。

3. 数智化服务案例

设备的可靠性包括预测性维护、远程设备的故障诊断。

① 风电结冰预警

第一块是设备故障预警,风电结冰检测案例。冬天风机经常会被冻住,导致无法发电。新能源的占比越来越高,所以问题也越来越严重。怎样及时发现、及时干预,能够对发电量进行合理的预测和管控是备受关注的一个问题。我们要利用设备运行数据,比如结冰时间,机器震动,旋转速度,提前进行诊断来避免更大的次生灾害。但在工业的领域,其实有很多的挑战,比如复杂的气象条件,同样是结冰,北方与南方的结冰条件是不一样的。

② 车辆悬挂系统故障诊断

第二块是故障诊断。车辆诊断是一个很经典的案例。一个车辆高速运行中,放个硬币或者放杯水,它都不晃不倒。这一方面要靠轨梁的稳定和平稳,另外就靠车辆悬挂系统。同样的一辆车,运货以及运人的重量速度都不一样,故障的发现和诊断,不仅要发现故障,还得诊断是哪个部位出的问题。根据列车的运行数据和一些基础信息,最终要实现将故障定位和识别出来。

③ 设备运行优化问

第三个是设备的运行优化问题。设备可能没有大的故障,在某种程度也没有报警。但设备是否处在一个最优的运行状况,也是可以通过结合历史数据去进行分析的。比如风电领域,同样的风速,同样的功况下,它的发电效率和以往比有没有变化。类似地,芯片的制造生产,不同批次质量良率和生产效率是否有变化,以及变化背后的影响因素,这些都需要固化到系统当中去。

前面讲到的案例都是一个个的点,这些点都可以关联起来,去形成一个完整的整体,去帮助更好地刻画设备和这个设备运行的方方面面,从整机到核心组件,以确保设备能够健康稳定地运行。

4. 数智化制造案例

这里更关心的是产成品的质量以及生产效率问题。通过分析生产过程当中产生的质检数据、运行数据、设备工艺参数,帮助企业去建立围绕良率的一些统计性的分析,比如良率出现的波动、时间分布、空间分布,以及潜在的问题之处。

找到提升良率的方法,规避降低良率的操作,固化到系统当中去产生价值。

最后把体量、运行效率、能耗等各个领域,综合起来放到我们企业生产过程当中。比如现在比较火的数字化工厂、智能化工厂等,都是综合性地运用数据,全方位地帮助企业提高智能化的决策和生产水平。

5. 其他实践与探索

除了以上介绍的案例之外,我们还在其他领域做了大量的探索,也发现了工业的数字化过程中广阔的前景和面临的挑战。

03  思考

1. 工业数智化技术特征

工业软件有其专业性,每一个行业都有它背后深厚的基础。由于这个行业背后的一些机理、生产工艺流程,工业软件也会更复杂。从研发到生产制造的过程,所有的行业都是不一样的,甚至同一个行业里面也是千差万别的,而且数据类型也很多。比起消费互联网,工业数据质量其实更参差不齐。工业数据分析的另外一个难度在于对精度的高要求。比如控制类,精度甚至要做到99%,细微的差别都可能会导致整个产线运行的不安全。

2. 工业数智化需要3T深度融合

工业数据还有一些从数据分析角度来讲的难点。

首先,这些设备本身、特别是大型的装备,其实是很少坏的,所以拿到的很多数据通常都是正常的。很多时候要通过正向的数据去做分析,对它潜在的故障进行发现、挖掘。

第二,工业有很多背后的机理可以去结合,比如风力发电的机理、燃烧的机理,帮助提升数据分析,以及指导数据分析的方向。然而很多机理是偏理想化的,比如标准大气压下,拿到当前温度等,而在很多工业现场,很多量是不可测的,例如高温高压,环境和理论是有非常大的偏差的,需要通过拟合、软测量的方式去做工艺数据的分析。

第三,专家的经验可能没有量化,是否准确也都是要去考虑的。

以上难点可以归纳为:量大但不充足,要素全但不精准,实用但不完备。要在工业领域落地,一定还是需要将IT计算能力、DT数据分析能力、工业领域的知识OT,这3T深度融合起来。

3. 工业数智化是长期持续,迭代演进的

工业数智化是需要长期持续不断去迭代演进的,不停有新的场景、新的需求出来,并且不断有新的工艺、新的设备、新的量测手段和新的分析方法可以引入,是一个不断迭代的过程。

4. 工业数智化是一项周期长、试错成本高、落地效率低的复杂工作

工业数智化的流程包括,从业务梳理到数据收集清洗,到特征的提取算法的研究,然后再去做大规模的验证,并行算法的改造,还有可视化,最后上线部署,是一个非常长的过程,基本都以年为单位。

04  在路上

1. 工业数智化中的共性设备及其数据模型

工业行业不一样,关注点不一样,分析课题不一样,生产的东西也不一样。但是在工业生产过程中,还是有很多共性的,比如很多基础工业单元是共同的,比如基础的泵、阀、电机,通过不同的组合,用来生产水泥、芯片、汽车等等,生产的内容不同,但是背后很多设备是有一些共性的。这些设备监测的内容也有很多共性,首先在数据类型上存在共性,如电流、电压、震动、图像等;另外,在分析的课题上也存在共性,如分析轴承开裂等问题;还有在数据模型上也存在共性。

2. 工业数智化中的共性分析方法论和算法基础

不同的设备有不同的分析的思路,但是如果将其结构化,从拿到原始的数据,从工况的识别到关键特征的提取,再到引入像一些比如深度学习,再到最后把结果与一些专家经验结合,最后变成上线的模型,这其中其实有很多相似的方法。做出的模型不同,但过程中存在着一些共性或相似性。

3. 工业数智化中的共性分析应用方式

工业领域中,建模要和很多工业现场的数据去结合,有些数据要回到中心端来,比如数据是隶属于不同的公司,不可能把所有的数据用来做分析,需要依托样本数据和知识经验,去构建一个模型,再把模型下发到现场去,这种云端结合的应用方式,在对数据安全性要求比较高的场景非常常见。

4. 工业数智化工作核心要素

基于上述共性,我们总结出一些核心要素,比如数据的问题总结为数据资源化管理建模总结为知识结构化沉淀,如何把建好的模型应用到工业现场去,我们把它提升成应用敏捷化服务。

5. 基于统一工业物理对象模型的数据服务

应用本质上,关心的不是数据,而是我们的研究对象。所以我们提出了一个基于工业物理对象的数据服务,来统一底层的数据接口、存储等,让上层的数据理解和价值挖掘更容易。

6. 知识结构化方法论和算子

我们把共性提取出来形成了一些方法论。

有了这些方法论,我们一方面以方法论作为指导,另一方面还将方法论背后的共性提取出来,变成“算子”。这样工程师就可以用拖拽的方式,低代码的方式,去进行现场的工业数据的建模和处理。

最后,我们要把建好的模型部署到现场去用,我们实践了云端的协同,中心端建模,现场端应用,批流一体等。

7. 数智化创新体系

工业领域最核心的还是工业企业的深度参与,包括工业企业内部的数字化创新团队的参与。以工业企业自身之主为核心,以我们的平台工具为辅助,再结合数字化创新方法论,注重企业在过程当中的数字化创新成果的积累,才能够把工业数字化的工作长期持续地推进下去,才能为企业在数字化领域带来更多的价值。

今天的分享就到这里,谢谢大家。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询