睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额,2022》报告中,蝉联数据治理解决方案市场份额第一。

指标驱动,数据优先、工业数字化转型的经验分享

时间:2022-07-30来源:从何说起浏览数:428

尽快拥抱数字化转型,做好分阶段的规划。第一阶段还是要做好一个平台的规划,做好相应的基础数据采集。同时,我建议本阶段可以从一些相对比较容易让决策层通过的应用开始。


01工业数字化转型需要区分目标和工具

人类四次工业革命史其实也是一个工业品的制造复杂度的提升过程,从早期的手工制造到现在的高端电子产品,以及一些复杂原材料的设计,都反映了制造复杂度的提升。 早期的手工制造相对落后,后来有了5S、kaizen、JIT等精益的管理,人员素质和管理效率得到了提升。在这个基础上工业又走向自动化,通过“机器换人”的方式去避免很多重复性的劳动,也带来时效性、精准度的提高。 然而,事实证明早期的“精益管理”和“自动化”已经不能满足高精度、高质量产品的生产需求,这些高端需求需要借助工业数字化转型升级去实现和达成。半导体制造对工业数字化转型的需求最为迫切,概括来说其体系非常复杂,每个环节都离不开大量数据,并需要借助过程管控、数据分析实现智能改进,解决生产过程中的品质、产能、效率问题。工业数字化转型是数字化转型的一个子集,它利用工业物联网等先进技术对现有的资产、过程、产品进行转变,实现运营指标提升,走向卓越运营。卓越运营(Operational Excellence)实际上是一系列关键指标的优化,其应用场景涵盖装配、加工、预测性维护、绩效管理、质量管理以及可持续发展这一系列的制造环节,甚至延展到产业链的上下游。 对于工业数字化转型的认知,目前来看还存在很大的不足。企业、服务商更多的是在谈论各种时髦的技术名词,似乎人工智能、数字孪生这些词汇就是数字化转型,很少有人关注数字化转型的目标是什么?工业数字化转型是通向未来工厂(FOF: Factory of Future)的一个阶段性工具。 这是调研机构给出的“未来工厂”框架,涵盖了最终的目标,到企业战略,再到价值链的执行,再到人、技术、流程的有效融合,这个架构也代表了“未来工厂”需要达到目标。LNS调研机构还给出了未来工厂成熟度的一个界定体系,是一个从下往上的5级标准。这个体系既是对不同层次企业的划分,也是未来工厂不断演进的一个过程。 未来工厂并不是一个虚无缥缈的概念,它旨在指导现有工厂进行数字化变革,使其能够在运营等层面得到巨大的提升。运营层面其实主要是包括两方面,第一、定义一系列卓越运营的指标体系;第二,打造数据赋能的运营架构,走向一个最终的卓越运营的目标。 卓越运营的关键支撑就是指标体系,这些KPI指标从企业经营层面来看包含各种财务、人效指标,再往下可能就划分到不同部门,诸如生产指标、维护指标、库存指标、质量指标、安全合规性指标,以及相关的一些业务部门的指标,这些指标应该来自于基于平台对接的各种自动化系统数据和业务系统数据。 对指标体系有兴趣朋友可以参考ISO22400-2,这是一个多维度的一个指标体系,主要包括生产(production)、维护(maintenance)、库存(inventory)和质量(quality)等维度,总共在运营层面提供大概几十个指标,已经足以来去支撑大部分企业的一个正常运营。ISO22400-2指标体系包括我们大家熟知的OEE、MTTR、MTBF,以及良品率、次品率这些指标。它们并不是虚无的数字,全都来自各个不同的子系统提供的各种各样的数据。同时,指标也是企业努力的方向和目标。

02未来工厂的运营架构

现代工业功能体系大致可以分成三个层面,从最下面的资产(包括人、流程、技术),到运营(从研发、设计到工程,再到生产制造再到物流、供应链,再到服务的整个价值链),再到业务(人事、财务、市场、决策)。 当然,在国际上还有非常多的相关工业理论体系以及相应的组织机构,,包括大家熟知的OPC、ISO、ISA,以及ISA95、ISO88以及IEC61512-3等各种标准体系,涵盖了从研发到工程再到制造、生产等各种阶段和过程。这里我们重点会看ISA95,因为它涵盖了运营支撑层面的很多方面。ISA95工业企业架构划分成5个层面,最下面三层其实是我们说的自动化层面,就是大家熟知的OT的一些PLC/PAC,以及DCS等相关的各种系统;中间这个层面是MOM,可能有些人对这个词比较陌生,但其实它跟MES是一个概念,在上层业务系统和下层的自动化之间起着承上启下的作用,所以它包括了生产计划、过程管理、维护、质量这方面的功能;最上面一层就是大家熟知的一些IT系统,财务、人事、市场这些。ISA95这种层次化的架构虽然很清晰的定义了每一层的工作内容,但实际上大家可以看到,在这种从底层到顶层的垂直整合模式下,每一层获取到的数据都是上一层的汇聚和抽象,底层的数据很难被顶层的决策以及生产服务直接使用,这就造成层次越高能利用到的原始数据就越少,进而发生因多次数据汇聚导致的失真、滞后等后果,最终导致企业运行效率降低。比方说,企业可能会有一系列的如ISO22400提到的生产、库存、质量、维护、安全等层次化指标,其数据都来源于已被处理过的下层系统,同时可能还需要从多个系统中去采集数据,得到的数据往往并不准确,甚至跨系统融合数据也面临着标准不统一的挑战。 ISA95的第2个局限性是企业对数据的利用率和利用程度还非常低,一般来说数据分析包括描述性、诊断性、预测性、预知性等,但据调研机构调研显示,其实绝大部分企业对数据的利用只是停留在一些初级描述性descriptive层次,其实就是一些统计报表。高级的数据利用诸如设备可靠性的预测、产能的预测,亦或者是供应链库存的预测等都还没发挥出作用。 第3个局限性就是ISA95的架构体系。在现行的体系下,MOM/MES往往被做成一个大而全的独立系统去承载越来越多越复杂的功能,这种单块式、单一数据源、垂直、烟囱式系统,其实很难实现数据的共享,也很难实现功能和性能的一个扩展,更没办法来快速满足工业企业差异化的定制需求。 所以,工业数字化转型其实主要是改变工业企业的运营架构,从这种传统层次化的运营架构变成一个相对比较扁平,或者说以数据驱动的未来工厂的一个运营架构。简单来说,我们基于已有的架构体系把IT和OT的数据打通,形成一个数据一致、功能开放的全新层次化解决方案,并支持全新的数据智能应用的开发和扩展。我们把传统的纵向集成变成横向数据集成,从IT系统里面抽取相应的指标的一些数据,从OT系统抽取一些实时的数据做相应的关联,在同一个IOT的平台上实现融合的数据的架构和数据的服务,再利用一系列的应用开发的工具、数据分析工具来实现相应的应用和分析。在智能应用上,将来还会有更多的甚至95%以上的应用在等待我们去开发。这些应用就包括我们说的运营层面的各种各样的指标预测,如库存维护、质量、安全、能源,以及先进过程控制(APC)等。所有这些应用都有一个共同点就是一定是数据驱动,而数据驱动其实有4个发展阶段或者说4个利用层次,也就是前面我们提到的描述性Descriptive、诊断性Diagnostic、预测性Predictive、预知性Prescriptive,图中智能应用下方的DDPP就是代表了这四个层次。未来所有的智能应用必须都具备这4个数据能力中的一部分。简单展示一下工业互联网IIOT的平台,这里我们引用调研机构LNS的相关框架。MES/MOM在工业互联网新形态下也要做大幅的调整,基于工业互联网平台构建一个数据驱动的平台,构建一系列生产、运营等模块化应用。对上连接第4层的业务系统对象,向下连接第2层的自动化系统。

03工业互联网平台是未来工厂的核心架构

对于工业互联网平台,国内、国外都已经有了比较丰富的资料,也出现了多种版本的工业互联网平台架构,但总体来看大同小异,基本上都保持了从边缘端的接入、边缘计算,一直到工业数据的管理和分析,以及到工业数据的建模,再到工业应用的开发这个主题思路。上图是国外LNS给出的架构图。国内工业互联网产业联盟发布的架构也遵循从下往上的主题思路,尤其大家可以看到架构对从接入到管理、分析与建模等全流程的数据能力很重视,此外敏捷、高效的应用和模型开发等也是架构的重点。 以上两种属于机构发布的通用架构,具体企业也会制定有不同侧重和理念的工业互联网平台以及各个环节的产品和服务。首先来看大家比较熟悉工业互联网先驱predix架构,相比来说其平台核心关注点可能更加的突出Digital Twin数字孪生的理念及其核心地位。同时,我们也会在边缘端看到它数据接入、采集、转发等环节相应的软硬件具体产品。再通过后面几家工业互联网平台的对比,大家就会发现,目前的工业互联网平台虽然总体思路相差无几,但是落实到具体的产品上还是有比较大的差异。当然,像物联网网关、边缘计算等设备从无到有也在逐步的通用化。我们再来看Predix的云端,同样大家也可以看到它的数据集成、处理、存储等模块,以及数据分析和建模,另外在应用开发方面predix着重强调了产品能力、可控两个方向,而支撑这些目标的是微服务、可视化的开发工具,同时大家也能看到对数据建模也是predix应用开发的重点。在应用这个层面,predix构建的应用大致可以分为这么两类,一类APM,就是资产性能管理,包括可靠性管理、设备实时健康监测、设备可靠性管理、合规性管理和维护策略优化,另一类是运营性能管理,包括运营智能、过程和指标优化等。 我们再来看西门子的MindSphere,通过其架构图我们已经可以看到该平台开始注重各个层面的横向沟通、集成。国外还有C3.AI,它的架构也遵循工业互联网的主题思路,但在应用层面可能更多的在预测性维护、资产管理、风险欺诈管理等方面。由此可见,工业互联网平台的差异化不但体现在具体平台的形态,更会在服务和产品应用层面逐步的出现侧重分化。我们再看看国外的uptake,它在平台层面针对不同的数据分析,提供相应的数据科学的目录和模型的管理,以及针对机器学习和AI的支持,体现了很强的平台的工具特性。当然,寄云NeuSeer工业互联网平台也遵循通用的工业互联网平台框架,但同时寄云NeuSeer平台作为一个工业互联网平台的实例产品,也有很明显的自身特性和侧重点,从我们的架构图也能一窥一二。比如,它在平台层面提供工业应用微服务、工业模型服务、工业数据分析建模系统等,而在应用层面,寄云科技主要专注在设备的资产管理、运营效率的管理和生产经营决策这几类的应用场景。寄云NeuSeer平台在边缘侧提供两款硬件产品分别是寄云NeuSeer工业物联网网关、寄云NeuSeer边缘计算网关,以及IoT-SDK、边缘计算应用等软件,实现对数据的采集、处理、分析,以及与云端平台的连接。这里我们着重谈一下边缘计算,其实它是介于云计算和边缘端数据采集的一个中间形态,严格来说边缘设备需要和云端紧密协同,比如云端海量数据分析、向边缘端部署应用和模型,并能够提供数据处理、分析和一定的实时应用能力。现在有些服务商将数据采集网关称作“边缘计算设备”,所以这种情形是不恰当的。在云端,需要提供三类数据:实时数据、结构化、非结构化数据的存储、处理和开放能力。寄云NeuSeer 平台通过数据湖、元数据管理系统、寄云NeuSeer时序数据库等平台产品和组件,实现IT和OT异构数据的融合、数据的统一服务、海量工业数据的专业高性能存取、数据模型和数据资产服务,为上层的数据分析和数字孪生应用打好基础。在数据统一、高效存取的基础上,基于大数据、工业互联网的数据分析才有可能顺利展开,因为传统数据分析浪费了大部分时间在数据准备阶段。同时,要想实现数据分析场景的广泛化,数据分析工具的简化、数据分析相关应用的开箱即用等特性是当今数据分析的重任。在这方面寄云NeuSeer DAStudio数据分析与建模平台已经实现了无代码、低代码分析,通过拖放式、可视化实现各种统计分析、机器学习、人工智能等分析建模和评价。针对常用的各类工业应用,如实时监控和组态,可以通过一些轻量级、无代码的开发工具实现;而针对复杂的工业应用,需要利用多种开发工具,结合基于微服务的云应用开发平台,实现快速的应用交付。针对一些超大型工业企业,可以在平台基础上实现一部分能力开放,构建包括应用、数据、模型的能力开放平台,对接企业供应链、客户以及生态合作伙伴,构建持续连接的数字化生态。寄云云服务市场(BOSS系统)为这种生态平台提供用户运营、交易管理、平台对接、资源管理等服务,目前已经协同腾讯云落地多个地方工业互联网生态平台。

04数据、数字孪生和智能应用

工业互联网的核心是数据,“数据是未来工厂的新石油”,充分的说明了这一点。“未来工厂”的运营架构也是围绕数据的利用方式展开。从数据的角度看,它包括了四个不同的阶段:融合阶段、管理阶段、分析阶段、应用阶段。融合不只是设备联网、BI、数仓等等,它更多在于全方位的数据融合。数据可能来自于L0~L2的自动化系统,L3的生产运营系统,L4的业务系统……企业内部系统都需要连接进来,还会涉及到一些企业外部数据,包括气象、电价、价格指数、检测报告等等。最终在平台上沉淀下来时序数据、结构化数据和非结构化数据三类数据。每种数据都需要专门的数据存储方式进行存储和使用。数据统一管理其实更多是在建立一些标准,实现跨业务系统数据无障碍使用。标准包括但不限于资产定义、组织定义、人员定义、工艺定义、流程定义,只有建立这样的标准,才能够关联到相应的数据源,才能够实现跨系统的一致性的数据访问。标准还应该涉及数据的存放位置、数据关联关系、数据的权限以及数据更新等各个细节。传统烟囱式的工业系统在这方面可以说非常混乱,导致数据的跨系统使用很难实现。通过一致的、全生命周期的数据模型可以实现数据的统一跨系统访问。举个例子,我们把复杂设备分成系统、子系统、零部件等多个层级,每个层级都关联到设计端数据、制造端的BOM、维护历史、故障模式等,实现生命周期的数据一致性,进而为PLM系统、EAM系统、预测性维护系统、生产管理系统提供统一的数据模型。工业数据分析的价值非常高这一点行业已经没有异议,但大家对数据分析和大数据的认知还存在误解。首先数据分析不等同于大数据。大数据其实做的是一些基础层面的事情,提取、存储和标准化,特点就是海量、实时、多样性,它的适用场景很多是在于近实时、分布式、高可用场景。但是数据分析或者叫数据科学在大数据之前就已经存在了,工业数据分析就是根据不同的工业生产目标发现数据的一些规律或者关联关系,找到解决问题的方法。我们提到数据分析包含物理、统计、机器学习和人工智能等分析方法。还有一点,工业数据必须是有意义的、基于上下文的数据,再结合数据分析才能产生巨大的价值。反之,再多的毫无意义的数据也没有利用的价值。数据分析可以应用到企业的经营层面、决策层面、生产层面、设备运维层面等各种场景。据LNS报告显示,工业企业数据分析的主要场景有5类,分别是提高产品质量、预测生产产量、提高关键环节运营指标、实现过程的持续优化和提高产品的服务质量。对于数据分析已经有多个机构将其过程、方法进性了定义,虽然不尽相同,但大致都会包含这几点:首先一定要有很清晰的目标,比方说良率提升,为了实现这个目标我们就需要对良率指标进性拆解,对数据做相应的准备,提取相应的特征。然后根据目标和数据之间的关系寻找分析方法,建立起分析模型,选择相应的算法,创建工作流,选取数据对模型进行训练,还要根据结果对模型进行评估。筛选出来的合适模型的应用,一般来说或者放在一个实时的生产环境里,应用于实时数据并获取结果;或者把分析结果放在数据库里支持相应的应用程序使用。在工业互联网体系下,一般将数据分析部署在云端和边缘端。云端主要对海量的数据进行深入挖掘,发现一些潜在价值和趋势,边缘端主要应对实时要求比较高的场景。需要注意的是云端数据分析和边缘端数据分析存在数据量、实时性、分析深度、应用范围等多种差异,二者是相辅相成的,在架构上紧密关联。 我们已经提到通用的数据分析方法大概有3种,物理的、统计的和机器学习的。现实中企业和机构在这方面还会有一些差异,比如贝克休斯把分析方法归结为三种模型能力,LNS将物理的分析方法称为第一原理的方法等等。物理分析方法就是传统的物理的、可解释的过程模型。比如,PID就是一个简单的线性或者积分、微分的过程,公式和结果都比较明确。物理分析的优势是简单,不需要太大的计算工作量,也不需要很多的数据样本就可以完成。但是它的劣势也非常明显,首先它取决于有没有一个明确的可以测量的输入输出,但在工业里面其实有非常多的场景数据,没有办法直接测量到很多工况,比如炉子中心温度。第二是没有状态,跟历史无关,它就没有历史的数据保存。第三不能适应复杂的场景,比如说一个高度集成化的化工厂,就很难用单一或者组合的物理模型描述出来。因此,物理模型,比较适合简单独立、有明确输入输出关系、可解释的的子过程的分析场景。三种分析方法中统计分析占比最高,大家见到的各种各样的统计报表、SPC、各种各样的分布图,这都属于统计分析范畴。它的特点也是简单明确,计算工作量比较少,也不需要太多的数据样本。但它的劣势也比较明显,它只能推断出历史数据范围以内的一个结果,这种通过局部推断整体的情况毕竟有着很大的局限性。第二统计分析属于事后分析,就是问题出现以后的分析,无法实现假设性判定。机器学习其实有很多分类,首先简单的机器学习,就是一些聚、分类的数据挖掘,以及决策树、SVM这些的一些基本的方法。再深入一些,深度学习也被应用到越来越多的领域,比如神经网络、LSTM应用到输入和输出不确定的场景。更高级的机器学习还有强化学习,可以根据反馈改进训练参数、训练行为,实现更加精准的判决。机器学习在工业领域的应用目前来说还处于早期阶段。它的优势是比较适合在一些大型复杂场景下,也就是那些没有办法用统计分析、物理模型的情况下,你只能借助于机器学习去寻求突破。比方对于密闭超大型的锅炉,很多数据没办法直接测量,在这种情况下,可以尝试用机器学习把很多的输入和输出放在一起去寻找一些规律。它的劣势,比方说需要大量的数据样本,同时要有非常精确的标注,否则会影响最终学习的质量。 对于分析方法的各有优劣这一现实,人们很早就有认知,也提出了很多的解决对策,除了方法本身的优化,再就是方法的组合使用。比如,APC其实就涉及了物理和统计两种分析方法组合使用,取得了非常显著的效果,但是这种组合也有很大的一个局限性,它取决物理模型和数据样本之间的一个匹配关系。同样的,人们也在尝试把物理、统计和机器学习组合在一起。图中是贝克休斯基于统计模型、物理模型再加上机器学习,以求取得更好的预测结果。机器学习方法需要大量的样本,但是结合统计和物理方法再去做一些预测分析,你可能就不需要太多的历史数据样本,就可以实现一个比较精确的预测。可以说,这种方法的组合发挥了各方法本身的优势,也规避了各方法的一些弊端,也是最经济有效的手段。上图是GE提出的电厂性能的预测,把环境变量的一些参数输入到神经网络里,实现精确的性能预测,同时把输出的预测结果和改进的决策建议和控制参数结合,实现优化并反馈控制,提升电厂燃烧效率,一些结果已经能够验证。这个案例也可以看作是数字孪生的一个典型案例。所以,综合来看,无论哪种分析方法、无论哪种应用场景,其最终还是要实现价值应用。另外,基于工业互联网的数据分析,与传统的数据分析不同之处在于,实时性、数字孪生以及智能。其实,我们提到的4个数据分析的特点,也是数据分析的4个应用方向。从GE电厂的案例中我们可以发现工业互联网数据分析实现了从(描述)实时监测,到(诊断)关联分析,到(预测)指标预测,再到(决策)优化反馈的闭环。关于数字孪生,大家可以参考我之前写的《一文读懂数字孪生的应用及意义》,也可以去网上搜一下相关观点。个人认为数字孪生跟CPS区别不是特别大,更多是在于怎么用数字化的方式结合数据分析去构建起一个人可以理解的一个方式去解释物理资产过程里面潜在的不可感知的一些问题。 对数字孪生的定义其实有很多种,大家可以大致了解一下Gartner、LNS以及GE提出的观点。其中GE提出的资产模型、数据分析、行业知识三位一体的观点,比较形象直观,给实际的业务应用能够带来指导。所以,数字孪生在范围上并没有很严格的限制,它可以存在于生产过程、供应链、产品生命周期……以及一些指标监控、指标预测,其实都可以看成数字孪生的实例。大家没有必要把数字孪生看得太死,其实它可以有很多种存在形式、可以存在各种系统里面以及场景中。同时,我们还要警惕不可以把数字孪生看成简单的3D可视化。因为有些人将之视为AR/VR之类的事物,其实那只是最基础的展示型数字孪生(DT)。根据智能程度的不同,我们可以把DT的应用划分为四个层级:展示型、描述型、预测型、自治型。描述型DT实现了直接、间接和虚拟指标的展示;预测型DT实现基于指标分析的趋势预测、What-If预测、组合模拟等;随着数据和经验的积累,自治型DT将能够达到自动学习、知识沉淀、自我优化。我们再细看一下数字孪生的三个关键部分,资产模型、数据分析、行业知识。资产模型其实就是各类资产数据模型、层次模型、关系模型,实现数字化、全生命周期、统一的描述。这此基础上,运用相应的行业知识(包括控制模型、维护策略、历史经验),结合数据分析手段发现价值。我们举个数字化阀门的例子,它涵盖了工程模型、数字模型,以及各种实时数据、历史数据,包括维护数据、各种指标(流速、压力、温度),还有相应的物理规则,这时候它已经是一个具备一定智能层次的数字孪生实例了,不再是简单展示。当然最终数字孪生还应该落地成实际的应用,这时候再让我们回头看一看基于数据的智能应用这张图,就会发现数据智能应用都是基于数字孪生的。我们再举几个数据智能应用的例子,第一个是企业制造智能(EMI)。EMI其实是一个标准的制造行业术语,但在国内知道的人可能并不是特别多。传统企业尤其是离散制造类,或多或少的都会存在生产指标没有实现实时获取的情形,这样的过程、子过程数据一般通过手工填报统计获得,造成生产指标统计滞后或者失真,也无法支持实时决策。与之相反的是,数字化程度高尤其流程类制造企业,已经实现了从生产系统(DCS, PLC)中直接提取实时数据,并结合实时指标计算,产生实时的生产指标,并支持实时决策,这种其实都可以归为EMI的范畴。第二个例子是库存的预测。早期库存受到多方面输入因素影响和多种约束条件限制,比如市场需求、客户订单、供应链,以及生产中的残次品、非计划停机等等,造成无法精确预测产能以及对应的库存需求,也就很难形成既能满足客户需求、又能兼顾库存成本要求的最优方案。现在,已经有人在尝试通过神经网络可以将多种历史数据中的输入因素和限制条件进行训练,构建多种组合分析的可能性,并对结果进行模拟,给出推荐建议,可以获得最优动态库存策略。第三个例子是SPC,就是统计过程控制。SPC其实并不是一个新概念,但是一直以来它仅仅被应用在固定门限的检测和过程稳定性能力的离线评估上,无法应用到实时的产线异常监测和预测,更无法应对不同参数的变化。比如说质量控制,人们可以用SPC检测相关的过程能力指标,但是却无法把这些检测到的指标直接反馈到产线的实时运转过程中去。现在,人们开始把数据的检测、指标的计算等提升到实时的水平,同时,基于指标的历史数据进行训练,不断动态修正判决门限,实现动态检测;对预期结果进行残差的SPC监测。第4个例子是虚拟量测。虚拟量测是半导体行业提出来的概念,因为半导体制造流程复杂、精密,上游制造流程和下游制造品之间存在一个比较长的时间差,比方说一套工艺开始生产到出品可能有几天的时间,等质检人员对下游出品进行检测发现质量问题时,如果这个问题是上游制造环节产生的,因为有几天的时间差,那么其实不但被检测的这一批产品有问题,后续几天的出品也会无可挽回的出现相同问题。基于机器学习建立一个跨时间、空间维度的预测模型,通过大量的工艺参数、批次检测等数据,寻找规律,使得上游工艺参数发生变化时,人们就能预测到这个变化会带来什么品质的下游产品,避免低良率、高残次品情况的出现,这就是虚拟量测。第5个例子是Google数据中心能耗的优化。如何降低数据中心能耗是一个世界性的难题,它涉及到的环节非常多,需要改进的参数也非常多(可能成千上万个),同时动态负载变化又非常快。除了物理改进措施,Google也在利用神经网络去解决数据中心的耗能问题。大量的参数被输入到神经网络中,通过增强学习寻找最优的优化组合,据说实现了40%的提升。第6个例子是美国智慧建筑VERDIGRIS的能耗管理。常规思路对各种设备的能耗实时测量需要在被监测设备上部署仪表或者传感器,VERDIGRIS通过监测电力线路,再借助神经网络学习、拆解设备能耗模式,实现了建筑内各种用电设备能耗的监控。第7个例子是基于机器学习的预测性维护。传统设备维护一般基于固定的告警规则、维护策略,成本高、能效低,尤其对设备故障造成的非计划停机缺乏低成本、有效的对策。预测性维护通过海量实时和历史数据,监测、学习设备的运转模式,发现设备故障早期的特征,以及设备故障的发展趋势,并能够将这种经验、知识广泛的应用到同类设备的监测上,在故障发生之前及早提醒工作人员采取应对措施,以免发生严重故障,造成非计划停机。

05案例分享

寄云科技是工业互联网服务商,这几年主要为一些行业头部企业提供服务,模式基本上是基于寄云NeuSeer工业互联网平台相关的产品和应用,打造智能装备、智慧工厂和生产运营管控等解决方案。上图展示了我们的主要业务领域,包括石油石化、电力能源、半导体装备、高端制造、轨道交通等,以及部分重要客户,基本上都是这些领域的领头羊。寄云科技团队拥有多个专业领域的融合优势,既有工业数据分析领域的研究团队,也有云计算和大数据领域的资深成员,同时还有工业互联网以及能源、电力和化工等行业专家。寄云科技提供基于NeuSeer平台的完整的工业互联网平台解决方案,从工业设备数据采集、边缘计算,到海量数据的工业大数据管理平台,以及一系列针对模型和应用开发的工具,以及基于平台开发的预测性维护、智慧工厂、生产运营智能管控等解决方案。这里我们再给大家分享几个实际应用案例。在之前的内容提到,寄云科技工业互联网应用根据企业的功能层次,划分为资产、运营和业务的管理三个层面。我们先分享资产性能管理这个层面的案例。资产性能管理首先提取各种设备数据,再结合维护记录、故障库、产品手册等信息,同时在FMEA、控制理论等机理基础之上,通过变点检测、机器学习等分析手段,打造设备的实时监测、诊断、可靠性管理、性能预测、维护策略优化等应用,最终实现降低非计划停机概率、提高运营效率等目标。寄云科技协助中石油旗下宝石机械开发装备预测性维护和故障诊断应用,实现边缘层数据采集、数据平台层汇集,以及设备运行监控、健康度评估,以及基于实时数据的维修维护管理。上图是整个解决方案的架构图,遵循工业互联网平台的主题思路。在解决方案中,每台钻机大概有1000多个传感器以及各种自动化系统的数据,比如电流、电压、扭距、转速等,通过寄云工业物联网网关、边缘计算网关以及时序数据库等进行采集、处理、分析和存储。尤其寄云边缘计算网关一方面可以实现实时的钻机状态监测和维护,另一方面可以和云端深度分析相结合,对钻机的智能维护具有代表性意义。在此基础上,结合寄云NeuSeer DAStudio数据分析与建模平台开发故障异常检测、故障诊断、故障预测等模型,以及相应的可视化的、可在线交互的应用。上面是方案的一些效果图,展示了基于实时数据的告警和故障诊断。以及包括电机、减速箱等设备的个性化告警规则设定,并基于告警规则形成故障诊断。 同时,在多种维度层面开发相应的模型,比如设备健康度模型,可以覆盖电气、润滑、传动等各种维度健康状态。然后,在这个基础上优化原有的设备维护策略,把之前的“定时修”的维护策略,逐步过渡成结合传感器数据的“状态修”。然后我们下一个阶段的目标就是计算真实的RUL(剩余寿命),基于RUL实现“预测修”。我们在此基础上也在尝试一些深度数据分析的拓展。比如,通过机器学习,对多维数据的变化趋势及其之间的故障特征进行保存和训练,构建故障特征库。这些故障特征库可以变成“数字化指纹”,把它跟实时数据结合起来能够实现基于相似度的异常检测和故障诊断。比如,我们可以把实时接收的传感器数据跟这些数字化指纹比对,能够检测到一些故障现象,比如说对润滑问题的判决。当然,目前这种应用还在探索阶段,还需要不断的应用和优化。 第2个层面是运营性能管理应用,主要覆盖生产过程中各种关键指标的优化。我们以寄云科技服务的北美第一、全球第三大汽车零部件供应商麦格纳旗下格特拉克(江西)传动系统有限公司(GJT)智能制造战略落地为例。GJT智能制造战略的一个重要任务是实现贯穿整个工厂的数字化指标体系,也就是从设备及相应的设备可靠性等指标,到产线层面的产量、节拍、合格率等,再到工厂级的订单、质量等,再到企业级的性能和质量等,所有这些环节指标都要实现贯穿全局的互通,为基于实时数据的精准决策提供支持。数字化指标体系中的重中之重其实是设备管理指标的实时化。GJT虽然有着先进的设备和相关的软件系统积累,但仍然存在着较多的实时数据采集盲点,还停留在手工记录时代。目前相关项目落地后已经实现设备联网数据采集、实时设备运行状态监控、关键业务指标JPH/ OEE/MTTR/MTBF由系统自动生成并无纸化汇报,实现了降本增效目标。通过项目架构图可以明显的看到,这是一个典型的基于IT和OT数据融合的实时监控和指标分析的案例。首先数据既包含OT类非标设备以及机床设备参数,这一类主要是时序数据,也融入了包括等IT系统排班等指标,这一类主要是结构化关系型数据,二者通过寄云NeuSeer平台提供的时序数据库、MPP数据库等实现数据的统一,最后基于寄云NeuSeer平台开发相应的设备监控和报表指标分析应用。上面是项目最终开发的相关系统应用的部分界面效果,首先是实现了整个工艺流程以及每台设备的可视化,通过易于辨识的状态标识展现设备的阻塞、闲置、正常运转等工作状态。在这个基础上还对关键设备指标实时监控告警,并自动计算、汇报JPH、OEE这些指标,所以这也是一个比较典型的企业制造智能EMI类项目。它同传统的MES区别之处,在于它会更精确、实时、智能,这得益于实时数据、融合数据、实时计算引擎,所以它会让生产变得更透明。 第三个层面的应用案例是生产运营决策,主要面向大型流程行业。寄云科技服务的某超大型能源集团,有较多的并购、整合历史,一方面各子公司系统差异大,另一方面该领域业务系统极其复杂,使得集团层面一直以来很难实现数字化的业务和数据整合,造成集团层面无法及时得到下属公司的重大安全生产信息,也缺乏应急预案集中管理和系统化的应急指挥能力。借助工业互联网平台整合汇总下属企业的实时数据,构建统一的生产运营管控平台,形成一个统一的集团级决策和应急指挥的能力,是这类企业现阶段的刚需。上面是项目的架构图,跟GJT项目相比,该项目的重心位于更高的层面,包括数据的融合、业务的梳理、智能应用的构建。首先在数据这个角度,如果说GJT对于寄云科技的挑战是各种复杂设备的接入,那么这个大型流程集团项目对寄云科技的挑战是海量数据的融合。安全生产管控作为大型流程集团企业的典型工业互联网应用,需要汇聚全集团的全量生产数据,数据源、数据类型、量级、存取性能、稳定性等都有着严苛的要求。事实证明,寄云时序数据库、MPP数据库等经得起这种考验。另一方面,作为大型流程集团企业工业互联网应用的典型,该项目还充分体现了寄云NeuSeer平台在开发效率、灵活性等方面的优势特性。在数据融合的基础上,项目梳理近百项基础、业务、综合等各方面的智能应用需求,借助平台的开发能力实现了这些应用的灵活开发,并具备面向未来的性能、功能等扩展能力,最终实现了统一的生产决策,实现了生产指标的真实性的监管,设备资产统一管理,统一的应急指挥。未来系统还会展开深入的设备性能分析、可靠性分析、工艺分析……并向机器学习的深入应用场景延展。 上图是项目开发的部分数据智能应用功能,包括生产运行监控、安全监控、视频监控、环保、应急指挥、可靠性、能耗一系列的管理,都统一在一个平台之上,同时它还会提供一个相对比较完整的企业决策支持。 从这一系列的项目中,我们也看到了一些趋势,在此也分享给各位。首先,IT和OT的数据融合势在必行,非常有必要,而且效果惊人。每一个关键过程的指标,一定是跨OT和IT系统的基础上,通过融合的数据和实时的计算得到的。这种融合,可以让关键的指标更精确,更实时。第二,应用和数据如果实现分离和解耦,将会极大的提高业务的响应能力,带来业务的灵活性的提高,因此,就需要一个标准化的数据平台,以及快捷的应用开发工具。第三,ISA95已经从传统的纵向、摘要数据的整合,逐步走向横向、全量数据的整合,并且实现跨L0-L4五个层级的数据标准。第四,MOM/MES的功能,已经开始瓦解,逐步变成一个统一的生产运营平台上的、基于相同数据标准开发出来的、轻量级的、基于微服务的一系列新的应用。第五,工业数据分析不要尝试走捷径,一定是基于对物理过程、设备的了解的基础上,结合一定的统计分析和机器学习,才能起到准确而令人信服的结果,否则是舍本逐末。第六,另一个可以看得见的趋势,是IT系统和OT的融合正在扩大到控制系统,APC已经是一个IT和OT融合的例子,随着硬件性能的提高、计算资源的丰富,未来这类融合将会越来越普及,下一代控制系统,一定是结合IT和OT的产物。

06总结和建议

最后是一些总结,以及给大家的一些建议。首先,无论是从国内外企业的实践案例来看,还是从像麦肯锡这样的调研机构数据来看,数字化转型确确实实能够带来很可观的一个能效,包括生产效率的提升、可持续性的提升、敏捷性的提升、产品上市速度的提升……甚至有些提升程度能达到200%的程度。我们再对比一下数字化投资ROI和传统工业投资ROI。传统投资,包括比如自动化和机器换人。数字化投资,前期的成本肯定要比传统投资要搞。从时间和回报曲线来看,在开始获得回报之后,数字化投资的ROI提升速度要明显超过传统工业投资ROI,同时,从长远的收益来看,数字化投资的ROI也能够持续超过传统工业投资ROI,保持一个稳健的增长态势。我们再看一下LNS给出的这个数字化转型框架。第1个阶段就是制定经营目标,该阶段关键在于“灵活性”,也就是充分考虑市场需求的变化,各种原材料的需求变化,以及自身能力的变化,制定具有一定灵活性的绩效指标。第2阶段要制定一个卓越运营的KPI指标。大家可以回头看看我们之前讲到的ISO22400之类的指标体系,重要的是要从繁杂的指标中分清主次,找到适合自己业务的指标组合体系。第3阶段使用新的工业互联网技术构建新的运营架构。第4阶段在每一个过程里面设定相应的中期、短期和长期的目标ROI。第5阶段消除偏见,寻找长期的合作伙伴,而不是临时的供应商。我们的第1个建议,重视指标的建设。经营、生产、设备、库存、质量、安全合规等指标,一方面实现数字化,另一方面要落地细化。数字化要借助工业互联网平台的融合能力,实现指标的统一管理和统一服务。第2个建议是重视数据平台的建设。传统工业数据一般都会分散在各种独立系统中,数据平台通过数据融合能力,海量、高效、专业的数据存取能力,统一服务于智能数据应用,实现基于物理、基于统计、基于机器学习的数据分析。第3个建议尽快拥抱数字化转型,做好分阶段的规划。第一阶段还是要做好一个平台的规划,做好相应的基础数据采集。同时,我建议本阶段可以从一些相对比较容易让决策层通过的应用开始。第二阶段,不断的拓展更多的业务系统、自动化系统的接入。同时,展开一些具体的基础分析,比方说良率的分析、产能的分析来实现快速获得回报,本阶段不建议进入“大而全”的尝试。第三阶段深化相应的数据分析,开发一系列的数据智能应用。第四个阶段有条件的超大型的企业可以考虑数字化生态的一个构建,基于已有的服务能力,去开放相应的模型、相应的数据、相应的应用,打造数字化的生态。 第4个建议是,大型企业自身数字化转型已经取得足够的成果时,再考虑对外提供服务。现在也有一些大型企业刚启动数字化转型没有多久,就已经考虑对外提供服务。我的建议还是先做好自身的基本功,把质量、效率、产能,这些指标先用数字化的方式来改进起来。从两个维度展开,第一个是价值链的维度,从供应链再到工厂,再到客户,再到渠道,逐步的拓展开来。第二个产品生命周期,从研发设计,再到生产制造,再到产品服务,整个流程利用数字化手段管理起来。第5个建议就是选择相应的长期合作伙伴。对于合作伙伴的评估,一定要考虑它是否具备丰富的行业知识和项目积累,是否具备完整的工业互联网服务能力,是否具备强大的数据分析能力……数字化转型是一个长期的过程,在开始就要选择可靠的伙伴共同推进。 最后,寄云科技是绝对值得信赖的工业互联网合作伙伴,欢迎有志于数字化转型的工业企业与寄云科技进行深入的沟通,几年来,寄云科技服务了数十家超大型工业企业,80%都是世界五百强和中国500强,我们提供了包括规划、建设、服务和拓展等一系列服务,广受客户好评。
(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询