行业见解

成员自1974年以来

学到更多

内容提交：

行业：
N / A.

应用：
N / A.

从基于人工智能的预测性维护开始

发表于07/16/2021.

作者:Kristin Lewotsky，特约编辑

预测维护不是一个新的概念。实现预测性维护的技术已有多年。优势是众所周知的，特别是鉴于大多数行业的停机费用高。尽管这些点，但采用滞后，特别是在最终用户社区中。它还没有简单的资本uplay¾Data捕获和记录/传输功能的问题已经内置于许多组件中，例如驱动器具有当前和温度监控功能或HMIS，可作为数据记录器。抛弃安全问题，粘性点往往缺乏将数据转换为可行信息的技能以及与在内部或处理第三方服务的成本和时间相关的成本和时间。AI，特别是机器学习（ML），提供了实现预测性维护和储蓄的有效工具。实际上，根据麦肯锡和公司的说法，基于AI的预测维护可以将可用性提升高达20％，同时将检查成本降低25％，年度维护费用高达10％。¹

预测性维护的主要挑战之一是梳理大量数据，只提取有意义的、可操作的信息。特别是考虑到工业物联网(IIoT)的快速发展，组织可能会发现自己数据丰富，但信息匮乏。毫升是一个有组织的方法提取的见解,可以用来检测发展缺陷之前成为主要问题,确定剩余的可用的生活甚至不良资产(原则),安排维修在最低限度破坏窗户,并进行根源分析,防止将来类似的失败。

AI的基础知识

某些类型的预测性维护建模可以通过相当简单，甚至手动计算，容易地解决。ML的真实价值是其在复杂机器动态和现实世界业务的背景下考虑大量的大量和不同类型的数据，以更加了解资产运作和健康。

ML是狭义人工智能应用的一部分。这是指为执行特定任务而编写和训练的函数。例如，您在网上银行会话期间刚刚与之交互的聊天机器人可能是一个狭窄的AI应用程序，设置为对指定的输入集提供特定的响应(在其他请求的情况下提升为人)。同样，ML可以通过一个统计模型运行传感器数据，以检测定义为对应于一个正在发展的缺陷的条件。“机器学习不是真正意义上的智能，”RapidMiner(波士顿，马萨诸塞州)的数据科学家Scott Genzer说。“这其实只是我们几十年来一直在做的老式数学模型。不同的是，我们有了处理大量数据的计算能力，可以在大量噪音中找到模式，找到信号，而过去我们都是手工处理。”

ML解决方案已经广泛部署在欺诈警报和预测性维护等用例中。相比之下，通用人工智能（general AI）包含了流行文化中流砥柱的各种感知机器，非常复杂，很可能在未来一段时间内仍将是实验室的好奇心。

在有监督机器学习中，算法对人工标注的训练数据集进行操作以创建模型。此模型可用于生产数据以返回结果或预测。

在ML中，一个或多个算法对一组训练数据进行操作，这些数据旨在描述诸如资产状况和性能、故障、维护过程、环境、故障或维护记录等因素。利用这些数据，算法创建了一个描述复杂系统及其交互的数学模型。对数据进行组织，以便有一个可预测的“目标”变量，在这种情况下，用于描述资产健康状况、剩余寿命等。目标是当新的数据放入模型时，模型将返回状态、预测等(参见图1)。

机器学习可以分为有监督学习和无监督学习。在有监督的ML中，一个函数（模型）被训练成使用大量手动分类的数据以一种确定的方式对新的输入进行操作。预测性维护的监督学习通常使用分类或回归来解决。在分类中，离散输入映射到离散输出；有了足够的正确类型的数据，该模型可以将资产分类为健康或不健康，或者将产品分类为可接受或不可接受（参见图2）。输出并不总是二进制的；该模型可能会返回一系列可能的结果。回归采用准连续输入，如时间序列温度或振动数据，并以趋势的形式返回连续输出值，可用于预测未来函数。虽然分类可用于确定资产是否存在可能导致计划外停机的缺陷，但回归将利用历史行为加上当前数据来预测资产的剩余使用寿命和估计失效时间。

监督机器学习通常用于两个任务:分类(左)和回归(右)。在分类问题中，算法利用输入数据产生离散输出数据(例如，健康资产或非健康资产?)在回归问题中，模型接受输入数据并产生可用于预测的连续输出值(例如，该资产多久会失效?)

在无监督ML中，算法对无标记数据通过聚类寻找模式(哪些信息属于一起?(见图3)和相关性(什么事件同时发生?)考虑一下装瓶生产线。有监督的机器学习分类器可能会检测到电机上的温度升高，并根据模型向维护人员发送警报，将其作为潜在的发展缺陷进行调查。一个无监督的ML模型可能会发现，当机器在8月份包装更粘稠的液体时，这个电机上的温度总是上升，所以可能根本没有发展缺陷。无监督ML可以发现意想不到的模式，导致有价值的见解。例如，当乔开动机器的时候，温度可能不会上升那么多。现在，公司不仅可以避免不必要的替换健康资产，而且可以审查乔的技术，潜在地发现一种方法来改善机器操作跨班次，生产线，甚至设施。

这两种方法都可用于预测性维护。有时，人们可以用于通知另一个，例如当用于更新监督学习模型的无监督学习模型中未发现的相关性时。

从业务案例开始

ML在预测性维护方面的最大错误之一是直接进入数据收集和模型构建。为了成功，项目需要从对业务的理解开始。在成本和业务影响方面的痛点是什么?今天它是如何解决的，ML将如何改进它?目标是什么，例如，减少计划外停机时间，优化产品质量，提高产量，等等?明确目标是实现目标的第一步。“人工智能是一种工具，而不是一种结果，”以色列海法公司Augury的首席执行官Saar Yoskovitz说。“重点关注您想要处理的用例，并决定您需要使用什么最好的技术堆栈来实现此目的。”

确保量化目标¾重要的是不仅要定义成功，还要了解评估投资回报（ROI）的成本基础。最后，不要忘记人为因素。从可能提供快速收益的简单项目开始，将简化审批过程。”计算机方面并不难，”根泽说最困难的是让工程师们接受，让经理答应，然后把它放到工厂里去。”

在聚类和无监督的机器学习方法中，算法在未标记数据中寻求相似之处和异化。

了解数据

建立业务案例后，下一步是收集并调查可用数据。目前的数据可以用于回答业务分析期间所识别的问题吗？有足够的细节和背景吗？在这里，OT需要与它和数据科学家合作，以澄清数据如何映射到物理现象，并确保输入来自组织的广度。例如，运动控制对于添加剂制造中的产品质量至关重要。结果，运行中出现的纹波和不连续性可以指示可以在系统中跟踪有系统的系统运动问题，即使传感器也没有直接揭示关注。

由于ML算法和模型的数据处理能力，这些数据可以、也应该来自各种各样的来源，只要它们是相关的。”当你有大量数据时，机器学习的效果最好。”这绝对是黄金法则。存储是便宜。从大数据湖开始，然后从中筛选。”

“数据不是自由的，但它比下降时间更便宜，”GE研究机械学习技术经理Paul Ardis（Niskayuna，New York）。“所以，如果我们考虑权衡和决策过程，那么建立一种调查尽可能多的数据的设计通常值得花时间，麻烦和成本;即使我们不一定知道它将从失败模式的角度捕获什么。“

离散自动化预测维护的挑战之一是工业设备持续。这意味着较旧的机器甚至有失败历史有限，而新的设计当然会几乎没有。这对操作有好处，但是当目标是捕获大量关于机器行为的大量数据围绕退化和失败时可能存在问题。运行设备无法收集数据并不实用。幸运的是，有替代方案。

历史记录：数字化和格式化机器状况和维护的历史记录可以是时间和劳动密集，但绝对是必不可少的。从Scratch Sundanders推出一个组织随着时间的推移积累的所有专业知识和见解。将传统记录移动到数字域中应该是项目开头的主要优先级。
开发数据：对于想要现场ML的预测维护解决方案的OEM，作为客户的特征或维护其设备的方式“舰队”，可以从初始设计中获得数据。原型测试可以用作有效的碰碰故障，或者至少进行次常进行练习。
代理建模：开发数据可能有用但有限，特别是在将结论推广到其他资产的能力方面。解决方案是代理建模，这是一种简化计算机模拟的数据驱动过程。传统的计算机模拟既昂贵又耗时，因为它们需要大量的训练才能接近真实世界的性能。在代理建模中，该过程从基线模型的模拟结果返回，生成“代理”模型，然后通过仅针对有限的一组条件而不是全面地运行完整计算来训练该模型。”其目的是提出一个有效的模型，可以在合理的速度开发任何需要的处理阿迪说。
转移学习：转移学习通过找到一种方法来修改或映射类似资产（甚至是特定生产批次中的类似资产）中的数据，从而为新资产构建一个训练集。它仍然需要少量的数据来理解实际的传输机制，但用户不再需要从头开始训练新模型。”阿迪斯说：“我们特别关注的是跨导迁移学习，在这种学习中，我们掌握了一些关于任务差异的信息。”因此，我们不只是试图匹配分布，而是非常明确地寻找相同的关系，从基于物理的角度来看，我们应该从原始设计中期待的相同类型的连接。”

“我们不需要为一个特定泵制造和培训模型，因为我们之前看到了超过20,000个泵，”Yoskovitz说。“我们知道空穴看起来像什么，轴承戴上看起来像什么样的。我们已经使用基于通用的物理方法建立了这些模型。“当然，为固定速度旋转资产构建标准诊断模型与具有复杂动态的自定义机器相比不同。在这里，从资产到资产的映射更复杂。“对于异常检测，我们为特定机器构建一个基线，因为不同的食谱更改了行为，从一个站点到另一个站点的环境更改了行为。我们也构建了基线机器行为的模型，也概念化到操作中。然后我们可以检测异常如果出现问题。“

考虑时间的问题

确保数据采集和处理速度足够快，以跟上被监控的工业过程和资产。这需要评估数据及其与物理实体的关系。

定义预测窗口:这是指指示器和故障之间经过的时间。换句话说，不仅要防止灾难性故障，还要实现破坏性最小、成本最低的维修，需要多少前置时间?一个小型齿轮箱更换现场可能只需要几分钟的维修通知。更换安装在工厂屋顶上的定制千瓦级电机可能需要几天甚至几周的交货时间来订购新电机和租用起重机来移动它。什么数据和什么ML模型将提供这些?
定义目标窗口:即使在故障之前，机器性能也会开始下降。模型应该解释这一点。目标不仅仅是继续生产产品或提供服务，目标是使产品畅销并满足服务水平协议。
定义功能窗口：如果我们正在跟踪一个平均或FFT的特定类型的数据，例如，该数据集涵盖的窗口是什么？

如果预测性维护解决方案不能提供足够快的结果，以便用户及时采取行动，那么就没有一个好的商业案例来追求它。”“一个模型只有在任何时间点都能提供的数据才是好的，”阿迪斯说更新模型以反映持续运行的最新感觉的能力¾是正常还是趋势异常？——受到数据更新率的高度限制。因此，与其说是我们能够存储多少数据，不如说是我们刷新数据流以确保我们能够采取行动的速度有多快的问题。”相反，如果活动的时间框架很慢，基于ML的解决方案可能会因需要而设计过度（而且过于昂贵）。

数据准备

与大多数类型的计算机建模一样，数据在应用到ML之前需要准备好，这不仅仅是简单的清理和格式化。考虑到所涉及的庞大数据量，需要将原始数据分解成满足特定业务问题的数据子集，或者进行操作以提供新的见解。这需要使用一组称为特性工程的技术，这对任何ML项目的成功都至关重要。“这实际上比建模更重要，”Genzer说。“你要努力找出哪些传感器和哪些部件最有意义。”

特征工程包括功能选择和功能：

特征选择是通过找出数据库中哪些列最相关，哪些列与目标变量相关性更强来缩小范围的过程。一个安装可能生成一千个或更多的数据列，但是其中只有少数列是识别开发缺陷所必需的。
特性生成是一个结合列来创建更多有用属性的过程，例如添加一对列，相乘等等。

在特征选择和特征生成之间，可以创建一个优化的数据列集，该组将具有最佳的找到有意义模型的能力。

特征工程是一个必不可少的步骤，但应谨慎接近。“工程师几乎本能地进入的危险是他们认为他们知道哪个专栏将推动预测阶级，”Genzer说。“这偏见了模型。你真的希望电脑找到什么它认为列是并有一个开放的头脑。您需要申请一点判决，因为您不希望它找到荒谬的东西，但我们不希望限制计算机找到您可能不知道的信号的能力。“

造型

ML的整个点是使用数据和算法来开发一个描述操作中的物理系统的模型，可以用于新数据，以便以持续的方式提供可操作的洞察力。对PL算法和预测性维护模型的详细讨论超出了本文的范围。相反，我们可以专注于一些大图片点。让我们从一个最常见的用户错误开始，这是将一个项目接近一个项目，以便在捕获数据之前使用的模型的预先概念。这向后获得了这个过程。关键是从业务问题开始从数据开始，然后找到哪些算法最能满足标准。

要记住的另一点是，构建模型并不是一件简单的事。通常，项目会产生多个模型，然后需要对这些模型进行评估，以确定哪个模型或哪个模型最有效地描述系统。

“我们在AI中的机器学习方面做了很多事情，同时探索了大量的潜在模型，”Ardis说。“没有一个简单的答案，'模型是什么？”因为答案是“我们可以拿走我们的一切。”另外，我们看起来能够一起处理它们的能力。“培训五种模型并不一定有效，例如，确定一些相对有效的加权，然后将其设置为将用于可预见的未来的常量模型。更具动态的方法可能提供更好的解决方案。“我们可以有一个设置，实际上是动态选择哪个模型，包括哪个模型，以及如何根据他们的绩效提供和利用它们最佳，从而随时间随时间提供真正的地面真相的时间？”他问。“

部分挑战在于，机器随着时间的推移不断变化;“正常”操作今天看起来与明年的看法不同。培训数据需要广泛，以展示其中一些进展。模型验证还需要测试模型是否有足够的弹性，或者是否已将其过度接收到初始数据集。“挑战是让某人了解有时，有时可以更好地拥有一个模型，其培训表现降低10％，但验证了解整个总体空间更有效，”Ardis说。

特别是对于工程师和数据科学家来说，他们很容易陷入寻找的过程中，试图优化模型，以将绩效数字提高不到一个百分点。这种类型的改进可能在概念上令人满意，但在业务上下文中，更相关的问题是，更改是通过更高的吞吐量或产品质量节省了资金，还是增加了盈利能力。“我认为，基于召回或精度来优化模型是错误的，”Genzer说。“最好是根据盈亏来优化。建立这样的模型，要么节约是最优化的，要么利润是最大化的。”

部署

可以以各种方式部署ML的预测性维护应用。它们最常部署在通过Web服务器访问的基于云的应用程序中，或作为商店地板上的专用设备运行。

然而，部署并不意味着工作已经结束了。任何拥有仔细策划的潘多拉频道的人都从比目外，他们不关注模型漂移或概念漂移的问题，从玩John Lee Hoker到John Lee Hooker到Justin Bieber。最佳实践要求部署所选模型，然后根据新培训集连续构建所谓的挑战者模型。挑战者模型应该模仿部署模型。如果他们没有，它可能意味着需要重建的部署模型存在问题。它可能意味着初始条件可能发生变化，无论是（仍然健康）机器的变化，环境条件也会发生变化，也可以改变或操作要求进化。此外，情况需要一个值判断：是否有需要纠正的模型存在的实际问题，或者是模型不同，但资产仍然在所需的吞吐量下拒绝质量零件？