成员自1984年以来

了解更多

AIA - Advancing Vision + Imaging已转型为推进自动化协会(Association for Advancing Automation),是全球领先的视觉+成像、机器人、运动控制和工业AI行业自动化行业协会。

下内容提交:

行业:
N / A.

应用:
N / A.

深度学习:欢迎来到第二台机器革命

发布05/29/2018

 | By: Winn Hardin, Contributing Editor

业内人士表示,深度学习正在带来第二次机器视觉革命,使设计师能够创建零件规格,从而开发出成功的机器视觉解决方案,而这在以前是不可实现的。

“过去五年,我们一直在认真投资这项技术,但它只是在过去的两到三年中,它是可行的,”自动化集成商星系统的首席执行官Andy Long解释道。“但是在过去18个月内对深度学习的需求的加速是惊人的。”

与许多重要的机器视觉技术(如智能摄像机和3D传感器)不同,深度学习技术的采用往往是由对技术感兴趣的工程师推动的,其兴趣既受技术驱动,也受能力驱动。“高管们说,我们需要投资于这项技术,看看它能做什么,”朗补充说。

一种机器愿景的新方法
深度学习机器视觉软件本质上允许机器从数据表示中学习——在这种情况下,图像已经被人类检查员标记——而不是特定任务的算法。通过使用基于软件的神经网络,深度学习程序的学习过程与儿童的学习过程非常相似——最终在看到数千张被标记为好或坏的图像的基础上,学会分辨“好”和“坏”。

“这让我想起了30年前的机器视觉市场,”康耐克斯公司(congnex Corporation)视觉软件营销总监约翰·佩特里(John Petry)说。“今天,我们所有的客户都在某种程度上熟悉传统机器视觉。他们可以拿起机器视觉工具,快速学习对齐工具的工作原理,并解决一个应用程序。但在深度学习方面,我们正在与全自动化团队进行技术讨论,讨论在哪里使用它、如何训练系统、如何评估样本和缺陷、深度学习系统的运行速度有多快,以及管理层是否可以信任结果。这是我们30年前经常进行的对话。”

尽管Cognex和MVTec software GmbH等深度学习软件供应商取得了惊人的进展,但它们很快指出,该技术并不适用于所有机器视觉应用。例如,MVTec最初于2016年11月发布的深度学习算法专注于光学字符识别应用。深度学习算法能够学习新的字体,解释扭曲的文本和3D透视的变化,以及更多的功能,使OCR成为主要目标——以至于两家公司现在都提供预先训练的OCR神经网络。

“通过我们最新的Halcon产品,我们的深度学习算法基本上可以解决任何应用,但对于根据定义形状定位对象的应用,我们提供了超过50年的高度专用算法,”产品经理Johannes Hiltner说用于MVTEC的Halcon图像处理软件。“深度学习最适合在没有定义形状的应用中,例如确定划痕是否可接受或不可接受。缺点是,在分类比传统算法中,深度学习更好地学习,但不能高度优化速度。“

就在本月,Cognex宣布其ViDi深度学习套件现在可以通过该公司的旗舰图像处理库VisionPro获得,其中包括Cognex Designer基于对象的编程前端。“人们一想到深度学习,比如发现划痕,就会想到美容检查,”康耐视公司的Petry说。“但它在装配验证方面也很出色,例如,无论油管位于何处或与摄像机的角度如何,都可以确认一段手术油管是医疗包的一部分。PatMax(康耐视的几何搜索算法)可以让你在一个制造零件上达到亚像素精度,但当涉及到食物、小型电子产品和其他物体时,深度学习会更好,这些物体可能会根据相机的视角呈现出非常不同的效果。当你在现有的生产线上增加一个新的电容器时,重新训练视觉系统只是向它展示新电容器的图像。从不同角度识别物体的能力也使OCR深度学习非常有效,这就是为什么我们为此提供了一个预先训练过的库。”

培训,测试和深度学习
如前所述,机器愿景中的深度学习是基于分析“监督”数据集的软件,以了解什么是良好或不良部分,分组或装配。传统的机器视觉软件,分析了两个图像 - 划痕和另一行的划痕之一 - 没有办法了解哪些图像包含缺陷与设计。深入学习软件通过审查每个每个图像并读取图像'元数据标题来划分划痕和设计之间的划分和设计。

但是,尽管机器视觉集成商已经积累了巨大的图像库,其中许多图像是客户的财产,不能用来训练新的神经网络,作为深度学习解决方案的一部分。MVTec的Hiltner说:“通过Caffe和TensorFlow以及其他开源的深度学习程序,现在已经有了公开可用的数据集,但大多数都不能用于商业项目。”“作为我们产品的一部分,我们提供针对许多常见工业机器视觉应用程序进行优化的预训练网络。通过使用我们预先训练过的网络,客户可以使用相对较小的一组标记图像来改进他们的应用程序,而不是使用数万或数十万张图像。”

除了OCR工具,康耐视没有提供大量训练有素的神经网络库。相反,Petry解释说,它的软件将这个过程分解成更小的部分,每个部分只需要20到50套图像。“这让我们可以在商业cpu和gpu上运行,你可以在五分钟内训练系统,而不是几个小时。深度学习最大的好处之一是,工程师可以确定一个应用程序是否可以在几分钟内解决,而不是花几周的时间试图解决一个问题,最后却发现用今天的技术是不可能的,”Petry说。

经验丰富的机器视觉集成商正在开发流程,帮助客户评估深度学习,并为其应用程序生成可行的数据集。ATS自动化公司成像部主任Steve Wardell说:“当我们对零件没有足够的控制,或者无法在规范周围设置足够的界限时,我们就会考虑使用深度学习。”

要开发代表生产线的数据集,而不会干扰现有生产的太多,ATS表明候选应用程序的混合方法。代替手动检查员在脱离线路时评估实际产品,ATS在检查器和产品之间插入相机和监视器。检查员看起来,并适当地标记它们。标记图像可以馈入深度学习程序,以检查所提出的解决方案的功效。

“许多这样的项目来自我们的生命科学和制药客户,”Wardell说。“这些行业有很多监管和验证要求。我们认为这种混合方法是一种真正允许这些行业需要的过程验证级别的方法。即使深度学习软件不成功,我们也能够为客户提供宝贵的生产数据,从而促进流程改进。”

Cyth Systems使用其神经视觉深度学习平台从生产环境中捕捉图像,并将这些标记的数据集发送到云端进行离线处理。“我们认为,今天的检查人员应该是训练下一代机器视觉系统的人,”赛思的朗解释说。“我们在这里真正谈论的是机器视觉的民主化。我们设计了神经视觉,这样用户就不需要知道异构计算平台。他们只需要知道:那是我的部分。我需要它朝这边看,而不是朝那边看,不管转不转。

Long继续说道:“这是我们在Cyth开发的所有项目背后的目标。“我们正在消除过去限制机器视觉发展的黄金手铐。现在,为机器视觉系统编程需要太多的技能。我们的工作就是让你完全不需要那些技能。你不需要了解机器视觉术语。对我来说,技术是驱动者,技术的发展速度比以往任何时候都要快。这是一个非常激动人心的时刻。”

生命科学展望这种内容是生命科学策划收集的视野的一部分。了解有关生命科学愿景的更多信息,点击这里