成员自1984年以来

了解更多

AIA - Advancing Vision + Imaging已转型为推进自动化协会(Association for Advancing Automation),是全球领先的视觉+成像、机器人、运动控制和工业AI行业自动化行业协会。

下内容提交:

行业:
N / A.

应用:
N / A.

电子表格,网关,持续培训:深度学习变得更容易

发布07/13/2020

作者:温·哈丁,特约编辑

Pleora的AI Gateway为任何工业相机解决方案带来了深度学习能力。Pleora合作伙伴的早期应用包括制药、传统机器视觉和国防领域的深度学习解决方案。深度学习使机器视觉解决方案应用于缺陷或检查标准无法轻松量化或数学定义的应用。它为机器视觉设计人员提供了一个强大的新工具,用于高级检测、装配和质量保证应用程序,因为该软件本质上帮助设计人员开发最佳可能的算法。但直到最近,创建深度学习软件还需要传统的编程技能,最好结合统计学和传统机器视觉系统设计方面的扎实基础。

今天,由于支持深度学习的智能摄像头,网关和特定于应用的编码,对群众的深度学习可能只需点击几下。

智能摄像头深入
深度学习过程分为两部分:训练和推理。训练包括通过向神经网络输入“好”产品和“坏”产品的图像来优化神经网络。操作员将图像标记为好或坏,深度学习软件进行统计分析,创建一个加权表。培训过程的计算非常密集,促使许多设计师在培训步骤中使用高端工作站或利用云资源。

深度学习软件生成的统计矩阵是深度学习第二步的核心:推理。推理涉及使用深度学习算法来解决现实世界的问题。深度学习软件的这一部分可以在更广泛的计算机平台上运行,从高端个人电脑到智能相机。现在,用户无需使用TensorFlow、Caffe或其他复杂的深度学习数据可视化程序来训练深度学习算法,而是可以转向其他解决方案。例如,康耐视最新的智能摄像头In-Sight D900使深度学习编程像创建电子表格一样简单。

康康克斯的内视系列视觉系统开创了使用电子表格编程,简化了使用智能相机平台的机器视觉解决方案的设计和部署。通过将其VIDI深度学习软件与In-Sight平台相结合,CoNEEX希望为深度学习解决方案带来不仅仅是缺陷检测和光学字符识别(OCR)应用,还可以实现更复杂的装配验证。

“D900是第一个不需要PC部署的深度学习机器视觉系统,”康耐视产品营销高级经理Brian Benoit解释说。用户可以通过PC上的In-Sight软件界面来训练深度学习软件。一旦完成了训练步骤,就可以将任务加载到摄像机上,准备部署。”

据Benoit介绍,D900适用于每分钟检测150-200次的应用场合。康耐视通过升级In-Sight的内部处理能力,同时利用嵌入式解决方案固有的速度来实现这一性能。

Gateway为每台相机带来了深度学习
不是每一台机器愿景客户,希望利用深度学习将愿意用新平台取代现有的机器视觉硬件。为了让现有装置带来深度学习,同时简化了对深度学习成功非常重要的图像采集和标记,机器视觉网络专业普莱拉推出了其AI网关。基于NVIDIA GPU框架,AI网关坐在相机和处理器或其他计算引擎之间的帧抓取物。网关提供Pleora的界面专业知识,适应Gige Vision,USB3 Vision,Camera Link,MIPI等,以及Tensorflow Deep Learing软件,OpenCV传统机器视觉图像处理库,以及一些Python将解决方案绑定在一起。

Pleora首席技术官Jonathan Hou表示,Pleora可以为多个“哑铃”相机提供深度学习机视觉功能。“客户可能有最好的深入学习算法,但它们如何将其部署到工厂?我们的解决方案允许它们保持其安装的机器视觉硬件基础,而无需强制客户选择任何特定制造商的深度学习解决方案路径。“

对于那些想要利用Pleora的深度学习能力而不需要编写代码的客户,该公司已经与Neurocle(工业机器视觉检测应用软件解决方案提供商)和perClass(高光谱成像专家)合作。侯教授说,例如,使用perClass插件,一个新手可以从密集的高光谱数据立方体中提取智能,而无需任何先前的光谱专业知识。工业应用包括在制药生产中区分视觉上相同的药丸。Pleora还与军事成像应用领域的其他人工智能专家合作,包括车辆侧翻检测系统,以应对不断变化的路况,基于新耕土的IED检测,以及迷彩服与树叶的区分。

活到老学到老
虽然大多数深度学习系统在训练和推理步骤之间具有硬盘,但是,算法的效率并不通过人类验证或分级的图像,如果他们从不停止学习,某些解决方案可能会得到改善。

例如,Datalogic的条形码和可追溯性专家首先应用于其基于图像的识别系统的深度学习技术。“我们大量专注于可追溯性的任何事情,因此我们已经应用了深入学习,一般地应用了识别,代码读取和一些模式识别,”布拉德利Weber,Datalogic产品营销经理Bradley Weber解释说。“当我们在包上查看标签时,显然我们要读取条形码。但最强大的解决方案还将读取条形码下的数字,往返运输信息 - 框中的任何和所有标记。您在包上收集的每一点数据都会增加您可以追踪包装的机会,即使条形码或标签损坏。“

此外,Weber表示,Datalogic的重点是嵌入其产品中深度学习的力量,以便客户无需访问底层代码。“当我们看看谁安装可追溯性解决方案时,他们不会成为视觉工程师,”韦伯说。“所以解决方案需要简单且错误。例如,我们很快将释放我们的智能VS,这是一种使用人工智能的视觉传感器。没有编程,用户可以按下一个按钮来教授什么是一个好的项目,再次按下按钮来教授什么是坏项目,并且让传感器将学习如何拒绝或排序项目。“

根据Weber,代码阅读和OCR等可追溯性应用可以从不断学习客户的包装如何随时间变化而受益。系统可以为OCR学习新字体 - 可能是手写。

韦伯说:“目前,处理成本非常低,因此我们专注于将计算能力发挥到最尖端,这使得深度学习成为可能,但也限制了我们的飞行训练能力。”“随着5G技术的推出,我们可以想象势头将从微处理器转向网络。我认为,更强大的计算机系统和更快的网络之间的交互将继续指导我们如何在机器视觉应用程序中部署和使用深度学习。任何让我们能够自动化运输和追溯的东西——尤其是在COVID-19的疯狂时期——都是非常好的东西。”