成员自1984年以来

了解更多

AIA -先进视觉+成像已转型为先进自动化协会,全球领先的视觉+成像、机器人、运动控制和工业AI行业的自动化行业协会。

下内容提交:

工业:
N/A

应用程序:
N/A

人工智能将如何革新而非取代机器视觉

发布08/20/2019

作者:Dan McCarthy,特约编辑

在短短10年的时间里,人工智能(AI)已经从实验室里的好奇心发展成为我们日常生活中越来越普遍的一部分——如果不是总是可见的话。虽然我们中的许多人可能不认识为我们日常与智能手机、语音助手、电子商务网站或流媒体服务提供支持的人工智能系统,但这些系统肯定认识我们,而且它们可以越来越准确地预测我们的偏好。

尽管这看起来很奇怪,但许多人工智能系统只是将我们的选择与类似选择的结构化数据库进行比较。例如,Netflix的人工智能可以通过交叉引用类似标签的电影得出我们对黑色电影的偏好。但如果没有这些标签,它将需要深度学习算法和相关图像库来区分黑色电影场景和埃斯特·威廉姆斯(Esther Williams)的游泳序列。

深度学习通常被定义为机器学习的一个子集(它本身是人工智能的一个子集),它使用神经网络和算法,使机器能够学习,而不是被明确地编程来执行某个任务。除了图像之外,这些数据还可能包括音频文件、业务文档或天气模型。

在消费领域,深度学习图像关心的大多数应用程序识别和分类,并从无聊的智能手机应用程序(例如,不是热狗)强大的系统,使Facebook自动识别的图像块毛皮在沙发上一只猫之后搜索,参考,可能,有针对性的广告位置。

深度学习还支持谷歌的Vision AI API,该API利用该公司约10,000个视觉可识别对象的原生目录,在万维网上执行相当于反向图像搜索的功能。谷歌的深度学习平台除了列出现有的主题,用于给给定的图像加上标题,还可以生成新的图像标签,例如,每日新闻中发生的随机事件。

AI革命从这里开始
虽然大多数消费者不感兴趣深度学习的黑色盒子里面是什么,只要它的工作原理,功能说明了谷歌的愿景AI API对机器视觉行业具有明显的影响,这几十年来依赖固定的基于规则的方法和通过/失败的解释图像数据。

基于规则的编程擅长测量和对齐,而深度学习工具可以对图像数据进行分类,以执行复杂的外观检查,区分不同的材料,验证装配,并通常适应非结构化图像数据。这并不是说深度学习有一天会取代传统的机器视觉,而是扩展了机器视觉的能力。

MVTec软件有限公司HALCON图书馆产品负责人Thomas Hünerfauth说:“深度学习是一种简单而强大的应用解决方案,非常容易用人眼检测,但使用基于规则的方法时很难。”

例如,深度学习解决方案可以帮助视觉系统区分图像中的杂草和作物,帮助农民识别并适当地调整对策。事实上,Hünerfauth指出,几乎任何涉及检查天然材料的食品工业应用都可以从深度学习工具中受益。他说:“设计用于衡量或斑点分析的基于规则的方法发现这相当困难,但通过深度学习可以轻松解决这些挑战。”

作为机器学习的一个子集,深度学习技术不仅仅是解释图像数据,它还有助于扩展图像处理系统,使其变得更加精确。传统的机器视觉解决方案依赖于开发人员来定义和验证目标特征,与之不同的是,深度学习软件利用了神经网络,这种神经网络与人类智能一样,可以通过训练来区分图像中的特征,同时容忍变化。当系统捕获新的图像时,软件识别对象和异常,并将新的图像数据分配给适当的类。

Teledyne DALSA软件总监Bruno Menard说:“如果你想训练一个神经网络,你只有100张图像,但你需要1000张图像,你可以人工生成这些图像。”“这是一种数据增强的形式,”他补充道。

揭开了这个秘密
深度学习并非没有挑战。编译图像库和训练神经网络可以像为应用程序编写机器视觉系统(如物体检测或分割)一样费力。作为回应,诸如MVTec和Cognex等视觉提供商正在开发更简单的界面和预先训练的阅读工具,以帮助简化部署深度学习工具所需的图像库。

另一个挑战是,机器视觉工程师和最终用户往往不愿意忽视黑盒子里的东西。Hünerfauth说:“如果你训练这个系统并取得好成绩,那没关系,一切都很好。”“但如果结果是错误的,就很难解释原因,在某些行业,这是很难接受的。”所以,我们必须从黑盒中拿出一个灰盒,给客户更好的反馈,并试图解释里面发生了什么。”

谷歌的研究也可能提供一些见解。该公司最近与OpenAI合作,探索人工智能通过机器视觉系统看世界时是如何看到的,或者说看到了什么。利用他们所谓的“激活地图集”,合作者正在绘制单个算法如何一起激活,将抽象的形状、颜色和图案转换成可识别的图像。通过有效地揭开视觉数据算法得出结论的黑盒子的盖子,该研究旨在支持开发更健壮的算法。这种见解可能有助于机器视觉应用的深度学习,这对验证图像要求更高的标准。

补充技术
尽管深度学习具有强大的能力和适应性,但它将彻底改变机器视觉,而不是取代机器视觉。它们是互补的技术。机器视觉在图像数据中识别几何模式和边缘的能力仍然是实现高精度测量亚像素精度的最佳方式。深度学习有望通过引入一种类似人类的能力来从图像数据中判断和学习,从而扩展该学科的能力。但深度学习仍然受益于人类训练师——尤其是熟悉传统机器视觉技术的人。经验丰富的工程师可能经常发现他们的应用专业知识在优化深度学习的能力方面很有价值。