行业见解
现代搜索算法的DOS和不良
发布12/08/2016
| By: Winn Hardin, Contributing Editor
查找机器视觉定义,您将读取收集运行专门软件的图像和计算机的摄像机,以分析图像,帮助机器基于该图像进行自动决策。
在闪光灯的闪光灯和收集光子创建图像之后,第一步向下沿着自动决策的黄砖道是用于在图像中找到的东西。为了找到,一个必须搜索(或幸运,运气具有低的重复性分数)。
搜索算法自20世纪80年代以来已经走了很长的路。计算上强化相关函数在很大程度上具有尺寸的方式,用于许多搜索功能的规模 - 金字塔和几何模式搜索方法 - 但不在每种情况下。有时,在图像处理搜索技术方面仍然是最好的学校。
2 dos,1没有
根据Ben Dawson的说法,战略发展总监Teledyne Dalsa.(Waterloo,安大略省,加拿大),搜索通常被要求执行三个功能中的一个 - 但其中只有两个是一个好主意。
“存在的存在是第一个功能,”道森说。“这是光电池的算法等效物。你不在乎它是什么,或者到底,只是如果存在某些东西。经典示例是计算在输送机上移动的物品。“
搜索的下一个应用程序是找到。“一种简单的方法是使用预测。你总结了行或列,寻找表明某事物的总和,“道森说。“这种简单的方法很容易被背景项混淆,因此现代搜索使用复杂的算法,例如匹配对象轮廓。大多数现代搜索方法还可以识别有限的物体范围。对于更困难的标识,您可能会使用Blob分析,查看对象曲率,颜色和其他功能。“
有趣的是,人类大脑有两种不同的途径来处理物体位置和识别。例如,如果有什么东西来到你的头上,你就不关心它是什么,只有你需要鸭子。在这些情况下,快速,皮质波动途径让您失望。第二个,较慢的皮质系统标识对象。
当设计人员尝试使用搜索来执行部分检查时,将搜索算法推到他们的断点 - 不仅仅是在那里或者是否是螺母或螺栓,而且如果它是右螺栓的话。这不建议使用,因为搜索算法尝试忽略产品上的次要变化以使搜索更加强大。
它会相关吗?
搜索算法必须在图像中定位学习对象时必须克服几个挑战,例如对由照明变化引起的图像的感知变化。但是,他们还必须在学术界部门和通过在对象和相机之间改变空间关系而导致的被测部分和所测试部分之间的差异进行差异。这些标准 - 以及特定于应用的特定条件,如图像分辨率,缺陷尺寸,线速等 - 选择服务器在选择搜索技术时的主要考虑因素。
“传统的搜索技术是各种相关性,例如灰度或归一化相关性,”Arnaud Lina,Software Engineere Group Manager解释说明Matrox电子系统有限公司(Dorval,魁北克,加拿大)。
关联技术可以很容易地“取决于您正在寻找的自由度,如果您有多个对象,其中两者都有挑战相关技术,”Lina说。“相关技术的主要优点之一是它们对大规模,照明的大规模变化具有稳健性。”
相关性对焦点的图像部分的部分也是坚固的。几何搜索依赖于边缘检测,有时可以通过缺乏焦点来产生不利影响。在诸如高分辨率印刷电路板(PCB)检查的应用中,表面安装部件的高度可以延伸超过景深,因此变得模糊。
“While MVTec Halcon’s edge-based, geometric-search routines can deal with a large amount of blur robustly and, therefore, can be used in virtually all search applications, in rare cases correlation techniques are preferable for finding shapes in these types of applications,” says Carsten Steger, Research & Development Director atMVTEC Software GmbH.(慕尼黑,德国)。
根据Teledyne Dalsa的道森的说法,相关技术的问题是,它们可以缓慢而不是非常稳健。“它没有太大的旋转[+/- 5度]或尺度耐受性,”他说。“归一化相关性具有相当良好的宽容,从整体光线和对比度变化。Teledyne Dalsa提供相关和几何搜索方法。“
软件工程师已经开发了许多用于加速相关技术的多种技术,从数字快捷方式到自由利用阈值来快速丢弃失败匹配卷积。今天更便宜的微处理器降低了每计算价格,但它们无法完全消除所需的额外时间。
金字塔和其他几何学
20世纪80年代在搜索技术中提出了下一个重大突破,通常称为尺度空间或金字塔技术。该技术以金色部件的全分辨率图像和金字塔底部的测试部分开始。然后,每个图像都被平滑,并且其分辨率切成两半(子采样)。重复此过程给出了通过较小的下层分辨率的全部分辨率的图像的“金字塔”。
通过搜索以金字塔顶部的低分辨率图像开始的目标特征或对象并向下进入更高的分辨率,系统设计人员可以快速使用相关性和几何搜索来查找其目标。根据MVTEC的标记,绝大多数搜索应用程序使用几何搜索。
几何搜索技巧可以以多种方式定义对象:从质心到边缘的距离;外边缘的曲率;和其他因素。这些方法对非均匀照明变化以及尺度和旋转是鲁棒的。
将几何和相关技术与刻度空间处理速度搜索功能,这是图像处理软件开发人员的首要任务之一。虽然软件设计师继续寻找加速2D搜索技术的方法,但最热门的新区域之一涉及3D搜索。
“我们经常使用我们的注册搜索模块进行3D搜索,”Matrox的Lina说。“我们的2D注册模块可用于拼接图像或用于在图像中定位功能。当谈到3D注册时,我们通常将3D地图投影到2D空间中并在精炼3D位置之前获得对象的粗糙3D位置。这为许多应用程序速度加速了整体搜索过程。“
MVTEC通过2007年使用校准相机的单眼2D图像发布了其第一3D搜索算法。最近,MVTEC引入了可变形物体的匹配技术,如箔片封装或香蕉等农产品,基于2D图像和点云。
“由于在2D图像中的透视变化可以被视为一种特殊的变形,因此这还允许我们引入用于平面物体的有效的透视匹配技术,”steger说。
MVTEC的最新HALCON释放(V13)通过在可用时使用2D图像和3D点云使3D搜索过程更加强大。此外,稳定的2D形状的匹配基本上已经加速了。
今天,两个硬件和软件公司都拔出所有停止,使3D成像更能访问,从专用的3D传感器到向导,帮助程序员决定他们的图像可以支持多少比例级别,或者基于的几何搜索使用的最佳功能未处理的图像。这些努力已经屈服,为搜索算法优化开辟了新的视野(和需求)。