机器视觉的众多优点中,较为突出的有以下几个方面。如图1-1所示,一套典型的机器视觉系统工作过程如下:图1-1典型的机器视觉系统工作过程①工件定位传感器探测到物体运动至接近相机视野的中心时,向图像采集卡发送触发脉冲。所以,在机器视觉系统的开发和设计中需要投入大量的精力。......
2023-11-18
在很多文献中,对于机器视觉和计算机视觉是不加区分的,但是,实际上两者有区别也有联系。具体地说,机器视觉更加偏重于工厂自动化中的应用,对提取信息的量和速度要求较高,而计算机视觉则在算法上更加深入,追求图像的理解,而对处理信息的量和速度要求较低。机器视觉的理论及算法基础主要还是来源于计算机视觉,其发展过程是与计算机视觉分不开的,而且随着人类生产对机器视觉的要求不断增强,机器视觉要处理的问题也会越来越复杂,并应用更多计算机视觉方面的理论。下面主要讲述计算机视觉算法的发展历程,而相关的硬件部分在1.2节已有描述,此处不再展开。
计算机视觉的研究从20世纪60年代初开始,其核心思想就是解构视觉信息。当时的人们试图从图像中解析出图形的边缘,通过边缘决定结构的思想来识别现实世界中的物体,并重建这些形状。图1-15是这一类算法的大体思路。
图1-15 通过边缘识别形状
美国麻省理工学院的David Marr所著的Vision一书中认为视觉处理应从简单的形状和边缘开始,同时视觉是分层的。这一论调奠定了现代计算机视觉的两个基础。他认为视觉分成三个阶段,首先从二维的图像开始,将输入图像拆分成一些简单基元(如斑点、端点、有效线段等)的排列组合,将原始二维图像中的重要信息更加清楚地表示出来。第二个阶段即中期视觉,2.5维图则是将基元以不同的方式组合起来所获得的图像,是指在以观察者为中心的坐标系中,可见表面的法线方向、大致的深度以及它们的不连续轮廓等。这一阶段中包含了深度的信息,所以信息比二维图像丰富但还不是真正的三维表示。最后一个阶段就是三维模型表征,也称为后期视觉,表示在以物体为中心的坐标系中,用含有体积基元和面积基元的模块划分层次表象,描述形状和形状的空间组织形式,其表征包括容积、大小和形状。
针对20世纪70年代关于如何通过简单的块状识别来表示现实世界对象的问题,斯坦福大学提出了广义圆柱体和图形结构,如图1-16所示,将每个图形都认为是由简单的几何单位组成。
图1-16 广义圆柱体和图形结构
到了20世纪80年代,计算机视觉的思想转变为如何重建或识别由简单的物体结构组成的视觉空间,通过线和边缘进行构建,如图1-17所示。
图1-17 由边缘构建的视觉空间
当时计算机视觉的工作还都停留在简单样本的阶段,或是通常样本量较少,不能输出在现实世界可以利用的信息。到了90年代,计算机视觉领域不再局限于形状,逐渐涉及感知分组的研究领域,即将一张图片中的像素点归类到有意义的区域。即使可能不知道这些像素点组合到一起是什么,但是可以将属于同一个物体的像素点从背景中提取出来,这个过程就叫作图像分割。当时的一种代表性做法是使用图算法对图像进行分割。1999—2000年,机器学习技术,特别是统计学习方法开始加速发展,出现了一些新方法,如支持向量机模型、boosting方法、图模型。2001年,Paul Viola和Michael Jones使用AdaBoost算法进行了实时面部检测,检测结果如图1-18所示。在他们发表论文后的第五年,作为从基础科学研究到实际应用的一个快速转化,富士公司推出了第一个能够实现实时面部检测的数码相机。
图1-18 人脸检测(www.chuimin.cn)
20世纪90年代末到21世纪初,出现了基于特征的目标识别。由David Lowe完成的SIFT特征在众多工作中影响较为深远,其思路是匹配整个目标。图1-19中有很多变化的因素,比如相机的角度、遮挡、视角、光线,以及目标自身的内在变化,都会影响到算法的精度。但是从这项研究中可以得到一些启发,目标的某些关键性特征往往能够在变化中具有表现性和不变性。所以目标识别的首要任务是在目标上确认这些关键的特征,然后把这些特征与相似的目标进行匹配,这种基于特征的匹配比匹配整个目标要容易得多。
图1-19 David Lowe,1999图像识别
在这段时间内,计算机视觉的另一进展是识别整幅图的场景,其中的代表性算法是空间金字塔匹配。其背后的思想是,图片中有各种特征,这些特征可以反映图片中的是哪种场景,这个算法从图片的各个部分各像素抽取特征,并将它们放在一起作为一个特征描述符,然后一般在特征描述符的基础上进行支持向量机等操作。如图1-20所示,将图像分为不同层次的块,分别统计它们的直方图,将每个层次的直方图串联起来并赋予权重,输入支持向量机中进行训练和预测。
图1-20 空间金字塔匹配
20世纪90年代,就出现了卷积神经网络。1998年,Yann Le Cun在Bell实验室使用卷积神经网络进行了数字识别,将像素图像中的数字或字母进行分类。输入像素图像,经过很多层卷积和下采样以及全连接层,最后经过分类,就可以输出图像的分类结果。在结合机器学习的图像识别方面,常进行的流程是,首先计算一些特征,然后计算局部不变性,经过一些池化,再经过多层处理,最后将结果描述符传递给线性SVM。这些人眼观测到的信息依然可以在卷积神经网络上使用。
由于互联网和数码相机的发展,图片质量得到了提升,因此也促进了计算机视觉技术研究的发展。在21世纪早期,计算机视觉研究领域真正开始拥有标注的数据集,能供人们衡量在目标识别方面取得的成果。其中,Pascal Visual Object Challenge是最有影响力的标注数据集之一,这个数据集由20个类别组成,数据集中的每个种类都有成千上万张图片。
然而,大部分机器学习算法,无论是图模型、支持向量机还是AdaBoost,都可能在训练过程中过拟合,部分原因是可视化的数据非常复杂。也正是因为它们太复杂,使得模型维数往往比较高。如果输入的是高维模型,则还有很多参数要调优,当训练数据量不够时,很快就会产生过拟合现象,这样就得不到好的泛化效果。因此,为了识别自然界中的万物,同时回归机器学习,克服机器学习的瓶颈,即过拟合问题,建立了Image Net。ImageNet项目是一个大型视觉数据库,它汇集所有能找到的图片,组建了一个尽可能大的数据集。该项目共耗时三年,从网上下载上亿张图片,使用Word Net字典排序。这个字典里有上万个物体类别,使用众包工程以及亚马逊土耳其机器人平台来排序、清洗数据,给每张图片打上标签,最终的结果是ImageNet把将近1 500万张图片分成22 000类物体或场景。这是一个巨大的AI数据集,将目标检测算法的发展推向了一个新高度。如何推动这个算法测试的进展尤为重要,从2009年开始ImageNet团队每年组织一场国际比赛,参赛者通过对这个数据集的分类识别来测试计算机视觉算法,如果一个算法能够输出概率最大的5个类别并且其中有正确的结果就视为识别成功。
图1-21列举了2010—2017年在基准数据集上检测图像中20种目标的最优算法的检测错误率。
图1-21 2010—2017年的20种目标的检测结果
从图中可以看出错误率在稳步下降,到2012年,错误率已经低到和人类一样。这个人类识别结果是一位斯坦福大学的学生花费了几周时间进行肉眼人工识别得到的。在挑战赛的前两年,误差率都是在25%左右徘徊,但是2012年,错误率下降了近10个百分点。因为那一年Jeff Hinton小组提出了Alex Net卷积神经网络,成为当年的获奖算法。此后,Image Net比赛的冠军被神经网络所包揽,且网络逐渐变得越来越深,从7或8层网络的Alex Net到19层网络的GoogleNet和VGGnet,再到152层的残差网络。通过微调这些网络以及加深卷积神经网络的层次,使得识别的准确性逐步提高。近年来,这种方法展示出了它强大的模型容量和能力,在计算机视觉领域和其他领域(如自然语言处理和语音识别领域)都取得了巨大进步。
有关工业机器视觉:基于灵闪平台的开发及应用的文章
机器视觉的众多优点中,较为突出的有以下几个方面。如图1-1所示,一套典型的机器视觉系统工作过程如下:图1-1典型的机器视觉系统工作过程①工件定位传感器探测到物体运动至接近相机视野的中心时,向图像采集卡发送触发脉冲。所以,在机器视觉系统的开发和设计中需要投入大量的精力。......
2023-11-18
图像采集设备包括摄像装置、图像采集卡和光源等。图1-7镜头摄像装置与电脑的连接一般通过专用图像采集卡、网口、VGA连接线、IEEE1394接口或USB接口来进行,如图1-8所示。台式计算机在使用IEEE1394接口的数码图像装置进行图像输入时,如果主板上缺少IEEE1394接口,则需要另配一枚IEEE1394图像采集卡。不同于USB接口,IEEE1394接口的图像采集帧率比较稳定,一般不受计算机配置影响,而USB接口的图像采集帧率受计算机性能影响较大。......
2023-11-18
机器视觉,即采用机器代替人眼来做测量和判断。机器视觉技术比较复杂,最大的困难在于人的视觉机制尚不清楚。可以预计的是,随着机器视觉技术自身的成熟和发展,它将在现代和未来制造企业中得到越来越广泛的应用。本章在介绍机器视觉系统组成、相关算法的基础上,重点介绍了机器视觉在人脸识别以及工业领域的应用。......
2023-06-28
如今,机器视觉系统已经能够在各种不同环境下工作,成为很多“机器”的重要组成部分。简单来说,机器视觉就是用机器代替人眼来做各种测量和判断。在生产线上,人工的测量和判断会产生疲劳和错误,而个体之间的差异等也会导致误差,但机器却不知疲倦,一直稳定地运行,能得到精确且具有重复性的结果。......
2023-11-18
图2-14任意输出算法结果丰富的字符串格式用户可以根据需求设置参数分隔符、列表分隔符以及参数内部的分隔符,告诉第三方软件或者下位机输出结果的排列规则及顺序,可以直接从众多数据中获取所需的结果。分隔符及算法结果如图2-15和图2-16所示,客户收到的数据如图2-17所示。图2-19适配器执行条件配置实践思考请简述灵闪软件平台的特点。......
2023-11-18
机器视觉技术的引进,减少了传统的人工检测的劳动强度,极大地提高了产品的生产率和产品的质量。机器视觉在工业方面应用是十分常见的。■任务总结通过学习机器视觉系统的相关基础知识,使学生了解机器视觉系统,熟悉机器视觉系统在工业中的应用与功能,拓宽专业知识面。......
2023-06-15
若引入机器视觉取代传统的人工检测方法,能极大地提高生产效率和产品的良品率。同时,机器视觉技术还能在检测超标准烟尘及污水排放等方面发挥作用。利用机器视觉,能够及时发现机房及生产车间的火灾、烟雾等异常情况。此外,许多场合使用其他方法难以完成检测任务,机器视觉系统则可出色胜任。......
2023-06-23
工业机器人主要被应用在以下3种场合:环境恶劣或有危险的场合。某些场合因为空间狭小、环境真空等原因,只能采用工业机器人进行作业,如卫星的回收、地底环境监测等。由此可见,在智能制造体系中,工业机器人是支撑整个系统有序运作必不可少的关键硬件。工业机器人作为智能装备智能化的代表,是智能制造的基石,也是智能制造的重点方向。......
2023-06-23
相关推荐