一个典型的图像目标识别系统如图1-1所示,主要由图像增强与变换、图像分割、图像描述、分类决策四部分构成。其鲜明的特点是输入和输出的都是图像。高层处理一般是基于知识进行推理和证实的,涉及图像或图像区域的理解,以及执行与视觉相关的识别函数[8]。图1-1 图像目标识别系统的基本框架图图像目标识别技术是延伸和扩展人的视觉功能的方式和方法,其实信息技术整体都可以认为是扩展人的信息器官功能的技术。......
2023-06-28
近年来,许多重要的国际期刊(IEEE Transactions on Pattern Analysis and Machine Intelligence、IEEE Transactions on Image Processing、IEEE Transactions on Medical Imaging、IEEE Transactions on Vehicular Technology、International Journal of Computer Vision、Computer Vision and Image Understanding、Image and Vision Com-puting、Pattern Recognition、Pattern Recognition Letters、Machine Vision and Applica-tion等)以及重要的国内期刊(计算机学报、软件学报、自动化学报、机器人、模式识别与人工智能、计算机研究与发展等)都发表了大量关于图像模式识别方面的论文。在国外召开的顶级国际会议,如IEEE国际计算机视觉与模式识别(Computer Vision and Pattern Recognition,CVPR)会议、欧洲计算机视觉会议(European Conference on Computer Vision,ECCV)、国际信息处理会议(Interna-tional Conference on Information Processing,ICIP)等,也收录了许多知名学者在相关领域的学术成果。这几年,国内学术界积极开展了一系列的学术交流活动,比如2005年在北京举办的国际计算机可视化会议(International Conference on Computer Vision,ICCV)、2006年在香港特别行政区举办的第18届模式识别会议(International Conference on Pattern Recognition,ICPR)、2008年全国模式识别学术会议、2009年在西安举办的第9届亚洲计算机可视化会议(Asian Confer-ence on Computer Vision,ACCV)等。
图像目标的表示与识别之所以备受关注,是由于它能够广泛应用于国防和民用的许多领域,其中包括安全监控、军事侦察、产品检验、人机交互和医学应用等多个方面。
1.安全监控
图像目标识别在安全领域的应用范围非常广泛,大城市很多地方,如民宅、停车场、银行等,都装有闭路电视监控系统(Close Circuit TV),以便能够对可疑的物品和人员进行有效的监控。而随着各种新的DNA分析、分型技术方法的建立,借助多模态的生物特征辨识系统,法医DNA分析技术可将从犯罪现场提取的DNA轮廓(手掌的纹理、指纹、脸的几何形状)与疑犯的DNA信息进行更准确、快速、自动的匹配。2004年,根据市场研究公司——国际生物测定组织的分析,在人们首选的在线银行认证方法中,选择生物特征辨识的占了50%,是智能卡、密码、身份证号码等方式的总和。
在交通系统中除了视频摄像外,还需要大量的识别监视跟踪系统。例如,目前的车牌识别技术已经非常成熟,这对道路上异常车辆的监控和交通事故的事后处理都具有非常重要的意义。西门子公司的交通监控性能非常优越,不仅能探测隧道中慢行或停止的汽车,还可探测处于U形转弯处的违规汽车,以及自动检测可疑的行李。智能车辆的最终目的是实现车辆的自动驾驶,目前主要是利用车上安装的摄像机、雷达等传感器设备进行道路检测并识别前方的障碍物(如车辆、行人),以保证车辆的安全行驶。
2.军事侦察
相对而言,军事领域的识别与监测要求就非常苛刻了,主要是因为战场环境要比一般的民用环境更为复杂。例如,检测有遮挡和伪装的机动目标就十分困难,由于假设的局限性,在民用上已经比较成熟的算法在军事上往往效果很不理想。美国洛克希德·马丁公司开发的数字式侦察图像处理系统已安装到尼米兹级航空母舰上,成为美国海军联合部队图像处理系统(JSIPS-N)的战术组成部分,它能接受和处理来自多个传感器平台(U-2、“全球鹰”无人机、F/A-18共享侦查吊舱等)的图像,极大增强了美国海军识别和打击关键目标的能力。2006年6月以色列IAI公司在巴黎展示了其一元化的战争指挥室,其中实时图像情报中心(EL/S-8894RT-RiCENT)具有对战场全天候一体化的监视和侦察能力。
3.产品检验
由于工业环境的结构、照明等因素可以得到严格的控制,图像目标识别在工业生产和装配中得到了成功的应用。一个具有简单视觉感知功能的自动化生产线包含一个摄像机和相关的信息处理系统,通过摄像机对零件进行识别和定位,为机器人提供是否操作或进行何种操作的信息,并引导机器人手臂实时准确地夹取零件;此外,图像识别技术已经应用在集成电路设计、图形设计和电视电影制作中;通过多源图像融合,可以进行产品外形检验、表面缺陷检验,加强对产品质量的严格把关。
对多个摄像机的图像同步识别处理,利用某一时刻关于某个目标的不同角度的图像可以恢复场景的三维信息,并依据三维信息做出决断,实现即时规划、自主导航、与周围环境实时交互作用等。这是生产控制的进一步发展,让机器人不仅仅停留在简单的自动化生产线上,而且能够代替人类进入危险的环境进行生产活动,例如,在核辐射区或火灾现场抢修设备,远程控制的无人开采矿藏、星际探测设备的自主导航等。
4.人机交互
对包含文字和符号的图像进行识别可以让人与计算机的交互更加便捷。目前这方面的技术大量应用于信函分拣、稿件输入、支票查对、期刊阅读和自动排版中,而超市的条码阅读器更是对销售管理的一场革命。现在美国和日本的客户已经能够通过把他们的手机指向汉堡包的包装纸,获得其营养信息并显示在屏幕上,也可以通过这种方式获得商品报价。例如,在日本东京的一座建筑物上粘贴的超高速识读条码(Quick Response Code,QRcode)就含有很多信息,通过带有摄像头的可正确编译的手机就能方便地读取。
面部表情传达了一种非口头性的暗示,对其进行自动识别是人机接口的重要元素,也被用于行为科学和临床实践中。比如,具有微笑探测和眨眼探测的两个功能独立的数字照相机可以在恰当的时机(用户微笑的时候或眨眼之后)捕捉到主体,并提示用户,进行抓拍。手势识别也称手语识别,是机器视觉领域中比较前沿的研究领域。当用户做出一个手势,摄像机(一般为双目或三目)将图像传送到计算机,然后由特定软件结合视差来提取手臂、手指等三维特征,完成这些特征的进一步识别,最后对这个手势做出响应[2]。
5.医学应用
如今,计算机图像分析逐步融入到了医疗诊断的过程中,这就促生了计算机辅助诊断(Computer-Assisted Diagnosis,CAD)技术。利用该技术,可进行核磁共振成像(主要用于医疗成像来可视化人体结构和功能,提供任何平面内身体的细节图像),癌细胞、白细胞、染色体检查,修复手术控制设计等。
通过一组切片图像进行人体器官的三维重构,可以为医疗诊断和病理分析提供重要和直观的帮助。同样,可以根据图像序列中的信息对普通目标进行三维重构,无论观察点在何处,都能利用其三维信息进行识别,这也为解决视点变化下的目标识别提供了一个思路。
除了以上几个方面,图像目标识别在生产生活中还有很多应用。对目标描述信息的分析处理,可以用在天气预报、森林火灾及地质灾害监测、空气污染预报等领域。人脸检测(Facial Detection)技术可以将画面及时地锁定在讲话人身上,这样就很大程度地降低了远程电视会议的图像传输比率[3]。在虚拟现实、计算机动画、视频评注等应用领域,目标识别技术同样也发挥着不可替代的作用。所以,开展图像目标识别研究意义重大,其研究成果具有非常广阔的应用前景。
有关图像目标的表示与识别的文章
一个典型的图像目标识别系统如图1-1所示,主要由图像增强与变换、图像分割、图像描述、分类决策四部分构成。其鲜明的特点是输入和输出的都是图像。高层处理一般是基于知识进行推理和证实的,涉及图像或图像区域的理解,以及执行与视觉相关的识别函数[8]。图1-1 图像目标识别系统的基本框架图图像目标识别技术是延伸和扩展人的视觉功能的方式和方法,其实信息技术整体都可以认为是扩展人的信息器官功能的技术。......
2023-06-28
对于图像目标识别问题的研究,也是遵循着人的认知形式,总体上讲有两种思路,一种是自下而上的加工,另一种是自上而下的加工[13]。自下而上的视觉计算理论中,马尔模型[14]显然最具代表性,它在技术性和数学形式方面堪称精彩。马尔认为,视知觉是通过构建三种不同心理表征或素描进行的。......
2023-06-28
对整体特征进行有效的理解和研究,必须要明确目标分割的定义以及它与图像分割之间的关系。通常它包含较广的含义,进一步可以细分为面向图像特征的图像分割和面向物理、语义特征的目标分割。令I表示一幅n×m的待分割图像,则图像分割的定义可形式化的表示为将I划分为满足下述条件的N个子区域Ii,(i=1,2,…,N且i≠j,S 是对Ii中所有元素属性相似性描述的逻辑谓词。图2-3所示为图像分割与目标分割的例子。......
2023-06-28
基于边缘的分割方法边缘检测是在灰度图像分割中广泛应用的一种技术,它基于在区域边缘处梯度变化剧烈的假设,试图通过检测区域间的边缘来达到图像分割的目的。则分割时,选取的阈值应位于直方图波谷处。......
2023-06-28
早期的图像分割研究主要集中于对狭义图像分割的研究,且并未区分狭义图像分割与目标分割的概念,界定比较模糊。3)图像仅是现实世界的表象。只有随着各学科的综合发展,目标分割才会不断有新的突破。总之,尽管长期以来人们为研究目标分割问题做出了很大努力,但上述原因导致很难实现一种普适的方法,而只能针对特定问题和具体的需求给出合理的解决方法,在处理速度、精度等关键性指标上做出均衡或侧重。......
2023-06-28
针对图像领域中的各种具体问题,目标识别所采用的研究方法和技术方案都有所区别,甚至迥然不同。所以需要将目标识别问题按照一定的标准进行分类,对具体问题进行具体分析。图像分割在静态图像识别领域也尚未得到有效解决,图像对应问题则是与模式识别和人工智能紧密相连的难题。......
2023-06-28
卷积神经网络的这种局部连接、权值共享结构使其布局更接近于实际生物神经网络。②卷积神经网络引入多种形式的池化操作,可对特征提取过程产生的局部相似视觉特征、局部结构的尺度差异,甚至对局部几何畸变起到抑制作用,较好地保持了旋转、尺度和缩放不变性,能得到更加鲁棒的特征描述。更为关键的是,卷积神经网络在每一个神经元节点使用相同的连接权值,可更有效地捕获图像不同部位的同类型视觉特征。......
2023-10-28
本书的组织结构如下:第1章,绪论。介绍了本书的研究目的和意义,并给出了图像目标识别的定义、系统框架和两种研究思路;列举了图像目标识别常用的图像库,探讨了图像目标识别的主要难点和发展趋势;最后,对本书基本内容和结构安排进行简要说明。第7章,基于角点特征与视面模型的目标识别。[4]http://www.pascal-network.org/challenges/VOC/voc2005/index.htm。[5]http://www.pascal-network.org/challenges/VOC/voc2006/index.htm。[6]http://www.pascal-network.org/challenges/VOC/voc2007/index.htm。[7]http://www.pascal-network.org/challenges/VOC/voc2008/index.htm。......
2023-06-28
相关推荐