图像目标识别的重要性

2023-06-28 理论教育版权反馈

【摘要】：图像目标的表示与识别之所以备受关注，是由于它能够广泛应用于国防和民用的许多领域，其中包括安全监控、军事侦察、产品检验、人机交互和医学应用等多个方面。例如，目前的车牌识别技术已经非常成熟，这对道路上异常车辆的监控和交通事故的事后处理都具有非常重要的意义。

近年来，许多重要的国际期刊（IEEE Transactions on Pattern Analysis and Machine Intelligence、IEEE Transactions on Image Processing、IEEE Transactions on Medical Imaging、IEEE Transactions on Vehicular Technology、International Journal of Computer Vision、Computer Vision and Image Understanding、Image and Vision Com-puting、Pattern Recognition、Pattern Recognition Letters、Machine Vision and Applica-tion等）以及重要的国内期刊（计算机学报、软件学报、自动化学报、机器人、模式识别与人工智能、计算机研究与发展等）都发表了大量关于图像模式识别方面的论文。在国外召开的顶级国际会议，如IEEE国际计算机视觉与模式识别（Computer Vision and Pattern Recognition，CVPR）会议、欧洲计算机视觉会议（European Conference on Computer Vision，ECCV）、国际信息处理会议（Interna-tional Conference on Information Processing，ICIP）等，也收录了许多知名学者在相关领域的学术成果。这几年，国内学术界积极开展了一系列的学术交流活动，比如2005年在北京举办的国际计算机可视化会议（International Conference on Computer Vision，ICCV）、2006年在香港特别行政区举办的第18届模式识别会议（International Conference on Pattern Recognition，ICPR）、2008年全国模式识别学术会议、2009年在西安举办的第9届亚洲计算机可视化会议（Asian Confer-ence on Computer Vision，ACCV）等。

图像目标的表示与识别之所以备受关注，是由于它能够广泛应用于国防和民用的许多领域，其中包括安全监控、军事侦察、产品检验、人机交互和医学应用等多个方面。

1.安全监控

图像目标识别在安全领域的应用范围非常广泛，大城市很多地方，如民宅、停车场、银行等，都装有闭路电视监控系统（Close Circuit TV），以便能够对可疑的物品和人员进行有效的监控。而随着各种新的DNA分析、分型技术方法的建立，借助多模态的生物特征辨识系统，法医DNA分析技术可将从犯罪现场提取的DNA轮廓（手掌的纹理、指纹、脸的几何形状）与疑犯的DNA信息进行更准确、快速、自动的匹配。2004年，根据市场研究公司——国际生物测定组织的分析，在人们首选的在线银行认证方法中，选择生物特征辨识的占了50％，是智能卡、密码、身份证号码等方式的总和。

在交通系统中除了视频摄像外，还需要大量的识别监视跟踪系统。例如，目前的车牌识别技术已经非常成熟，这对道路上异常车辆的监控和交通事故的事后处理都具有非常重要的意义。西门子公司的交通监控性能非常优越，不仅能探测隧道中慢行或停止的汽车，还可探测处于U形转弯处的违规汽车，以及自动检测可疑的行李。智能车辆的最终目的是实现车辆的自动驾驶，目前主要是利用车上安装的摄像机、雷达等传感器设备进行道路检测并识别前方的障碍物（如车辆、行人），以保证车辆的安全行驶。

2.军事侦察

相对而言，军事领域的识别与监测要求就非常苛刻了，主要是因为战场环境要比一般的民用环境更为复杂。例如，检测有遮挡和伪装的机动目标就十分困难，由于假设的局限性，在民用上已经比较成熟的算法在军事上往往效果很不理想。美国洛克希德·马丁公司开发的数字式侦察图像处理系统已安装到尼米兹级航空母舰上，成为美国海军联合部队图像处理系统（JSIPS-N）的战术组成部分，它能接受和处理来自多个传感器平台（U-2、“全球鹰”无人机、F／A-18共享侦查吊舱等）的图像，极大增强了美国海军识别和打击关键目标的能力。2006年6月以色列IAI公司在巴黎展示了其一元化的战争指挥室，其中实时图像情报中心（EL／S-8894RT-RiCENT）具有对战场全天候一体化的监视和侦察能力。

3.产品检验

由于工业环境的结构、照明等因素可以得到严格的控制，图像目标识别在工业生产和装配中得到了成功的应用。一个具有简单视觉感知功能的自动化生产线包含一个摄像机和相关的信息处理系统，通过摄像机对零件进行识别和定位，为机器人提供是否操作或进行何种操作的信息，并引导机器人手臂实时准确地夹取零件；此外，图像识别技术已经应用在集成电路设计、图形设计和电视电影制作中；通过多源图像融合，可以进行产品外形检验、表面缺陷检验，加强对产品质量的严格把关。

对多个摄像机的图像同步识别处理，利用某一时刻关于某个目标的不同角度的图像可以恢复场景的三维信息，并依据三维信息做出决断，实现即时规划、自主导航、与周围环境实时交互作用等。这是生产控制的进一步发展，让机器人不仅仅停留在简单的自动化生产线上，而且能够代替人类进入危险的环境进行生产活动，例如，在核辐射区或火灾现场抢修设备，远程控制的无人开采矿藏、星际探测设备的自主导航等。

4.人机交互

对包含文字和符号的图像进行识别可以让人与计算机的交互更加便捷。目前这方面的技术大量应用于信函分拣、稿件输入、支票查对、期刊阅读和自动排版中，而超市的条码阅读器更是对销售管理的一场革命。现在美国和日本的客户已经能够通过把他们的手机指向汉堡包的包装纸，获得其营养信息并显示在屏幕上，也可以通过这种方式获得商品报价。例如，在日本东京的一座建筑物上粘贴的超高速识读条码（Quick Response Code，QRcode）就含有很多信息，通过带有摄像头的可正确编译的手机就能方便地读取。

面部表情传达了一种非口头性的暗示，对其进行自动识别是人机接口的重要元素，也被用于行为科学和临床实践中。比如，具有微笑探测和眨眼探测的两个功能独立的数字照相机可以在恰当的时机（用户微笑的时候或眨眼之后）捕捉到主体，并提示用户，进行抓拍。手势识别也称手语识别，是机器视觉领域中比较前沿的研究领域。当用户做出一个手势，摄像机（一般为双目或三目）将图像传送到计算机，然后由特定软件结合视差来提取手臂、手指等三维特征，完成这些特征的进一步识别，最后对这个手势做出响应^［2］。

5.医学应用

如今，计算机图像分析逐步融入到了医疗诊断的过程中，这就促生了计算机辅助诊断（Computer-Assisted Diagnosis，CAD）技术。利用该技术，可进行核磁共振成像（主要用于医疗成像来可视化人体结构和功能，提供任何平面内身体的细节图像），癌细胞、白细胞、染色体检查，修复手术控制设计等。

通过一组切片图像进行人体器官的三维重构，可以为医疗诊断和病理分析提供重要和直观的帮助。同样，可以根据图像序列中的信息对普通目标进行三维重构，无论观察点在何处，都能利用其三维信息进行识别，这也为解决视点变化下的目标识别提供了一个思路。

除了以上几个方面，图像目标识别在生产生活中还有很多应用。对目标描述信息的分析处理，可以用在天气预报、森林火灾及地质灾害监测、空气污染预报等领域。人脸检测（Facial Detection）技术可以将画面及时地锁定在讲话人身上，这样就很大程度地降低了远程电视会议的图像传输比率^［3］。在虚拟现实、计算机动画、视频评注等应用领域，目标识别技术同样也发挥着不可替代的作用。所以，开展图像目标识别研究意义重大，其研究成果具有非常广阔的应用前景。

图像目标识别的重要性

相关推荐