首页 理论教育图像目标识别的基本框架

图像目标识别的基本框架

【摘要】:一个典型的图像目标识别系统如图1-1所示,主要由图像增强与变换、图像分割、图像描述、分类决策四部分构成。其鲜明的特点是输入和输出的都是图像。高层处理一般是基于知识进行推理和证实的,涉及图像或图像区域的理解,以及执行与视觉相关的识别函数[8]。图1-1 图像目标识别系统的基本框架图图像目标识别技术是延伸和扩展人的视觉功能的方式和方法,其实信息技术整体都可以认为是扩展人的信息器官功能的技术。

一个典型的图像目标识别系统如图1-1所示,主要由图像增强与变换(图像预处理)、图像分割、图像描述、分类决策四部分构成。这四个部分关系非常密切,在看做一个有机整体的同时,也可以看成三个层次的计算处理——低层、中层和高层处理。

低层是对图像数据进行预处理,如对有噪声的图像要进行滤波去噪,对信息微弱的图像要进行对比度增强,对失真图像要进行几何校正等,以达到改善图像质量、突出兴趣区域的目的。其鲜明的特点是输入和输出的都是图像。

中层处理涉及分割(把图像分为不同区域或目标物),将给定图像或已分割的图像区域用更为简单明确的数值、符号或图来表征(特征描述),以使其更适合计算机处理及对不同目标的分类(识别)[7]。中层处理输入为图像,但输出的是从这些图像中提取的特征。

高层处理一般是基于知识进行推理和证实的,涉及图像或图像区域的理解,以及执行与视觉相关的识别函数[8]。也可以简单地认为是对图像或图像区域进行分类和估计。其输入是向量、串或树等形式的特征描述,输出则是图像或物体的类别。

978-7-111-38182-2-Chapter01-1.jpg

图1-1 图像目标识别系统的基本框架

图像目标识别技术是延伸和扩展人的视觉功能的方式和方法,其实信息技术整体都可以认为是扩展人的信息器官功能的技术。人的信息器官主要包括感觉器官、传导器官、思维器官和效应器官四大类型,其功能主要是信息获取、信息传输、信息处理和信息应用,因此感测技术、通信技术、智能技术与控制技术被认为是信息技术的四基元,其他信息技术通常被看做是这四种基本技术的高阶逻辑综合或分解衍生[9]

如表1-1所示,我们把图像识别看作图像处理模式识别的交叉,而这两门学科分别属于信息处理和计算智能两个大的学科门类,甚至还涉及信息传输的一些内容,从这个意义上,也看出设计和执行算法来模仿人类对物体的视觉识别能力是一项有趣而富有挑战性的任务,因此,这门学科不断吸引了许多来自不同领域的科研人员钻研和探讨,也不断涌现新的理论和方法。

表1-1图像识别在信息学科中的位置

978-7-111-38182-2-Chapter01-2.jpg