图像目标的表示与识别之所以备受关注,是由于它能够广泛应用于国防和民用的许多领域,其中包括安全监控、军事侦察、产品检验、人机交互和医学应用等多个方面。例如,目前的车牌识别技术已经非常成熟,这对道路上异常车辆的监控和交通事故的事后处理都具有非常重要的意义。......
2023-06-28
人类认知过程可以用图1-2描述[10]。不同视觉基本特征,如方位、方向、空间频率、眼优势、空间拓扑和颜色等在不同层次视觉皮层具有一定的空间组织形式,多种基本特征功能柱共存于一片皮层空间,实现多种特征表达的最优化;特异性反应细胞在高级与初级视觉皮层上进行自下而上的前馈和自上而下的反馈,完成视觉表征自下而上地逐级抽象,以及在整合后自上而下地反馈、对初级水平的调控;大脑自动建立基于皮层自组织的计算视觉模型[11,12]。
对于图像目标识别问题的研究,也是遵循着人的认知形式,总体上讲有两种思路,一种是自下而上的加工(Bottom-up Process),另一种是自上而下的加工(Top-down Process)[13]。这两类处理方法有着各自的优点和缺点,将它们结合起来各取所长,就有可能实现更为理想的识别。
1.自下而上的加工
也被称为数据驱动(Data-driven)的加工,其核心观点是系统工作是单向的,从信息输入开始,一直到形成最终的解释。无论在特定的时刻发生什么都不受后面加工过程的影响,这种加工系统无法回到先前的阶段去调整[13]。反映在图1-1上,就是严格按照先后顺序,从低层开始处理图像上的数据,到中层处理将这些数据转化为抽象表征,到高层进行识别,其间各个模块互不相关。
自下而上的视觉计算理论中,马尔模型[14]显然最具代表性,它在技术性和数学形式方面堪称精彩。马尔认为,视知觉是通过构建三种不同心理表征或素描进行的。首先是原始素描,它以二维图像的方式描述相对明暗的区域和已经固定位置的几何结构,使得观察者能够分辨不同区域的边界,但无法“得知”这些视觉信息的“涵义”;然后建立一个更为复杂的表征,即2.5D素描,观察者利用阴影、纹理和边界等线索,获得关于该素描表面的信息,以及此刻它们在景深上与观察者的相对位置关系;马尔认为原始素描和2.5D素描所依据的都是数据驱动,只有在观察者最后构建视觉场景的三维素描时,有关现实世界或特定期望的信息(知识)才会被纳入进来。
这类方法的优点是便于工程实现,对单目标识别及复杂图像分析系统均适用,具有较强的代换性,现有许多系统在解决图像识别方面的问题时都遵循这一思路;缺点是在分割、标记、特征提取等处理过程中缺乏知识指导,盲目性大,因此在很大程度上局限了该方法的应用范围。
图1-2 人类的认知过程
2.自上而下的加工
又称之为理论驱动(Theory-driven)或概念驱动(Conceptually Driven)的加工,知识理论或概念假设引导系统在识别过程中的信息选择和整合。其基本思想是利用先验知识为待识别问题建立模型,然后利用图像数据对模型的正确性进行验证,此类方法有坚实的数学理论基础,有许多数学工具可以使用,因此一直是理论界研究模式识别问题的主流方法。
先验知识可以通过专家总结、人为定义来得到,有了待识别目标的模型特点,就可以在图像中进行有针对性的检测和识别了。这种方法一般用于线状目标和形状规则的刚性目标的识别[1,15-17],如机场、道路、门窗等。但是人的很多先验知识很难用数学形式来表达,所以近年来随着机器学习技术被大量应用于机器视觉领域,用统计学习的方法获取隐含的知识模型已经成为了研究热点[18-22]。
自上而下的加工方法,其优点在于底层处理是在知识指导下的粗匹配过程,可避免抽取过多不必要的特征集,提高算法的效率,其精匹配过程也因而变得简单和有针对性。它的缺点是代换性和兼容性差,识别目标改变,知识和假设要随之而变。
有关图像目标的表示与识别的文章
图像目标的表示与识别之所以备受关注,是由于它能够广泛应用于国防和民用的许多领域,其中包括安全监控、军事侦察、产品检验、人机交互和医学应用等多个方面。例如,目前的车牌识别技术已经非常成熟,这对道路上异常车辆的监控和交通事故的事后处理都具有非常重要的意义。......
2023-06-28
一个典型的图像目标识别系统如图1-1所示,主要由图像增强与变换、图像分割、图像描述、分类决策四部分构成。其鲜明的特点是输入和输出的都是图像。高层处理一般是基于知识进行推理和证实的,涉及图像或图像区域的理解,以及执行与视觉相关的识别函数[8]。图1-1 图像目标识别系统的基本框架图图像目标识别技术是延伸和扩展人的视觉功能的方式和方法,其实信息技术整体都可以认为是扩展人的信息器官功能的技术。......
2023-06-28
对整体特征进行有效的理解和研究,必须要明确目标分割的定义以及它与图像分割之间的关系。通常它包含较广的含义,进一步可以细分为面向图像特征的图像分割和面向物理、语义特征的目标分割。令I表示一幅n×m的待分割图像,则图像分割的定义可形式化的表示为将I划分为满足下述条件的N个子区域Ii,(i=1,2,…,N且i≠j,S 是对Ii中所有元素属性相似性描述的逻辑谓词。图2-3所示为图像分割与目标分割的例子。......
2023-06-28
基于边缘的分割方法边缘检测是在灰度图像分割中广泛应用的一种技术,它基于在区域边缘处梯度变化剧烈的假设,试图通过检测区域间的边缘来达到图像分割的目的。则分割时,选取的阈值应位于直方图波谷处。......
2023-06-28
早期的图像分割研究主要集中于对狭义图像分割的研究,且并未区分狭义图像分割与目标分割的概念,界定比较模糊。3)图像仅是现实世界的表象。只有随着各学科的综合发展,目标分割才会不断有新的突破。总之,尽管长期以来人们为研究目标分割问题做出了很大努力,但上述原因导致很难实现一种普适的方法,而只能针对特定问题和具体的需求给出合理的解决方法,在处理速度、精度等关键性指标上做出均衡或侧重。......
2023-06-28
针对图像领域中的各种具体问题,目标识别所采用的研究方法和技术方案都有所区别,甚至迥然不同。所以需要将目标识别问题按照一定的标准进行分类,对具体问题进行具体分析。图像分割在静态图像识别领域也尚未得到有效解决,图像对应问题则是与模式识别和人工智能紧密相连的难题。......
2023-06-28
目标分类也可以称为模式分类,就是在特征空间中用统计方法把被识别对象归为某一类别。模式分类不同于经典的统计“假设检验”技术,后者根据输入数据,判断零假设H0与备择假设H1中哪一个成立。模式分类也不同于严格意义上的“图像处理”。在图像处理中,输入的是一幅图像,输出的也是图像。图像处理的步骤常包括图像旋转、对比度增强和其他能保持所有原始信息的图像变换。......
2023-06-28
卷积神经网络的这种局部连接、权值共享结构使其布局更接近于实际生物神经网络。②卷积神经网络引入多种形式的池化操作,可对特征提取过程产生的局部相似视觉特征、局部结构的尺度差异,甚至对局部几何畸变起到抑制作用,较好地保持了旋转、尺度和缩放不变性,能得到更加鲁棒的特征描述。更为关键的是,卷积神经网络在每一个神经元节点使用相同的连接权值,可更有效地捕获图像不同部位的同类型视觉特征。......
2023-10-28
相关推荐