首页 理论教育结构判别:利用语言学方法解决识别问题

结构判别:利用语言学方法解决识别问题

【摘要】:结构性方法,也称语言学方法。例如,指纹识别基于称为细节的指纹特征的相互关系。这类识别问题通常用结构性方法会得到很好的解决,因为它们的特征不仅与数量有关,而且各个特征间的空间关系也决定着它们的类别归属。图3-1 一幅图像的多级树形结构描述a)乡村风景图像 b)树形描述结构从上述两类方法看来,第1种方法没有利用图像本身的结构关系,第2种方法没有考虑图像目标受到的噪声干扰。

结构性方法,也称语言学方法。它是立足于分析图像结构,把一幅图像看成语言构造。例如一个英文句子,是词和短语组成的并按一定的语法表达出来,其中最基本元素是单词。与此类似,图像是由一些直线、斜线、点、弯曲线及环等组成。剖析这些基本元素,看它们是以什么规则构成图像,这就是结构分析的课题。这些基本元素相当于句子中的单词,那些直线、曲线的组合相当于短语,它们全体如何构成图像就相当于语法规则。此时,图像识别就相当于检查图像所代表的某一类句型是否符合事先规定的语法,如果语法正确就识别出结果。

在某些应用中,模式的特性很适于用结构关系进行描述。例如,指纹识别基于称为细节的指纹特征的相互关系。综合指纹的相对大小和位置,这些特征是描述指纹纹路属性的主要分量,如指纹的端点、分支、合并以及不连续段。这类识别问题通常用结构性方法会得到很好的解决,因为它们的特征不仅与数量有关,而且各个特征间的空间关系也决定着它们的类别归属。

串的描述适于生成目标模式和其他实体模式,它们的结构是基于原始元素的较为简单的连接,通常和边界形状有关系。对许多应用来说,更有效的一种方法是树形描述结构,也就是一种主要的分层有序的结构。如图3-1所示,一张关于乡村风景的照片,树的根节点代表整幅图像,下一级节点表示此图由前景和背景构成,前景又由地面和非地面区域构成,再下一层进一步描述地面和非地面区域……可以一直继续这样的细分,直到到达在图像解析不同区域的能力极限。

978-7-111-38182-2-Chapter03-2.jpg

图3-1 一幅图像的多级树形结构描述

a)乡村风景图像 b)树形描述结构

从上述两类方法看来,第1种方法(决策理论)没有利用图像本身的结构关系,第2种方法(结构判别)没有考虑图像目标受到的噪声干扰。如果两者结合起来考虑可能会有新的识别方法,目前这方面的研究还不多。由于本书后续章节中的技术方法主要是针对复杂背景下的图像目标表示与识别,所以本章对结构性方法不做详细介绍,如果有读者比较感兴趣的话,可以查阅参考文献[8,54,67,104]中的相关内容。

其实,模式识别也可以分为模式匹配和模式分类两个方向,与此相应的图像目标识别系统都由两个过程组成,即设计与实现。设计是指用一定数量的样本(叫做训练集或学习集)进行分类器或模型库的设计;实现是指用所设计的分类器或模型库对待识别的样本进行分类决策[54]

目标分类一般需要构造有效的特征向量和充分利用相关领域的知识,而在许多实际应用中,很难得到有关特征概率和类别概率的先验知识,或者得到的数据不足以设计分类器。在这种情况下,可以使用模型直接匹配未知物体,并选择最佳匹配为最终分类结果[105]