首页 理论教育基于原型匹配的反馈技术方案

基于原型匹配的反馈技术方案

【摘要】:而基于内容的图像检索需要对一类物体进行匹配,比如检索有汽车、飞机、坦克、人群、楼房的图像,这种情况下就需要对具体的局部特征进行组合优化,从而得到对某类物体的理想化表征——原型。原型匹配理论是这样描述知觉加工的:当一种视觉系统收到一个新刺激,该系统就会将它与原先存储的原型进行比较,但并不要求完全相匹配,事实上大致的匹配就可以了[13]。为了实现从模板匹配到原型匹配的转变,我们引入了相关反馈技术。

正如上一小节所述,基于模板匹配的检索方法虽然有很大的潜力和研究空间,但其不足之处也是显而易见的。那就是提取的局部特征描述得过于具体,在检索包含同一个体的图像中效果非常好,却不适于匹配包含某一类物体的图像。比如,从一幅行人图像中得到了一些局部特征,分别描述此人的头、颈、腰、腿,这些特征比较适用于匹配关于该人的其他图像,如果是另外一个人的图像,这些特征就不容易匹配上了,更何况图像库中形体不同、姿态各异的人了。而基于内容的图像检索需要对一类物体进行匹配,比如检索有汽车、飞机、坦克、人群、楼房的图像,这种情况下就需要对具体的局部特征进行组合优化,从而得到对某类物体的理想化表征——原型。

原型匹配理论是这样描述知觉加工的:当一种视觉系统收到一个新刺激,该系统就会将它与原先存储的原型进行比较,但并不要求完全相匹配,事实上大致的匹配就可以了[13]。原型匹配模型允许输入信息与原型之间存在差异,这就赋予了该模型比模板模型更多的灵活性。如图5-10所示,我们可以从各式各样的关于人的图像中提取到许多描述人体各个部位的局部特征,然后对这些局部特征集合进行聚类分析,得到这些局部特征的原型特征。

978-7-111-38182-2-Chapter05-17.jpg

图5-10 局部特征的原型获取示意图(来源:Leibe,2008年)

关于聚类分析的算法,本书在第3章3.5.1节进行了介绍,由于图像检索所用到的图像示例比较少,提取的局部特征总数也不是很多。所以划分方法中的k-平均值(k-means)、k-中心点(k-medoids)和层次方法中的凝聚聚类效果上的差距并不十分明显。

为了实现从模板匹配到原型匹配的转变,我们引入了相关反馈技术。相关反馈技术基于人机交互的思想,以猜测用户需求为目的,并且根据用户的需求动态调整系统检索时所采用的特征向量或参与检索的不同特征的权重系数,从而尽量减小底层特征和高层语义之间的差距,改善算法的检索效果。

在本书中,通过模板匹配的初次检索后,由用户根据自身的信息需求挑选出相关程度较大的检索结果,系统根据用户的反馈进行学习,对这些挑选出的图像以及查询图的局部特征通过上述算法进行组合优化,把得到的“原型”存储起来,此后的处理过程就和基于模板匹配的检索方法类似。