首页 理论教育图像检索实验和结果分析

图像检索实验和结果分析

【摘要】:考虑到Corel-10K图像数据库有100个样本类别,共有10 000个样本图像,所以图7-8和图7-9的检索结果展示了本节设计的基于粗略颜色信息和灰度纹理特征相融合的图像检索系统具有良好的检索性能。接下来,给出本节设计的图像检索系统的综合性能评价指标,即查准率和查全率。本节提出的图像检索系统在Corel-10K数据库和Corel-5K数据库上的平均查准率和平均查全率分别如表7-4和表7-5所示。最后,对本节提出的图像检索系统的实时性进行分析。

在本节提出的图像检索系统中,有一个参数的值需要通过实验确定,即归一化的颜色特征ECD距离和灰度纹理特征ECD距离进行加权融合时的权值参数α。为了快速地进行仿真实验以便确定权值参数α的值,这里选择在一个较小规模的图像检索数据库,即SIMPLIcity图像数据库[140]上进行仿真实验。SIMPLIcity图像数据库只有10个类别,每个类别有100个样本图像,即一共有1 000个样本图像,它们均来自Corel-10K数据库。在实验中,通过改变权值参数α的值,将SIMPLIcity数据库中的所有样本图像依次作为查询样本,每次查询返回N=12个最相似的样本图像,最后计算所有查询样本的平均查准率,对应的实验结果如图7-7所示。

图7-7 权值参数α对查准率的影响

从图7-7可以看出,当权值参数α=0.6时,颜色特征与灰度纹理特征实现了较好的融合,所提取的样本特征具有最强的鉴别能力,图像检索系统此时获得了最高的查准率。同时可以看到,当α=0或α=1时,由于仅利用了样本图像的灰度纹理特征或颜色特征,此时图像检索系统的性能没有达到最佳的水平。所以,在本节设计的图像检索系统中,选择最佳的权值参数为α=0.6。

为了直观地展示本节设计的图像检索系统的检索效果,从Corel-10K数据库中挑选两个样本图像,即一个公共汽车的样本图像和一个马球(polo)的样本图像,将它们分别作为查询样本,每次查询返回N=12个结果图像,查询的结果如图7-8和图7-9所示。在图7-8和图7-9中,第一行的第1个图像为查询样本,返回的样本根据它们与查询样本的特征距离从小到大排列,越靠前的返回样本与查询样本越相似,检索系统返回的12个样本图像也包括查询样本自身。

图7-8 以公共汽车样本(第一行第1个图像)为查询样本的检索结果

图7-9 以马球样本(第一行第1个图像)为查询样本的检索结果

图7-8是以一个公共汽车(Bus)的样本图像作为查询样本的,从返回的12个结果图像可以看出,它们均为相关样本,即它们都是与查询样本具有相同类别的公共汽车样本,尤其第二行的前两个样本图像、第三行的第3个样本图像,虽然它们在颜色特征上与查询图像(第一行的第1个图像)有很大差别,但由于它们具有相似的纹理特征,因此这些样本图像仍然能够被正确识别。图7-9是以一个马球(Polo)的样本图像作为查询样本的,返回的12个结果图像也均为相关样本,即它们和查询样本(第一行第1个图像)都是具有相同类别的马球图像。考虑到Corel-10K图像数据库有100个样本类别,共有10 000个样本图像,所以图7-8和图7-9的检索结果展示了本节设计的基于粗略颜色信息和灰度纹理特征相融合的图像检索系统具有良好的检索性能。

接下来,给出本节设计的图像检索系统的综合性能评价指标,即查准率和查全率。为了和其他方法进行公平比较,本节方法采用相同的实验设置,即在Corel-10K数据库和Corel-5K数据库上,把所有样本图像依次作为查询样本,每次查询返回N=12个样本图像,用所有查询的平均查准率和平均查全率作为最后的评价指标。另外,在计算查准率和查全率时,Corel-10K数据库和Corel-5K数据库对应的参数Z等于100,即每个类别的全部相关样本个数为100;同时,因为Corel-10K数据库和Corel-5K数据库中大部分图像的分辨率为187×126或192×128,所以在图7-4所示的特征提取方法中对原始图像的采样率设为2,可使采样后图像的长、宽不超过100像素

本节提出的图像检索系统在Corel-10K数据库和Corel-5K数据库上的平均查准率和平均查全率分别如表7-4和表7-5所示。同时,列出了几种先进的彩色图像检索算法的性能指标作为对比,其中MTH算法[141]是利用彩色图像中多个纹理基元的直方图(Multi-texton Histogram, MTH)作为检索特征的,MSD算法[142]是利用彩色图像的微结构描述子(Micro-structure Descriptor, MSD)作为检索特征的,CDH算法[139]是利用彩色图像的颜色差分直方图(Color Difference Histogram, CDH)作为检索特征的。

表7-4 不同图像检索方法在Corel-10K数据库上的平均查准率和平均查全率

表7-5 不同图像检索方法在Corel-5K数据库上的平均查准率和平均查全率

从表7-4和表7-5可以看出,本节提出的基于粗略颜色信息和灰度纹理特征融合的图像检索系统能够获得更好的平均查准率和平均查全率,主要原因如下:①自然界和日常生活中的大部分图像都含有丰富的彩色纹理特征,这些彩色纹理特征在图像检索中能够发挥重要的鉴别作用;②本节采用的粗略颜色信息提取方法、灰度纹理特征提取方法和特征融合策略能够从查询样本中提取更具鉴别力的彩色纹理特征,因此能够获得更好的图像检索性能。

最后,对本节提出的图像检索系统的实时性进行分析。图像检索过程主要包括特征提取阶段和特征匹配阶段,因此一个图像检索系统的实时性主要取决于两个方面:(1)提取样本特征所需的时间,它将决定特征提取阶段的实时性;(2)所提取的样本特征的维数,它将决定查询样本与数据库中所有样本之间特征距离的计算量,从而决定特征匹配阶段的实时性。因此,对本节提出的图像检索系统,下面分别计算提取样本特征所需的时间和所提取样本特征的维数,在此基础上对本节方法的实时性进行分析。(1)提取样本特征所需的时间。在Corel-10K数据库上,本节方法提取10000个样本的特征只需76秒,即提取一个样本特征的平均时间为0.0076秒,所以,本节提出的方法在特征提取阶段具有很高的实时性。(2)所提取样本特征的维数。本节方法所提取灰度纹理特征的维数为9×9×2=162,所提取粗略颜色信息的维数为10×10=100,故所提取样本特征的总维数为162+100=262,具有较低的特征维数,这使得本节方法在特征匹配阶段也具有良好的实时性。综上所述,由于本章方法在特征提取阶段和特征匹配阶段都具有良好的实时性,所以本章方法在整体系统的实现上具有良好的实时性。

本节提出的图像检索系统能够获得良好的实时性,这主要是因为:(1)在提取样本特征之前,本节方法先对每个样本图像进行了采样操作,降低了样本图像的尺寸,显著减少了后续特征提取的计算量;(2)在利用DDTCLBP算法提取灰度纹理特征时,本节方法只计算一个半径(R, P)=(1, 8)的特征,减少了灰度纹理特征提取的计算量和所提取灰度纹理特征的维数;(3)在提取颜色信息时,本节方法采用粗略量化的策略,将色调分量H和饱和度分量S的量化等级个数都设为Lc=10,减少了颜色信息提取的计算量和所提取颜色特征的维数。上述这些措施都显著降低了本节方法在特征提取阶段和特征匹配阶段的计算量,从而提高了整个检索系统的实时性。