首页 理论教育纹理数据库和实验设置探讨

纹理数据库和实验设置探讨

【摘要】:本章实验采用的标准纹理图像数据库是CUReT纹理库和KTH-TIPS纹理库,这两个纹理图像数据库的主要特点如下所述。在CUReT纹理库上进行实验时,从每个纹理类别随机挑选N1=46个样本作为训练样本,每个类别剩下的92-N1=46个样本作为测试样本。

本章实验采用的标准纹理图像数据库是CUReT纹理库和KTH-TIPS纹理库,这两个纹理图像数据库的主要特点如下所述。

CUReT纹理库的拍摄对象是真实世界中存在的61类纹理材料(如毛毡、皮革、砂纸、丝绒、毛玻璃、草皮、铝箔、海绵、动物皮毛和面包等),每个类别包含92个纹理样本图像,即该纹理库一共有5 612个纹理样本图像,并且每个样本图像的分辨率均为200×200,这些样本图像是在不同的光照条件和不同的视角下拍摄的。对CUReT纹理库而言,其特征提取和识别的难度在于该纹理库的很多样本具有较大的类内差异和较小的类间差异,同时光照条件等因素的影响以及CUReT纹理库的样本类别数目较多,都增加了CUReT纹理库中样本图像特征提取和识别的难度,使CUReT纹理库成为一个富有挑战性的标准纹理图像数据库。

KTH-TIPS纹理库由10个类别的纹理材料组成,具体包括铝箔、砂纸、海绵、灯芯绒、亚麻布、棉织物、面包、橘子皮、聚苯乙烯泡沫和薄脆饼干等。对每个类别的纹理材料,在3种不同的照明条件、3个不同的视角和9个不同的尺度条件下进行拍摄,每个类别可获取3 ×3 ×9 =81个样本图像,因此KTH-TIPS纹理库一共含有810个样本图像。在拍摄样本图像时,通过改变相机与样本的距离来改变尺度参数,大部分样本图像的分辨率为200×200。和CUReT纹理库相比,虽然KTH-TIPS纹理库的样本类别数目减少了(CUReT纹理库含有61个纹理类别,而KTH-TIPS纹理库含有10个纹理类别),但KTH-TIPS纹理库最大的挑战是引入了CUReT纹理库所不具有的大范围的尺度变化,这些因素增加了KTH-TIPS纹理库中纹理样本的识别难度,使在KTH-TIPS纹理库上开展纹理图像的特征提取和识别任务变得更具挑战性。

为了和其他先进的纹理图像识别方法的性能进行比较,本章在开展相关实验时对CUReT纹理库和KTH-TIPS纹理库采用与上述算法相同的实验设置,具体描述如下:

(1)将CUReT纹理库和KTH-TIPS纹理库中的彩色纹理图像转换为灰度图像,即在实验中只利用灰度纹理图像的特征,没有利用颜色信息。

(2)在CUReT纹理库上进行实验时,从每个纹理类别随机挑选N1=46个样本作为训练样本,每个类别剩下的92-N1=46个样本作为测试样本。

(3)在KTH-TIPS纹理库上进行实验时,从每个类别随机挑选N2=40个样本作为训练样本,每个类别剩下的81-N2=41个样本作为测试样本。

(4)为了获得稳定的实验结果,将上述对训练样本集和测试样本集的随机划分独立重复进行100次,每次划分独立进行一次实验,并计算这100次实验结果的平均值,将其作为最终的纹理识别结果。

根据文献[82]提出的Gabor滤波器组设计方法,本章设置Gabor滤波器组的最高数字频率为Fh=0.4,最低数字频率为Fl=0.03,该频段可覆盖人眼视觉系统所能感知的图像频率范围。同时,本章方法设置 Gabor滤波器的支撑域尺寸为Ng=15,即每个Gabor滤波器具有15×15的支撑域,对该支撑区域的纹理图像进行卷积滤波,随着支撑区域中心位置的移动,可实现对整幅纹理图像的Gabor滤波运算。另外,设置Gabor滤波器组总的尺度个数为S=4,总的方向个数为K=6,因此整个Gabor滤波器组一共有S×K=24个Gabor滤波器,可对输入的纹理图像在4个尺度和6个方向上提取纹理特征。

实验平台:一台计算机(Intel Core i3-6100 CPU @ 3.70GHz, 4GB RAM),MATLAB R2016b软件以及Windows 10操作系统。