首页 理论教育纹理数据库与实验设计分析

纹理数据库与实验设计分析

【摘要】:关于CUReT纹理库特征的详细描述可见本书2.4.1节的介绍。Outex纹理图像数据库是由芬兰奥鲁大学的机器视觉和媒体处理中心拍摄的,在Outex纹理图像数据库中,最常用的是Outex TC-10和Outex TC-12这两个纹理库子集。图4-9UIUC纹理库的25个纹理类别图4-10UIUC纹理库的视角、尺度变化和非刚性变形UMD纹理图像数据库也由25个纹理类别组成,包括货架上的商品、树叶、苹果、树皮、地板、鹅卵石路等,每类纹理有40个样本图像。

为了对本章提出的方法进行更加综合的性能评估,除了采用标准的CUReT纹理库和KTH-TIPS纹理库,这里再引入三个新的纹理图像数据库,即Outex纹理库[47]、UMD纹理库[104]和UIUC纹理库[105]。由于更多的纹理图像数据库代表着更多的工程应用场景,在更多个纹理图像数据库上开展更加广泛和更加综合的实验,能够更加全面和准确地评估本章所提出的纹理图像特征提取和识别方法的性能。

CUReT纹理库的拍摄对象是真实世界中存在的61类纹理材料(如毛毡、皮革、砂纸、丝绒、毛玻璃、草皮、铝箔、海绵、动物皮毛和面包等),每个类别包含92个纹理样本图像,即该纹理库一共有5 612个纹理样本图像,并且每个样本图像的分辨率均为200×200,这些样本图像是在不同的光照条件和不同的视角下拍摄的。对CUReT纹理库而言,其特征提取和识别的难度在于该纹理库的很多样本具有较大的类内差异和较小的类间差异,同时光照条件等因素的影响以及CUReT纹理库的样本类别数目较多,这些因素都增加了CUReT纹理库中样本图像特征提取和识别的难度,使CUReT纹理库成为一个富有挑战性的标准纹理图像数据库。关于CUReT纹理库特征的详细描述可见本书2.4.1节的介绍。

KTH-TIPS纹理库由10个类别的纹理材料组成,具体包括铝箔、砂纸、海绵、灯芯绒、亚麻布、棉织物、面包、橘子皮、聚苯乙烯泡沫和薄脆饼干。对每个类别的纹理材料,在3种不同的照明条件、3个不同的视角和9个不同的尺度条件下进行拍摄,每个类别可获取3 ×3 ×9 =81个样本图像,因此KTH-TIPS纹理库一共含有810个样本图像。在拍摄样本图像时,通过改变相机与样本的距离来改变尺度参数,大部分样本图像的分辨率为200×200。和CUReT纹理库相比,虽然KTH-TIPS纹理库的样本类别数目减少了(CUReT纹理库含有61个纹理类别,而KTH-TIPS纹理库含有10个纹理类别),但KTH-TIPS纹理库最大的挑战是引入了CUReT纹理库所不具有的大范围的尺度变化,这些因素增加了KTH-TIPS纹理库中纹理样本的识别难度,使在KTH-TIPS纹理库上开展纹理图像的特征提取和识别任务变得更具挑战性。关于KTH-TIPS纹理库特征的详细描述可见本书2.4.1节的介绍。

Outex纹理图像数据库是由芬兰奥鲁大学的机器视觉和媒体处理中心拍摄的,在Outex纹理图像数据库中,最常用的是Outex TC-10和Outex TC-12这两个纹理库子集。Outex TC-10和Outex TC-12纹理库含有相同的24个纹理类别,包括瓷砖、地毯、帆布等,图4-7展示了这24个纹理类别,每个纹理类别选取一个样本图像进行展示。Outex TC-10和Outex TC-12纹理库中的每个样本都含有9个不同的旋转角度(0,5,10,15,30,45,60,75,90),每个样本图像的分辨率均为128×128,图4-8展示了一个纹理样本在不同旋转角度下拍摄的图像。Outex TC-10和Outex TC-12纹理库的不同之处在于,Outex TC-10纹理库是在同一种光源(Inca)下拍摄的,没有光照条件的变化,只有样本旋转角度的变化,因此可利用Outex TC-10纹理库来测试纹理图像特征提取和识别算法对图像旋转的稳健性;而Outex TC-12纹理库是在三种不同的光源(Inca, Horizon, TL84)条件下拍摄的,不但有光照条件的变化,还含有纹理样本旋转角度的变化,因此可利用Outex TC-12纹理库来测试纹理图像特征提取和识别算法对光照条件和图像旋转这两种因素的稳健性。

图4-7 Outex TC-10和Outex TC-12纹理库的24个纹理类别

图4-8 Outex TC-10和Outex TC-12纹理库的图像旋转效果

UIUC纹理图像数据库含有25个纹理类别,包括花岗岩、木材、砖块、水流、大理石、砂砾、石头、玻璃、地毯、树皮、纸张、动物的皮毛、织物等。图4-9展示了UIUC纹理库的25个纹理类别,每个纹理类别选取一个样本图像进行展示。UIUC纹理库的每个类别含有40个样本图像,每个纹理图像的分辨率均为640×480。对于UIUC纹理库,它的纹理特征提取和识别的挑战性在于它的纹理图像具有大幅度的视角和尺度变化,并且存在显著的表面非刚性变形。如图4-10所示,第一行为砖块的7个样本图像,这些图像展示出UIUC纹理库的样本图像含有大范围的尺度变化和视角变化;第二行为格子布的7个样本图像,这些图像展示出UIUC纹理库的样本图像含有显著的表面非刚性变形。综上所述,UIUC纹理库含有复杂的尺度变化、视角变化和表面非刚性变形,这些因素是前面所述的CUReT纹理库、KTHTIPS纹理库、Outex TC-10和Outex TC-12纹理库所不具备的,这些复杂的变化因素都增加了UIUC纹理库中样本图像的特征提取和识别难度,使UIUC纹理库成为一个极具挑战性的纹理库。

图4-9 UIUC纹理库的25个纹理类别

图4-10 UIUC纹理库的视角、尺度变化和非刚性变形

UMD纹理图像数据库也由25个纹理类别组成,包括货架上的商品、树叶、苹果、树皮、地板、鹅卵石路等,每类纹理有40个样本图像。图4-11展示了UMD纹理库的25个纹理类别,每个纹理类别选取一个样本图像进行展示。和UIUC纹理库相比,UMD纹理库的图像场景更大,每个样本图像的分辨率为1280×960,并且含有显著的图像旋转、尺度变化和视角变化。如图4-12所示,第一行是苹果类别的7个样本图像,第二行是石砾类别的7个样本图像,它们都展现出显著的尺度和视角变化(从左到右的样本图像尺度逐渐增大),这使UMD纹理库也成为一个具有挑战性的纹理库。

图4-11 UMD纹理库的25个纹理类别

图4-12 UMD纹理库的视角和尺度变化

为了和其他的纹理图像特征提取和识别方法进行公平比较,本章所提出的方法只利用灰度纹理图像的特征,没有利用颜色信息,并对所有的纹理库采用与其他方法相同的实验设置,具体如下所述。

(1)在Outex TC-10纹理库和Outex TC-12纹理库上开展实验时,因为Outex TC-10纹理库只含有旋转角度的变化,所以选择角度为0时拍摄的样本图像作为训练数据,在其他8个角度(5,10,15,30,45,60,75,90)时拍摄的样本图像作为测试数据。因为Outex TC-12纹理库同时含有光照条件和图像旋转的变化,所以选择在Inca光源照射下、角度为0时拍摄的样本图像作为训练数据,在其他两种光源(Horizon和TL84)照射下所有9个角度(0,5,10,15,30,45,60,75,90)时拍摄的样本图像作为测试数据。

(2)在KTH-TIPS纹理库上开展实验时,从每个纹理类别随机挑选N1=40个样本图像作为训练数据,每个纹理类别剩下的81-N1=41个样本图像作为测试数据。

(3)在CUReT纹理库上开展实验时,从每个纹理类别随机挑选N2=46个样本图像作为训练数据,每个纹理类别剩下的92-N2=46个样本图像作为测试数据。

(4)在UMD纹理库上开展实验时,从每个纹理类别随机挑选N3=20个样本图像作为训练数据,每个纹理类别剩下的40-N3=20个样本图像作为测试数据。

(5)在UIUC纹理库上开展实验时,从每个纹理类别随机挑选N4=20个样本图像作为训练数据,每个纹理类别剩下的40-N4=20个样本图像作为测试数据。

Outex TC-10和Outex TC-12纹理库的训练数据集和测试数据集的划分是固定的,不存在对数据库的随机划分和实验结果的变化情况,因此在Outex TC-10和Outex TC-12纹理库上只需进行一次实验即可获得最终的纹理图像识别结果。但是,KTH-TIPS纹理库、CUReT纹理库、UMD纹理库和UIUC纹理库每次实验的训练数据集和测试数据集是随机划分的,每次实验的识别结果是不同的,所以为了获得稳定的实验结果,在KTH-TIPS纹理库、CUReT纹理库、UMD纹理库和UIUC纹理库上开展实验时,对训练样本集和测试样本集的随机划分独立重复进行100次,每次划分独立进行一次实验,并计算这100次实验结果的平均值,将其作为最终的纹理图像识别结果。

实验平台:一台计算机(Intel Core i3-6100 CPU @ 3.70GHz, 4GB RAM),MATLAB R2016b软件,Windows 10操作系统。