首页 理论教育训练样本个数对模型的稳健性分析

训练样本个数对模型的稳健性分析

【摘要】:表5-3采用不同训练样本个数时的纹理识别精度(%)从表5-3的实验结果对比可以看出:本章提出的方法对训练样本个数的变化具有更好的稳健性。本章方法能够获得对训练样本个数的良好稳健性,主要原因如下:本章方法提取的粗略颜色信息和灰度纹理特征具有很强的描述能力,将二者进行特征融合又能进一步提升综合特征的鉴别能力。

为了评估本章方法对训练样本个数变化的稳健性,本节在KTH-TIPS彩色纹理库上进行实验,分别从每个纹理类别随机选择N(N=40, 30, 20, 10,5)个样本作为训练数据,每个纹理类别剩下的(81-N )个样本作为测试数据。为了获得稳定的实验结果,将上述对训练数据集和测试数据集的随机划分重复进行100次,每次随机划分进行一次独立的实验,并计算这100次独立实验的平均精度作为最终的纹理识别精度。将本章方法的纹理识别精度与其他一些方法的纹理识别精度进行比较,具体的实验结果如表5-3所示。

表5-3 采用不同训练样本个数时的纹理识别精度(%)

从表5-3的实验结果对比可以看出:

(1)本章提出的方法对训练样本个数的变化具有更好的稳健性。当训练样本的个数不断减少时,其他方法的纹理识别精度都出现了大幅度的下降,而本章方法的纹理识别精度没有出现显著的下降,一直保持在较高的纹理识别精度水平。例如,当训练样本的个数N从40减少到5时,其他算法的纹理识别精度的最大降幅超过了20%,而本章方法的纹理识别精度的降幅仅为3.62%,显著小于其他算法的下降幅度。

(2)当训练样本的个数N=5时,本章方法仍然获得了96.36%这样高的纹理识别精度,显著超越了其他算法的纹理识别精度(73.30%、77.58%、82.78%、76.62%、74.77%),这体现出本章方法在样本数量非常少的情况下仍然具有很好的纹理识别能力。

本章方法能够获得对训练样本个数的良好稳健性,主要原因如下:

(1)本章方法提取的粗略颜色信息和灰度纹理特征具有很强的描述能力,将二者进行特征融合又能进一步提升综合特征的鉴别能力。

(2)在提取灰度纹理特征时,本章方法利用多次高斯滤波为每个原始的纹理图像构建了一个多尺度空间,然后利用多尺度空间中的三个图像来描述一个原始纹理图像的特征,相当于样本个数变为原来的3倍,从而弥补了训练样本个数减少的不足。

综上分析,本章方法对训练样本个数的变化具有很好的稳健性,因此具有更好的应用前景,尤其当可利用的训练样本个数非常有限(如N=5)时,本章方法仍能获得较高的纹理识别精度。