首页 理论教育构建迁移学习模型的方法

构建迁移学习模型的方法

【摘要】:为了将VGG-16模型和迁移学习方法相结合来实现纹理图像识别,需要对原有的VGG-16模型结构进行修改,从而构建新的迁移学习模型。首先,因为VGG-16模型前面的5个卷积模块主要用于输入提取的图像特征,并且这些卷积模块的参数已经在大规模ImageNet图像数据集上经过了充分的预训练,已经具备了较好的特征提取能力,所以对这5个卷积模块进行保留,将其作为新构建的迁移学习模型的特征提取器。

为了将VGG-16模型和迁移学习方法相结合来实现纹理图像识别,需要对原有的VGG-16模型结构进行修改,从而构建新的迁移学习模型。由于CNN模型的结构从功能上可分为特征提取和特征分类两个部分,新构建的迁移学习模型也包括两个部分,即特征提取器和分类器

首先,因为VGG-16模型前面的5个卷积模块主要用于输入提取的图像特征,并且这些卷积模块的参数已经在大规模ImageNet图像数据集上经过了充分的预训练,已经具备了较好的特征提取能力,所以对这5个卷积模块进行保留,将其作为新构建的迁移学习模型的特征提取器。

其次,VGG-16模型最后的三个FC层含有大量的参数,其参数规模占整个VGG-16模型参数规模的大部分比例,如此大规模的参数会带来三个不利的影响:①导致训练和测试时的计算量增大,使训练和测试阶段所需的时间增加,对硬件平台的性能要求更高;②导致CNN模型的体积增大,VGG-16模型的存储体积为528 MB,不方便在嵌入式或便携式设备上安装和使用;③参数规模增大,也会导致模型容易发生过拟合现象。因此,为了缩小CNN模型的参数规模,在本节构建的迁移学习模型中尽量减少FC层的使用次数,仅在最后阶段使用一个FC层将输出端的个数调整为待识别纹理图像的类别个数,并用这个FC层输出当前样本对所有类别的分类得分值。

最后,利用一个Softmax层将FC层输出的分类得分值转换为范围(0, 1)的分类概率值,根据分类概率值的大小,即可判断当前样本所属类别的类别标签。

综上所述,本节构建的迁移学习模型的结构如表6-1所示。

表6-1 迁移学习模型的结构