首页 理论教育基于内容的服装图像情感识别与检索系统

基于内容的服装图像情感识别与检索系统

【摘要】:一张图像需要经过图像特征提取和机器学习的过程,可以得到其情感因子值,进而根据式(7-1)可以算出其情感的定量描述,实现图像的情感语义识别,然后根据情感相似度就可以实现图像的情感语义检索。建立图像低层特征与情感因子之间的映射通过支持向量机来完成。

通过对第8章对服装面料情感语义因子和低层特征之间的关系进行分析,在服装面料图像情感因子空间的三个因子中[1],第一个因子可以用七维特征(六维的饱和度—冷暖模糊直方图加一维的图像对比度)来表征;第二个因子可以用257维特征(256维的灰度图加一维的彩色对比度)来表征;第三个因子可以用四维特征(三维的灰度矩阵参数加一维的平均色调值)来表征。

本节就是在前期建立面料的情感因子空间以及对情感因子和低层特征之间的关系进行分析的基础上,在框架的层次上论述如何利用支持向量机(Support Vector Machine,SVM)的方法实现基于内容的面料图像情感语义识别和检索。

为了实现面料图像情感语义的识别,现有的方法就是建立面料图像低层特征和情感语义之间的映射关系。图像具有多种图像的低层特征(如颜色),而机器学习的过程,就是建立图像低层特征与情感描述(本书通过情感因子空间)之间的映射,这个映射的过程可以采用支持向量机的方法来完成。一张图像需要经过图像特征提取和机器学习的过程,可以得到其情感因子值,进而根据式(7-1)可以算出其情感的定量描述,实现图像的情感语义识别,然后根据情感相似度就可以实现图像的情感语义检索。面料的样本图像训练、新增图像的情感语义自动识别流程以及图像情感语义检索流程分别如图9-1、图9-2、图9-3所示。

图9-2 新的面料图像情感语义识别和入库的流程

图9-1~图9-3中,样本图像是经过选择的不同种类面料图像60张,让被测者经过主观测试后获得了每张图像的七对情感描述值[2]。因子得分系数矩阵的展开式见式(7-2),详细论述可见第7章。关于七维、四维和256维的面料图像低层特征分析见第8章,因子相似度度量见式(9-1)。建立图像低层特征与情感因子之间的映射通过支持向量机来完成。

图9-1 面料图像样本支持向量机训练和入库的流程

图9-3 面料图像情感语义检索

对于图像数据库中的每一幅面料图像,根据被试者对面料图像引发的七对情感语义词汇的评估均值,通过因子分析,可以转化为三维情感因子空间中的一个向量[2]。由于这个三维空间中的各个分量之间是正交独立的,所以可以定义某种距离来描述该空间样本点之间的差异程度。一幅图像就是情感因子空间中的一个样本,所以图像之间的情感语义相似度就可以使用该空间的距离测度来表示。当前大多基于内容的图像检索系统都采用相似性度量算法来模拟人类视觉对图像相似性的感知。通常的思路是,给定两个特征向量,用一个距离函数计算这两个向量的差别,并试图用这个差别来度量它们所表示图像的相似性,距离越大,相似性越差。既然图像特征可表示为向量,距离函数经常被定义为欧式距离、街区距离、加权的欧式距离和Cosine距离(或称为角度量)等。参考各种距离的定义[3],本文定义面料图像情感语义相似度度量为式(9-1)。

式(9-1)中,a和b是两幅图像在情感因子空间的坐标,该式既反映了两向量之间的夹角余弦距离,又反映了向量模的差距,在度量相似度方面比单纯的夹角余弦距离更为有效。该相似度最大值为l,最小值为-1。

计算出图像之间的相似度,就可以在图像情感因子空间中实现基于情感语义的图像检索,步骤如图9-3所示。按情感因子空间的相似度检索出来的图像,不是按照图像低层特征的相似性进行排序的,而是按照图像在高层情感上的相似度进行排序,将更接近人的主观感觉。