首页 理论教育基于深度学习的人脸识别技术优化方案

基于深度学习的人脸识别技术优化方案

【摘要】:由于任务中待识别ID是半封闭集合,可以融合图像分类和度量学习的思路进行模型训练。第二阶段采用Softmax Loss+0.01×Center Loss,并在业务数据上进行网络参数的微调。目前把人脸分割为9个区域,加上人脸整体区域,共需训练10个模型。图10-12基于集成学习的人脸识别在测试阶段,对于待验证的人脸区域和候选人脸区域,分别基于图10-12所示的10个区域提取特征。最终,通过相似度加权的方法判断两张人脸是否属于同一个人。表10-1公开数据集评测结果

美团每天有百万级的图片产生量,运营人员负责相关图片的内容审核,对涉及法律风险及不符合平台规定的图片进行删除操作。由于图片数量巨大,人工审核耗时耗力且审核能力有限。对于不同审核人员来讲,审核标准难以统一且实时变化。因此,有必要借助机器实现智能审核。

为了避免侵权明星肖像权,审核场景需要鉴别用户/商家上传的图像中是否包含明星的头像。这是一类典型的人脸识别应用,具体来说是一种1:(N+1)的人脸比对。整个人脸识别流程包含人脸检测、人脸关键点检测、人脸矫正及归一化、人脸特征提取和特征比对,如图10-11所示。其中深度卷积模型是待训练的识别模型,用于特征提取。

图10-11 明星脸识别流程

人脸识别主要有两种思路:一种是直接转换为图像分类任务,每一类对应一个人的多张照片,比较有代表性的方法有DeepFace、DeepID等;另一种则将识别转换为度量学习问题,通过特征学习使得来自同一个人的不同照片距离比较近、不同的人的照片距离比较远,比较有代表性的方法有DeepID2、FaceNet等。

由于任务中待识别ID是半封闭集合,可以融合图像分类和度量学习的思路进行模型训练。考虑到三元组损失(Triplet Loss)对负例挖掘算法的要求很高,在实际训练中收敛很慢,因此本案例采用了Center Loss来最小化类内方差,同时联合Softmax Loss来最大化类间方差。为了平衡这两个损失函数,需要通过试验来选择超参数。采用的网络结构是Inception-v3,在实际训练中分为两个阶段。

第一阶段采用Softmax Loss+C×CenterLoss,并利用公开数据集CASIA-WebFace(共包含10575个ID和49万张人脸图片)进行网络参数的初始化和超参数C的优选,根据试验得到的C=0.01。

第二阶段采用Softmax Loss+0.01×Center Loss,并在业务数据(5200个明星脸ID和100万张人脸图片)上进行网络参数的微调。

为了进一步提升性能,借鉴了百度采用的多模型集成策略,如图10-12所示。具体来说,根据人脸关键点的位置把人脸区域分割为多个区域,针对每一个区域分别训练特征模型。目前把人脸分割为9个区域,加上人脸整体区域,共需训练10个模型。

图10-12 基于集成学习的人脸识别

在测试阶段,对于待验证的人脸区域和候选人脸区域,分别基于图10-12所示的10个区域提取特征。然后,对于每个区域,计算两个特征向量间的相似度(余弦距离)。最终,通过相似度加权的方法判断两张人脸是否属于同一个人。表10-1给出了主流方法在LFW数据集上的评测结果。可以看出,美团模型在相对有限数据下获得了较高的准确率。

表10-1 公开数据集评测结果