首页 理论教育PASCAL图像库介绍与应用

PASCAL图像库介绍与应用

【摘要】:PASCAL视觉目标识别竞赛也采用该图像库,这个图像库包含标注信息,是目前识别难度最大的数据集之一,而且每年都进行类别和数量的扩充,并做相应的技术统计报告。PASCAL图像库对每幅图像中目标的位置及类别的标注,使得在测试过程中可以分别检验图像分类和目标定位的效果。

PASCAL(Pattern Analysis,Statistical Modeling and Computational Learning)图像库是2005年由欧洲的苏黎世大学、爱丁堡大学及牛津大学组织倡导的,由相应的专项基金支持,旨在构建含有海量数据的公用图像库,在现实场景中识别多个目标类别信息,为全世界的图像识别研究人员提供一个基准,进行相应的算法分析和方法比较。PASCAL视觉目标识别竞赛(从2005年开始,每年一次)也采用该图像库,这个图像库包含标注信息,是目前识别难度最大的数据集之一,而且每年都进行类别和数量的扩充,并做相应的技术统计报告。

PASCAL2005[4]包含4类目标(摩托车自行车汽车和人)在不同姿势、不同视角下的照片;PASCAL2006[5]包含10类目标(自行车、小汽车、摩托车、人、公共汽车、猫、狗、母牛、马、绵羊)共5304幅图像,都标注了位置(目标边界框)及类别名称;PASCAL 2007[6]中共包含训练图像2501幅,验证图像2510幅,测试图像4952幅,包括自行车、小汽车、摩托车、公共汽车、船、火车、飞机、人、猫、狗、母牛、马、绵羊、鸟、植物、瓶子、餐桌、沙发、椅子、显示器20个类别,这些真实场景中的图像中可能同时包含几类目标,目标的大小比例变化很大,检测目标存在遮挡、变形,同类目标之间也有较大的差距,每幅图像有相应的按规范格式书写的标注文件,标明了图像中包含的目标名称、边界盒、视点(前视图、后视图、左视图、右视图、未知视图)及识别难易度;PASCAL 2008[7]的目标类型和PASCAL 2007没有太多变化,同样是20类,只是多了一些分割的标注信息,另外,难度也有所增强。

PASCAL图像库对每幅图像中目标的位置及类别的标注,使得在测试过程中可以分别检验图像分类(目标在测试图像中是否出现)和目标定位(测试图像中每个目标的边界框)的效果。PASCAL图像库的另一个特别之处在于提供了两种测试集:第一种测试集中的数据来源于许多传统的标准图像库,如Caltech图像库(训练集和测试集遵循随机的均匀可变分布,许多算法对该图像库已经达到非常好的实现效果);第二种测试集可以解决新实例的收集问题,通过不同的图像获取途径,如图像搜索、视频监控、航空拍摄等,在尺度变化、多姿态、复杂背景以及局部遮挡等方面为测试集提供了更加丰富的数据,用以评价算法的泛化能力。