首页 理论教育LabelMe图像库:高质量的图像数据资源

LabelMe图像库:高质量的图像数据资源

【摘要】:LabelMe[24]是MIT计算机系人工智能实验室创建的一个允许在线标记和图像资源共享的通用注释工具。注释的结果保存在XML文件格式中,这样的注释可植入并容易扩展。LabelMe是一个不断拓展的标记图像库,有11845幅静态图片,18524组图像序列。图像库中包含111490个多边形组成的目标区域,其中44059个是用在线工具标注的,67431个是离线标注的。其一个重要优势在于包含WordNet,可以在WordNet树的不同级别查询目标。

LabelMe[24]是MIT计算机系人工智能实验室创建的一个允许在线标记和图像资源共享的通用注释工具。该工具提供多边形绘图、图像查询和浏览图像库等许多功能,图像库和所有的注释都可以免费使用,并且支持几乎所有的浏览器,甚至可以支持Javascript标准图形接口。注释的结果保存在XML文件格式中,这样的注释可植入并容易扩展。

LabelMe是一个不断拓展的标记图像库,有11845幅静态图片,18524组图像序列(每组序列至少存在一个标记目标)。图像库中包含111490个多边形组成的目标区域(2006年年底统计),其中44059个是用在线工具标注的,67431个是离线标注的。其一个重要优势在于包含WordNet,可以在WordNet树的不同级别查询目标。

LabelMe与其他图像数据集的主要区别是:LabelMe中的目标是一类而并非个体信息,识别一个目标的类别信息,不但需要同类的不同个体的多张图像,而且需要不同的观察条件;在真实场景中标记目标,使得目标检测具有很强的背景干扰,适合训练基于复杂背景的图像目标识别系统;高质量、在线标注,不仅保证了资源同享而且更多细节信息(如边界框、多边形或分割掩膜)对目标识别和图像分析非常有帮助;许多不同的目标类和大量不同场景的图像,可以面向更多图像识别的应用场合,通过改变目标种类、场景样式、距离远近、背景复杂度等,在分析不同的环节和参数对识别效果的影响时,是非常有用的;LabelMe是个公开的图像库,采用许多非版权图像,大多数是利用手提式数码相机拍摄的,也有许多利用网络摄像头获取的视频,具有开放性和动态性。