LabelMe[24]是MIT计算机系人工智能实验室创建的一个允许在线标记和图像资源共享的通用注释工具。注释的结果保存在XML文件格式中,这样的注释可植入并容易扩展。LabelMe是一个不断拓展的标记图像库,有11845幅静态图片,18524组图像序列。图像库中包含111490个多边形组成的目标区域,其中44059个是用在线工具标注的,67431个是离线标注的。其一个重要优势在于包含WordNet,可以在WordNet树的不同级别查询目标。......
2023-06-28
PASCAL(Pattern Analysis,Statistical Modeling and Computational Learning)图像库是2005年由欧洲的苏黎世大学、爱丁堡大学及牛津大学组织倡导的,由相应的专项基金支持,旨在构建含有海量数据的公用图像库,在现实场景中识别多个目标类别信息,为全世界的图像识别研究人员提供一个基准,进行相应的算法分析和方法比较。PASCAL视觉目标识别竞赛(从2005年开始,每年一次)也采用该图像库,这个图像库包含标注信息,是目前识别难度最大的数据集之一,而且每年都进行类别和数量的扩充,并做相应的技术统计报告。
PASCAL2005[4]包含4类目标(摩托车、自行车、汽车和人)在不同姿势、不同视角下的照片;PASCAL2006[5]包含10类目标(自行车、小汽车、摩托车、人、公共汽车、猫、狗、母牛、马、绵羊)共5304幅图像,都标注了位置(目标边界框)及类别名称;PASCAL 2007[6]中共包含训练图像2501幅,验证图像2510幅,测试图像4952幅,包括自行车、小汽车、摩托车、公共汽车、船、火车、飞机、人、猫、狗、母牛、马、绵羊、鸟、植物、瓶子、餐桌、沙发、椅子、显示器20个类别,这些真实场景中的图像中可能同时包含几类目标,目标的大小比例变化很大,检测目标存在遮挡、变形,同类目标之间也有较大的差距,每幅图像有相应的按规范格式书写的标注文件,标明了图像中包含的目标名称、边界盒、视点(前视图、后视图、左视图、右视图、未知视图)及识别难易度;PASCAL 2008[7]的目标类型和PASCAL 2007没有太多变化,同样是20类,只是多了一些分割的标注信息,另外,难度也有所增强。
PASCAL图像库对每幅图像中目标的位置及类别的标注,使得在测试过程中可以分别检验图像分类(目标在测试图像中是否出现)和目标定位(测试图像中每个目标的边界框)的效果。PASCAL图像库的另一个特别之处在于提供了两种测试集:第一种测试集中的数据来源于许多传统的标准图像库,如Caltech图像库(训练集和测试集遵循随机的均匀可变分布,许多算法对该图像库已经达到非常好的实现效果);第二种测试集可以解决新实例的收集问题,通过不同的图像获取途径,如图像搜索、视频监控、航空拍摄等,在尺度变化、多姿态、复杂背景以及局部遮挡等方面为测试集提供了更加丰富的数据,用以评价算法的泛化能力。
有关图像目标的表示与识别的文章
LabelMe[24]是MIT计算机系人工智能实验室创建的一个允许在线标记和图像资源共享的通用注释工具。注释的结果保存在XML文件格式中,这样的注释可植入并容易扩展。LabelMe是一个不断拓展的标记图像库,有11845幅静态图片,18524组图像序列。图像库中包含111490个多边形组成的目标区域,其中44059个是用在线工具标注的,67431个是离线标注的。其一个重要优势在于包含WordNet,可以在WordNet树的不同级别查询目标。......
2023-06-28
莲花山图像库到2008年为止有3927130个位置点,636748幅图像(视频),而且数目还在不断增加,其中13个子集一般作为算法评估的基准,如一般场景、事件和活动、航拍图像、热门目标、一般目标、人脸和姿态、视频剪辑、文字、自然图像的2.1D分层表示等。......
2023-06-28
TensorFlow支持通过tf.graph()函数来生成新的计算图。有效地整理TensorFlow中的资源同样也是计算图的重要功能之一。在TensorFlow程序中,所有数据都可以通过张量的形式来表示。每一个张量都有一个唯一的张量类型,在对张量进行运算前,TensorFlow首先会对张量进行类型检查,当发现类型不匹配时就会保存。运行模型会话是拥有并管理TensorFlow程序运行时所有资源的概念,是TensorFlow的运行模型。......
2023-06-28
Corel-10K数据库含有100个图像类别,包括桥梁、瀑布、草原、国旗、邮票、食物、汽车、灯塔等,图7-6展示了Corel-10K数据库的一些图像类别,从图7-6也可以看出纹理特征广泛存在于自然界和日常生活中。Corel-10K数据库的每个类别有100个样本图像,因此该数据库一共有100×100=10 000个样本图像,大部分图像的分辨率为187×126或192×128。......
2023-06-29
高斯噪声高斯噪声是指概率密度函数服从高斯分布的一类噪声。在弱光照的情况下,其影响更为严重,此时常用具有泊松分布的随机变量作为光电噪声的模型。这意味着噪声的幅度是与信号有关的。大量实验研究发现,由摄像机拍摄得到的图像受离散的脉冲、椒盐噪声和零均值的高斯噪声的影响严重。消除图像中的噪声成分叫做图像的平滑化或滤波操作。......
2023-11-24
首先,对TIG焊熔池图像进行二值化操作。为了方便熔池宽度的计算,熔池边缘的图像已经经过二值化处理,熔池边缘的像素灰度值为255,而周围的像素灰度值均为0。表5-3-2为MAG焊过程中3种不同焊接参数下得到的典型熔池图像,在经过必要的预处理算法处理后,再采用灰度形态学图像处理算法得到的熔池边缘及熔池宽度、长度和面积。由于在前期处理中没有采用图像二值化的处理,基本没有出现误判的情况。......
2023-06-26
关键字Modify File用以表示按后面的文件说明,在指定的数据库中修改相应数据库文件。下面的语句可在学籍管理数据库增加一个新数据库文件,同时要修改原数据库文件StuFile l的最大文件尺寸为2000 MB。Alter Database StuDataAdd FileModify File又如,如果要删除学籍管理数据库文件StuFile2,则可使用如下命令:Alter Database StuDataRemove File StuFile2......
2023-11-24
由于信息结构复杂,应用环境多样,在相当长的一段时期内数据库设计主要采用手工试凑法。人们经过探索提出了各种数据库设计方法,这些方法运用软件工程的思想和方法,提出了各种设计准则和规程,都属于规范设计法。工具在很大程度上依靠开发人员的经验来保证数据库模型能生成可行的设计方案和高性能的数据库。大多数的数据库设计方法都需要经历这三个步骤。根据所选择的设计方法按部就班地进行并最终获得一个实用的应用系统。......
2023-11-24
相关推荐