早期的图像分割研究主要集中于对狭义图像分割的研究,且并未区分狭义图像分割与目标分割的概念,界定比较模糊。3)图像仅是现实世界的表象。只有随着各学科的综合发展,目标分割才会不断有新的突破。总之,尽管长期以来人们为研究目标分割问题做出了很大努力,但上述原因导致很难实现一种普适的方法,而只能针对特定问题和具体的需求给出合理的解决方法,在处理速度、精度等关键性指标上做出均衡或侧重。......
2023-06-28
早在1992年,英国剑桥大学的Lisa Gottesfeld Brown在文献中就总结了图像配准的主要理论及图像拼接技术在各个领域的应用,当时他的讨论主要还是着眼于医学图像处理、遥感图像处理等传统应用领域。时隔20年,图像拼接技术有了飞跃发展,目前在大面积场景观测、虚拟现实、视频压缩、视频检索以及高分辨率图像的获取方面也有了广泛应用。
1.大面积场景观测及视频监控系统
图像拼接技术可以用于场景观测,通过将卫星图片或航空照片或者水下摄像图片拼接成大范围的场景图片来实现对某一地区某一场景的整体勘察观测,比如高大建筑物高分辨率全景图像的获取、水下考古、海底探测以及遥感观测等。视频图像序列构造全景视图技术还可以用于现场操作员和指挥专家之间的远程协作系统和远程遥控系统,现场操作员通过头盔摄像机将现场拍摄的视频图像通过无线通信的方式传递给在远程的指挥专家,远程指挥专家在收到现场拍摄的视频图像后构建出现场的全景图像,然后根据现场情况提出建议并通知现场操作员进行相关的操作。
2.虚拟现实场景的构建
虚拟现实技术是利用计算机构建一个逼真的虚拟环境,即以仿真的方式给人们创造一个反映实体对象变化及其相互作用的三维世界,使得人们能够通过使用专用设备,就能像在自然环境中一样对虚拟环境中的实体进行观察与控制。在20世纪90年代,由于传统的基于图形绘制(GBR)的虚拟现实技术存在着明显的缺点,无法完全适应实际需要,人们提出一种基于图像绘制(IBR)的虚拟现实技术,通过许多相关的静止的图像进行连续的插值而实现场景的交互式浏览,这样大大降低了数据量,从而方便了图像数据的传输和保存。虚拟现实技术所需要的图像依赖于图像拼接技术,所以图像拼接技术有重要的研究价值。
3.视频压缩
图像拼接技术的另外一个重要应用是视频压缩。目前MPEG-4编码标准针对视频中背景对象的特点提出了Sprite编码方式。利用图像拼接技术将整个视频图像序列的背景内容拼接成一幅大的完整的背景全景图像,该背景在每一帧中出现过的像素点,在这幅大的背景全景图中都能找到对应的点,这样的图像就叫做Sprite图像。由于Sprite图像自身是不变的,因此只需传输一次,然后根据摄像机的运动参数在接收端重建背景,这样可以大大减少传输的数据量。这种编码方式可以很大程度上提高视频压缩效率。
4.视频检索
视频流帧间存在大量冗余信息,利用图像拼接技术去除冗余,将分散在各个视频帧中的信息集中起来表示成整体的场景,这种紧密重组提供了对内容的非线性浏览和高效的索引,可以有效地对感兴趣的信息进行直接快速存取、编辑注释等操作。
从具体算法角度来讲,国际上在1996年由Richard Szeliski提出了基于运动的全景图像拼接,该算法是图像拼接领域的一个里程碑式算法。它是采用了Levenberg-Marquardt最优化算法使得两幅图像的亮度差最小,进而求出图像间的变换关系,此方法效果比较理想,还可以处理平移、旋转、仿射等多种图像变换。而Richard Szeliski也成为了图像拼接领域的奠基人,这套理论已经成为了一个经典理论体系,现在许多人依然在这套理论基础上做进一步研究。2000年,Shmuel Peleg,Benny Rousso等人做了进一步的改进,提出了一种自适应的图像拼接算法,它是依据摄像机的不同运动方式,自动选择合适的拼接模型。这一研究成果推动了图像拼接技术的发展,由此,拼接的自适应性成为图像拼接领域研究的热点。在2003年ICCV大会上,M.Brown发表了一篇名为《Recognising Panoramas》的文章,文中使用了基于尺度不变特征的匹配算法进行图像拼接,并采用多分辨率的思想进行图像融合,将低频信息与高频信息采用不同的方式进行融合,既保证了细节信息,也保证了背景信息,该算法的自适应性好,并且效果理想。因此M.Brown提出的理论大大地推动了图像拼接技术的发展,也将全景图拼接技术研究推向高潮。
国内关于图像拼接技术的研究也发展较快。1997年,浙江大学CAD&CG国家重点实验室研究并提出一种自动拼接算法,该算法是基于模板匹配的思想进行搜索,确定最佳匹配方式。1998年,Paul Bao运用小波变换的优良性质提出一种图像拼接算法,该算法结果精度高,拼接效果好,但是小波变换同傅里叶变换一样存在效率低的缺点,需要进一步改进。2001年,清华大学的研究人员提出了一种新的图像拼接算法,研究算法效率与精确度的关系,将摄像机固定在特殊的三脚架上,使其绕垂直轴旋转拍摄,最终取得了不错的拼接效果。同年,华中科技大学的研究人员通过研究图像变换关系模型,提出了基于特征点的改进拼接算法,它是首先运用相关法提取特征点,再计算变换模型生成全景图的算法。2002年,杜威等人对动态全景图做了相应研究,提出了一种能够处理动态场景的全景图表示方法,把视频和全景图结合起来,生成动态全景图。在国内比较优秀的拼接算法是在2004年由赵向阳、杜立民提出的一种基于特征点匹配的拼接算法,它首次将角点匹配与变换参数鲁棒估计引入图像拼接,虽然说大部分都是国外经典算法,但是该论文的主要贡献是将这些算法有机地组合起来,并取得理想效果。在此基础上,2008年,马丽涛等提出一种基于条件数的配准算法,其主要思想是:在角点特征的基础上,研究分析噪声对图像之间的变换关系的影响程度,然后筛选出具有稳定性的角点,提高了匹配的准确度。
有关图像目标的表示与识别的文章
早期的图像分割研究主要集中于对狭义图像分割的研究,且并未区分狭义图像分割与目标分割的概念,界定比较模糊。3)图像仅是现实世界的表象。只有随着各学科的综合发展,目标分割才会不断有新的突破。总之,尽管长期以来人们为研究目标分割问题做出了很大努力,但上述原因导致很难实现一种普适的方法,而只能针对特定问题和具体的需求给出合理的解决方法,在处理速度、精度等关键性指标上做出均衡或侧重。......
2023-06-28
航拍图像拼接技术是当前机器视觉领域的一个研究热点,已经被广泛应用于地理信息系统、地质灾害监测、城市规划和战场态势评估等许多方面。但是,由于是在飞行器上对地面场景的俯视拍摄,所以又有其自身的特点和难点,比如飞行器姿态变化导致的航拍视角改变、飞行器升降造成的图像分辨率不同、天气状况对图像质量的影响等。该方法比较适合于全景图像拼接。......
2023-06-28
下面简单介绍大部分可公开获取的RGB-D 动作行为数据集。目前有3类人体动作行为数据集,即单视角动作行为数据集、多视角动作行为数据集和双人/多人交互动作行为数据集。单视角动作行为数据集MSR-Action3D[30]数据集是微软研究院2010 年公开的RGB-D 单视角行为数据集。10 个受试者共320 个样本。UTKinect[31]行为数据集是得克萨斯大学2012 年公布的。UTD-MHAD[88]行为数据集是由得克萨斯大学2015 年公布的。8 个受试者每个动作执行4 次。......
2023-10-28
我国城市街道、广场、居民生活小区、学校等区域均配备了相应的安防系统,并且还在逐步加大投入。视频监控系统以其直观、方便、信息内容详实,被广泛应用于生产管理、保安等场合。但现有的视频监控系统仍存在较多问题。视频监控系统的最大作用是在案件发生后,提供当时现场的录像资料,给公安部门提供有力的证据。可以看出,现有视频监控系统以硬件为主,利用效率较低,而系统深层智能的关键在于视频录像的自动分析和异常发现。......
2023-06-16
基于边缘的分割方法边缘检测是在灰度图像分割中广泛应用的一种技术,它基于在区域边缘处梯度变化剧烈的假设,试图通过检测区域间的边缘来达到图像分割的目的。则分割时,选取的阈值应位于直方图波谷处。......
2023-06-28
如果,预先知道每个目标占整个图像的比例p,则可以采用p参数法进行分割。下面以图像中包括两个区域的情况来分析p参数法的基本步骤。由于这种方法需要预先知道各个区域的p值,因此被称为p参数法。 p参数法图像分割实例本例仍以图4.39a为例进行p参数法图像分割,假设p=0.4。图4.39 p参数法图像分割实例从图4.39c中可以看出,当Pa1=0.4,其对应的灰度值为200,因此分割阈值T=200。......
2023-11-24
图4.16“仿制图章工具”选项栏“画笔预设”下拉面板:用于设置修复画笔的大小、硬度、间距等属性。图4.20“修补工具”选项栏“修补”:设置修补的对象,选择“源”,则将选区定义为想要修复的区域;选择“目标”,则将定义的选区定义为进行取样的区域;选择“透明”,则被选区内的图像呈现半透明状态。图4.23原图与使用“涂抹工具”后的效果图......
2023-11-16
SVM支持向量机SVM是从线性可分情况下的最优分类面发展而来的,基本思想可用图10-8所示的两维情况说明。满足条件约束条件且使‖w‖/2最小的分类面就叫做最优分类面,H1、H2上的训练样本点称为支持向量。图10-9给出了K近邻分类器的示意图。在性能上最近邻分类器虽然简单,但是泛化错误不超过贝叶斯最优分类器的两倍。......
2023-06-28
相关推荐