首页 理论教育相关技术研究现状及发展趋势分析

相关技术研究现状及发展趋势分析

【摘要】:相关技术已经过相当长时间的研究与发展,有一些智能监测报警系统成功应用,许多理论、方法与应用可以借鉴,以下分别阐述。可见,IMZ-RS400系列智能监控软件抽象了现实中一些场合的异常模式,针对这些模式设计报警机制。中国科学院深圳先进技术研究院智能仿生研究中心研究开发的智能监控功能较IMZ-RS400系统软件又有了进步[130]。对于人的行为精确识别与理解还有待研究与开发。

视频摄像的智能研究涉及的关键技术有:图像特征提取与视频识别技术、数据挖掘技术、模糊数据挖掘及在视频识别中的应用等。相关技术已经过相当长时间的研究与发展,有一些智能监测报警系统成功应用,许多理论、方法与应用可以借鉴,以下分别阐述。

1.图像特征提取与视频识别技术方面

图像特征提取是图像识别、视频识别、计算机视觉的基础步骤,国内外最常用的是边缘检测方法,经典的边缘检测算法在MATLAB等软件中均已实现。针对经典算法的缺陷,即只能针对局部给出模糊边缘信息和对噪声及纹理敏感,一些学者提出了改进方法。如张浩等利用多个边缘算法的输出进行贝叶斯推理,判断每个像素是否属于边缘,从而实现复杂场景的边缘检测[119];罗敏等提出了一种基于径向小波变换的图像特征提取算法,该方法使用径向对称函数来获得图像的边缘信息,算法容易实现,能够用于基于内容的图像检索[120]

在很多计算机视觉应用中,一个基础而关键的任务是从视频序列中确定运动目标,其中对于固定摄像机的监控视频运动目标的检测,最常用的方法是减背景技术。其思想是将视频帧与一个背景模型做比较,其中区别较大的像素区域被认为是运动目标。但由于构建背景模型需要考虑光照变化等很多因素,因此开发一个好的减背景算法面临很多挑战。代科学等在文献[121]中对利用减背景技术实现运动目标检测的过程、各种典型背景建模算法的原理和优缺点做了较为详细的阐述和归纳,总结了各种减背景算法的总体特点,指出了减背景技术的未来研究重点和发展方向。从视频中识别人的姿势和动作有很多潜在的应用,如自动监控、疾病诊断、运动分析和人机交互等。姿势识别的困难在于图片的混杂性和人体多关节结构。姿势的识别可以由识别人的头、四肢等组成部分来进行。文献[122]中应用了一种基于马尔可夫链的数据驱动方法。由肢体的方向形成3D姿势估计模型,再到事先存放的姿势候选集中进行马尔可夫匹配搜索,形成最终的姿势模型。J.K.Aggarwal等在文献[123]中描述了一些姿势识别高级处理技术的方法与现状,如:人体建模、理解人的行为的细节、人类运动识别的方法、在领域中的高层模式识别等。在视频识别中,车辆识别的研究最多[124],其理论与方法在智能交通中应用广泛。

2.智能监测报警应用系统方面

在监测应用系统方面,Ismail Haritaoglu等开发了一个在室外录像中识别多人及他们的动作的系统——W4[126]。系统利用形状分析、识别人的构成部分来建立人的外观模型,将有多人的前景进行分段,在有多人互相遮挡的录像中跟踪多人的交互。系统还能将人携带的物品与人分离,识别对物体的动作。Oberli C等开发了一个专家系统来从对做过心脏病手术的病人在线监测数据中发现异常并报警[127]。系统针对的问题是原监测数据没有被充分利用,原有仪器的错误报警使得人们对警示不再在意。系统采用模糊判断逻辑来适应不完全和有噪声的数据。与监测仪器自带的报警系统相比,原75%的仪器报警是误报,此专家系统的误报率低于1%;对异常情况的感知仪器是79%,专家系统是92%;对积极情况的预测能力仪器是31%,专家系统是97%。可见此专家系统有效地提高了原检测仪器的使用能力和效率。英国PC PRO网站2008年6月25日最新的一则新闻显示,英国朴次茅斯科学大学正在进行一项3年的CCTV智能化项目[128]。项目致力于让CCTV的摄像头“听”出暴力声音,如窗子破碎的声音、人尖叫与咒骂声音等,并让镜头转向声音的方向。开发者欲从现场的声音波形中进行模糊数据分析,以识别异常。

索尼公司新近推出了IMZ-RS400系列智能监控软件[129]。该软件与索尼配套的视频网络联合使用,主要实现了6种基本报警机制。这6种报警机制是:

(1)穿过—用户可设置一条虚拟的边线,当有物体穿过边线时报警,可用在如公路上的安全栏杆边的监控,当有人翻越时报警。

(2)出现—设置一个虚拟区域,当有物体出现其中时报警,可用在禁人、物进入区域的监控。

(3)消失—当虚拟区域中有目标物体消失时报警,可用于重要物品防盗监控。

(4)容量—当虚拟区域中目标物体的数量超过一个指定数值时报警,可用在如博物馆电影院公共场所人数控制报警。

(5)存在—当目标在虚拟区域中存在的时间超过预定值时报警,如用在禁止停车区域的监控。

(6)离开—当无人看管目标物体离开虚拟区域超过预定时间时报警。

可见,IMZ-RS400系列智能监控软件抽象了现实中一些场合的异常模式,针对这些模式设计报警机制。系统中只识别人、物的进入、消失、移动方向、速度等,没有识别动作、频率、轨迹等行为。

中国科学院深圳先进技术研究院智能仿生研究中心研究开发的智能监控功能较IMZ-RS400系统软件又有了进步[130]。在其识别特异行为的功能中,可以看到数据挖掘应用的效果。北京智安邦科技有限公司推出的ZANB智能视频监控系列产品已实现在真实的环境中警戒区入侵检测、警戒线穿越检测、物品被盗或移动检测、早期火灾检测、人员异常聚集、倒地检测等功能[132]。该公司还为不同的行业提供完整的解决方案,如:部队仓库及重要单位智能安防系统、火车驾驶员疲劳检测系统、楼宇智能视频监控报警系统、机场安防消防智能视频监控报警系统、无人值守设施智能视频监控报警系统、周界(围栏、围墙)智能视频监控系统、石油石化企业智能视频监控系统、仓库安防消防智能视频监控系统、博物馆和文物保护单位安防消防智能视频监控系统、监狱智能视频监控系统等。另外,如Panasonic[133],Vidient[134],VistaScape[135]也均有商业的智能监控系统推出。

但仔细研究这些产品的功能就会发现,现有的视觉智能主要是对已知目标或指定行为进行识别,应用也限定在一些特定的场合,目前智能交通的应用比较广泛[131]。对于人的行为精确识别与理解还有待研究与开发。一些国际的学术期刊与学术会议也对相关研究进行了集中展示,以方便学习和交流[136]。但由于现实世界的复杂性和人的行为的动态性,相关研究还面临许多挑战,如:

(1)现实的背景是复杂多变的,目前的研究成果要走出实验室还有些距离。

(2)由于多个人之间可能会有遮蔽、有的人可能会有部分部位出现在镜头之外、有些人可能穿着宽松的衣服等,识别人的各种行为技术还不成熟。

(3)视频识别计算量很大,要达到实时和预测还需要深入研究。

图像特征具有模糊性,人对图像的识别也具有模糊性,模糊理论在图像处理中应用较有实效。数据挖掘、模糊挖掘理论与技术已得到了大发展,相关算法效率已达到实用。数据挖掘在视频识别中的应用研究一般称为视频挖掘。视频挖掘技术的目标是实现视频图像的低级特征向高级语义信息的转换,从大量视频数据中自动提取隐含的、有用的、可以理解的模式或知识,为人们提供问题求解层次的智能或智力支持[138]。目前美国和日本均有小组专门进行视频挖掘的研究[138]。利用模糊数据挖掘技术研究运动目标的特征提取、运动目标行为识别、趋向判断和异常检测,将有力促进数据挖掘、模糊理论与图像处理技术的融合。