表2.2不同识别算法在MSR-Action3D 数据集识别率对比图2.6在MSR-Action3D 数据集上识别率90.5%的混淆矩阵示意图第二个数据集是微软研究院于2012 年公开的MSRC-12 动作行为数据集[137]。同样使用最近邻分类器进行分类,其实验结果见表2.3,本章所述方法获得的动作识别率相应混淆矩阵如图2.7 所示。......
2023-10-28
利用前述的特征,在Weizmann行为数据库和KTH行为数据库上进行了实验测试。实验包括分类测试、特征贡献测试和鲁棒性测试。实验结果也与现有相关的研究结果做了比较。
(1)在Weizmann行为数据库上的精度测试。在Weizmann行为数据库上的每种行为有9个人表演,10种行为,90个视频。因为测试表明长度为15左右的视频段足以区分其中的行为,所以90个视频被划分为更多的视频段。首先计算连续视频帧的差分,再从连续的差分帧计算光流,每生成15长度的光流序列则划分为一段,从中提取前述特征获得28×15的特征数据。人的运动是对称的,例如:从左边走向右边和从右边走向左边,或者挥左手和挥右手等,为了获得更多的训练数据,将特征左右对称翻转获得双倍的数据。
测试仍遵循留一测试,仍利用HMM进行建模。利用高斯混合模型,模型数设为3,隐藏状态数设为2。一次测试中对每种行为保留一个特征序列(28×15的特征数据),同行为的其他序列作为训练数据建立HMM模型;获得10个模型后,对保留的10个序列进行测试,得到测试精度。为了减少随机因素的影响,做了100次测试,平均精度达到97.2%,其中细节如图7.5所示的混淆矩阵。从中可以到“Run”与“Skip”混淆较多,同时也可以看到这两个差分序列也很相似。
图7.5 100次测试的混淆矩阵
表7.1中显示了本章方法与近期方法的比较,所有测试结果均是在Weizmann行为数据库上获得的。本章方法测试精度不是最好的,但与其他方法的结果是有可比性的。本章方法的所有特征数据均来源于差分序列,并且特征数目也较少。另外,比如Saad Ali的方法中借助PCA进行降维操作,在Moshe Blank的方法中需要精确的轮廓特征来解Poisson分布方程。
表7.1 本章方法与近期相关方法比较
续表
本章的测试程序用Matlab实现。运行的计算机CPU频率1.73GHz,内存4GB。处理一段包含42帧的“跑”的视频用时58.14s,过程包括求差分、计算光流和提取特征数据。也就是说处理一帧的时间是1.38s。另外的测试表明处理“弯腰”视频的一帧需0.74s。利用获取的10个HMMs,识别一个特征序列的时间是0.017s。
(2)在Weizmann行为数据库上的特征贡献测试。为了测试不同特征对行为识别的贡献,将特征数据划分开,形成不同成分的子集。利用子集进行识别测试,测试精度结果显示如图7.6所示。x轴显示特征组合,y轴显示对应识别测试的精度。可以看出,只利用表观特征就可以达到全部特征的识别精度97.2%。似乎从光流场中提取的运动特征对行为识别精度没有贡献,不过接下来的实验结果中就可以看到运动特征对识别过程的鲁棒性的贡献。
图7.6 不同特征组合的子集在Weizmann行为数据库上测试精度
(3)在Weizmann特殊行为数据库上的鲁棒性测试。在Weizmann行为数据库中有一些特殊动作的“走”的视频。这些视频有两类,一类是“走”在水平方向不同视角的视频,角度有0°,5°,10°,15°,20°,25°,30°,35°,40°,45°;另一类是非常规“走”的视频,例如:走的时候,后面跟一个狗(_dog),走的时候,有一个箱子遮蔽了脚(_nofeet)等。利用前述正常“走”的视频特征训练HMM模型,利用这两类特殊“走”视频特征进行测试。测试时,将特征集划分为表观特征(m13~m28)、运动特征(m1~m12)和全部特征(m1~m28),测试结果如表7.2所示。
测试结果表明,运动特征表达行为的鲁棒性优于表观特征,将两类特征联合起来后,运动特征的鲁棒性一般可以保留下来。
表7.2 在特殊“走”行为视频上的精度测试结果
(4)在KTH行为数据库上的测试。KTH行为数据库是另一个在行为分析领域中应用较广泛的数据库[146]。第5章的实验测试也采用的是这个数据库。其中的视频有6种行为,分别是:boxing、handclapping、handwaving、jogging、running和walking。每个行为有25个人表演,表演的背景有4种情况,分别是不同服装、背包、光线变化和视角缩放变化,所以这个数据库是可以测验方法鲁棒性的视频。利用本章的方法进行行为识别测试,结果如图7.7所示。
如表7.3所示显示了本章方法与近期其他方法识别精度的对比。可以看出,本章方法的识别精度与其他方法是相当的。当然,如果在方法中增加精细的去噪过程会提高识别精度,因为观察视频直接计算得到的差分图像,可以看到明显的噪声。
图7.7 在KTH数据库上的测试结果
表7.3 在KTH视频数据库上的识别精度对比
当然,Weizmann和KTH均是流行的行分析数据库,一些方法在其上的测试已经达到了很高的精度[179,180,195,196],文中表7.2与表7.3中选择的对比方法与本章方法是有一定可比性的。例如:Rahman等人的方法在KTH上的测试精度达到了94.67%,但是其测试只选择了KTH视频中“情景1”的子集,这个子集是全部视频中噪声最小的[195],因此与我们的方法的结果不具有可比性。
有关数据挖掘算法及在视频分析中的应用的文章
表2.2不同识别算法在MSR-Action3D 数据集识别率对比图2.6在MSR-Action3D 数据集上识别率90.5%的混淆矩阵示意图第二个数据集是微软研究院于2012 年公开的MSRC-12 动作行为数据集[137]。同样使用最近邻分类器进行分类,其实验结果见表2.3,本章所述方法获得的动作识别率相应混淆矩阵如图2.7 所示。......
2023-10-28
目前,将神经网络应用于图像识别的文献很多[1,2],但用于服装图像的情感语义识别和检索还几乎没有,而本章及第4、第5章正是采用了神经网络对男西装图像情感语义识别和检索问题进行了探讨。图3-1男西装图像样本神经网络训练和入库的流程图3-3男西装图像情感语义检索的流程BP神经网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。......
2023-08-23
图6.7HMM模型训练与利用H MM进行识别的流程图2.利用选择属性来测试各特征的贡献Weizmann行为数据库中包含90个视频。以差分序列为例,获取的差分序列中包含15个差分的图像。最终,获得的特征数据是31×15的序列,称差分序列的原始全特征序列。如图6.10所示的16个精度,12个基于差分序列的数据测试精度高于基于全前景序列的数据测试精度。......
2023-06-16
1-1电阻、电容、电感的识别与简单测试1-1-1电阻的识别与检测1-1-1-1电阻基础知识电阻参数的识读主要有标称阻值、功率以及误差。在维修实践中发现,也有少数熔断电阻器在电路中被击穿短路的现象,检测时也应予以注意。1-1-2电容的识别与检测1-1-2-1电容基础知识电容器是一种储能元件,在电路中用于调谐、滤波、耦合、旁路、能量转换和延时等。......
2023-12-02
特征提取是人体动作识别的一个重要环节,高效、准确地提取特征可极大地提高动作识别率。学者们一般从两个方面进行底层视觉特征的提取:一是提取全局特征;二是提取局部特征。其目的是通过人体的形状轮廓信息获取全局特征。而对局部特征的提取方法,目前主要集中在提取时空兴趣点和动作运动轨迹两个方面。其优点是不易受到噪声和遮挡因素的影响,缺点是对提取的特征点准确性要求较高。下面简单介绍3 类特征提取方法。......
2023-10-28
表3.1在MoCap 动作序列上提取关键帧从实验可知,本章提出的关键帧提取算法可有效地提取具有代表性的动作序列帧,关键帧序列只占样本序列的2/3 甚至更少,其余的帧均为冗余信息。因此,关键帧提取对减少运算复杂度、提高动作识别率具有重要意义。在关键帧提取实验的基础上,又进行了动作序列的关键轨迹提取实验。......
2023-10-28
图7-10本节提出的纸币鉴别系统的原理图本节提出的纸币鉴别系统的具体实现流程如下所述。对测试纸币的红外图像进行灰度纹理特征提取。对测试纸币进行真伪鉴别。根据上述第步确定的测试纸币的面额,将上述第步提取的测试纸币的红外图像灰度纹理特征与标准真币特征数据库中相同面额真币的红外图像灰度纹理特征进行比较,根据预先设定的特征距离计算准则和判别阈值,鉴定测试纸币的真伪。......
2023-06-29
表4.2同类识别算法对比的平均识别率图4.4在MSRActionPairs 数据集上平均识别率91.5%的混淆矩阵示意图实验结论:①基于人物交互相似动作识别,本章提出的基于深度图像的多特征融合算法能达到91.5%的平均识别率,充分验证基于交互动作整体结构的识别算法在相似“动作对”中具有较好的辨识性和有效性。......
2023-10-28
相关推荐