区域和轮廓是最直接的表观特征。对于一帧图像,从前景区域和轮廓中提取的特征可以表示姿态或姿势。这种方法利用当前帧与背景图像的差分图像中具有较大差值的区域来获取前景。获得了前景图像,之后的首要问题就是什么样的特征可以有效表达行为。本章的目标是对比差分序列中的表观特征和全前景序列中的表观特征对行为的表征能力。......
2023-06-16
1.建模与识别
马尔可夫链是一种描述时间序列变化规律的随机过程。它的限定条件是历史有限性,也就是当前状态只与前一个状态有关。隐马尔可夫模型HMM是一个符合包含隐含状态的马尔可夫链的统计模型。尽管人的运动不完全符合历史有限性,但很多研究都表明人的行为可以由HMM有效建模[163,164,176]。
一个HMM是5元组:μ=(S,O,∏,A,B)。其中,S和O是状态集合和观察集合,∏是初始状态矩阵,A是状态之间的转换概率矩阵,B是从状态到观察的转换矩阵。利用具有同一行为标签的一组观察,通过最大化概率P(O|μ)可以获得模型μ。利用各行为的观察数据学习得到的模型表示为{μ1,μ2,…,μi,…}。一个新的、没有行为标签的观察,计算它与各个HMM模型的似然度,将它分类为最大似然的类别,就是argmax P(O|μi)。利用HMM进行训练和识别行为的流程如图6.7所示。
本章和第7章中HMM的训练和识别利用的是Kevin Murphy的贝叶斯工具,其中包含了HMM的训练和似然度计算模块[176,177]。
图6.7 HMM模型训练与利用H MM进行识别的流程图
2.利用选择属性来测试各特征的贡献
Weizmann行为数据库中包含90个视频。每个视频又被划分为视频段。大家都希望在尽量短的视频段中可以识别行为。经过实验测试,15帧一段视频足够获取好的识别效果。当然,是针对这个视频帧速和本章利用的特征与建模方法来讲的。以差分序列为例,获取的差分序列中包含15个差分的图像。之后,前述的特征被提取,获得15长度的特征序列。在计算差分序列时,连续3帧或更多没有运动的帧被忽略掉,因为没有运动的帧就意味着差分图像中没有前景,也就没有特征可以提取。最终,获得的特征数据是31×15的序列,称差分序列的原始全特征序列。从全前景序列中提取的特征数据仍是31×15的序列,称全前景序列的原始全特征序列。作为比较,以下的测试将分别在这两类特征序列上进行。
测试利用留一策略(leave-one-out):对于一种行为的特征序列集,随机抽取一个序列作为测试序列;利用其他的序列进行HMM训练,获得HMM模型;利用获得的模型对保留的测试序列进行测试;这个过程进行多次,计算测试精度。在HMM中,利用高斯混合模型来规划观察,因为特征是连续值。测试中,隐藏状态设为2个,高斯混合模型设为3个。这两个参数有变动时,测试精度有少量改变。每次测试为10个行为中的每个行为保留一特征序列作为测试序列,另外的序列用来训练HMM。之后,对保留的10个序列进行测试,计算识别精度。
为了测试前述特征集中不同特征对行为识别的贡献程度,也为了对比从全前景序列中提取的特征数据与从差分序列中提取的特征数据对不同行为识别的效果,从两套原始全特征序列中进行了组合型特征选择,形成特征子集。利用两套特征子集进行行为识别测试,测试结果对比显示如图6.8和图6.9所示。其中,x轴表示选择的特征子集的构成,y轴表示利用相应子集测试后的精度对比。图中的每个精度值均为30次测试的平均精度,精度值的标注是百分比重。从两图中可以看出最高的识别精度达到了98%。并且有:
图6.8 从两个数据来源的特征数据对行为识别的贡献对比(1)
图6.9 从两个数据来源的特征数据对行为识别的贡献对比(2)
(1)对于单项特征,F1和F2对行为识别效果最好,表明具有方向的外观特征能更好地表征姿态。Hu矩(F5)也可以表达形状,但是它们是对位置、伸缩及旋转不变的,也就是说这些特征丢失了,所以只用Hu矩来识别行为效果不好。F3、F4、F6~F10也可以表达形状,但是每个特征只表达了形状的一些方面,单独使用效果不好。
(2)通过联合使用多种特征,精度普遍提高了。应该说每种特征都对行为识别有贡献,但不是特征用得越多识别效果越好,联合全部特征并不能获得最好的精度。例如,差分序列中F2联合F3和F4后比只利用F2的精度更低了。在一定程度上,F6~F10与F1~F2表达的信息有重叠,而F3~F4表达的信息与F1~F2所表达的信息很不同。因此,可以看到联合F1~F4效果要好于F1~F2与F6~F10的联合。
(3)特别说明,在10个单独特征中,有7个来源于差分序列的数据识别能力高于来源于全景序列的数据;在24个联合特征中,13个来源于差分序列的数据识别能力高于来源于全景序列的数据。这个结果表明,差分序列中包含的识别行为的信息多于或者不少于全景序列中的信息。
3.通过投票识别行为
为了提高测试效果,又进行了投票方法的测试。考虑投票方法有两个原因:
(1)前述特征集中的所有特征均对行为识别有效。
(2)单纯联合更多的特征并不能提高识别精度。
根据选择测试的结果,将前述特征组成5个群(feature groups,FGs)。每个群有一个投票权重,权重值来源于组合测试中的精度。这些特征群如下:
FG1-F1,在差分序列特征中权重是92.7%,全景序列中权重是90%。
FG2-F2,在差分序列特征中权重是97%,全景序列中权重是94.3%。
FG3-F3、F4,在差分序列特征中权重是82.7%,全景序列中权重是78.3%。
FG4-F5,在差分序列特征中权重是82.3%,全景序列中权重是87.3%。
FG5、F6~F10,在差分序列特征中权重是81%,全景序列中权重是84.7%。
测试仍遵循留一测试。利用FG集训练HMM,留下的序列用于测试。每个FG的投票有自己的权重,测试序列最终被判定为得票加权权重最大的行为类别。如图6.10所示显示了FG投票测试的结果。图中每个精度是30次测试的平均值。
将图6.10与图6.8和图6.9对比,对于来源于差分序列的数据,16个精度中,9个投票方法获得的精度高于对应的组合方法获得的精度;对于来源于全景序列的数据,16个精度中,12个投票方法获得的精度高于对应的组合方法获得的精度。如图6.10所示的16个精度,12个基于差分序列的数据测试精度高于基于全前景序列的数据测试精度。
FG1、FG2和FG4基于差分序列特征数据识别精度均达到98%。如图6.11所示中显示了这个测试的混淆矩阵,以进一步观察识别效果。可以看到,其中running、jumping sideways、skipping和walking有些混淆。观察这些行为的差分序列,可以看到它们确是相似的。
图6.10 来源于两种序列的特征群投票识别行为结果对比
图6.11 FG1,FG2和FG4投票方法运动30次获取的混淆矩阵
将本章的工作效果与近期的一些研究结果进行比较,如表6.1所示。表中的测试数据均来源于Weizmann行为数据库。可以看到,Blank等人的工作识别精度很高,他们的方法提取数据时需解Poisson等式,这个过程很耗时。从数字上讲,本章方法的识别精度与现时流行方法精度相当,而且只利用了差分序列三方面表观特征即可获取精度98.3%,这与其他方法比较,有一定优势。
表6.1 本章方法的识别精度与近期工作中方法的识别精度对比
本章方法利用Matlab实现。所用的计算机处理器频率是2.26GHz,内存12GB。以从差分序列提取特征为例,从Jumping行为包含72帧、播放时间是2.88s的一段视频中提取特征数据需4.84s,包括计算差分图像和提取31个特征值。因此,处理1帧的平均时间约为0.067s。在FG1、FG2和FG4投票方法中,利用HMM识别一个序列中的行为需0.049s。由此可以说本章的方法达到了实时识别。
有关数据挖掘算法及在视频分析中的应用的文章
区域和轮廓是最直接的表观特征。对于一帧图像,从前景区域和轮廓中提取的特征可以表示姿态或姿势。这种方法利用当前帧与背景图像的差分图像中具有较大差值的区域来获取前景。获得了前景图像,之后的首要问题就是什么样的特征可以有效表达行为。本章的目标是对比差分序列中的表观特征和全前景序列中的表观特征对行为的表征能力。......
2023-06-16
观赏型体育消费直接影响体育竞赛表演业的发展,是一个国家体育发展水平的重要标志。纵观体育消费市场我们可以发现,从事观赏型体育消费的人数非常有限,且大多是真正的体育迷才会在体育赛事方面花费金钱。这些都是体育消费态度的变化。......
2023-10-17
,xp,用向量表示X=(x1,x2,…,βp 为待估参数.Logistic回归模型中的参数估计常用极大似然估计法得到.设y 是0-1变量,x1,x2,…,n),取P=πi,P=1-πi,则yi 的联合概率函数为,yi=0,1;i=1,2,…,yn 的似然函数为对数似然函数为对于Logistic回归,将代入,得令=0,可以用数值计算求待估参数β0,β1,β2,…,βp 的极大似然估计.用R 软件可以解决Logistic回归模型中的参数估计、检验等问题.......
2023-11-18
王璐瑜申琦本文通过问卷调查法与实验法等混合研究方法,以上海大学生为研究对象,运用心理学中的信息精细化加工可能性模型探讨人们在智能手机新闻客户端阅读新闻时,日常的媒介多任务使用与社交网络假新闻判别力之间的关系。......
2023-11-08
另外,从影响力度上来说,网络社会临场感这一社交网络使用心理因素对乡村居民社会资本的积极影响要强于社交网络使用行为。对于农民与社会资本这一对关系来说,乡村居民社会资本一直是维持乡村社会秩序、整合乡村资源和保持乡村自身平衡的主要资源。[2]由此,乡村居民社会资本在遇到社交网络技术后又一次得到了新的发展机会。......
2023-11-08
在该对话框中单击按钮,系统弹出图3.23.21所示的“信息”窗口,在弹出的“信息”窗口中会列出指定的信息,包括分析点的个数、两个对象的最小距离误差、最大距离误差、平均距离错误、最小角度误差、最大角度误差、平均角度误差以及各检查点的数据。图3.23.20 选择对象图3.23.21 “信息”窗口Step4.检查曲线至面的偏差。说明:进行曲线至面的偏差检查时,选取图3.23.22所示的曲线1和曲面为检查对象。......
2023-11-20
本部分拟利用分层模型来分析和检验农村社区和农户个体特征差异两个层次变量对合作行动的互动影响。目的是确定分层模型的适用性及个体因素和社区因素对合作意愿的解释程度。随机截距模型该模型假定因变量的截距随着群体而异,但各群体的回归斜率是固定的。模型参数估计和检验使用HLM6.01软件来进行,数据进行平均对中处理。......
2023-06-28
相关推荐