首页 理论教育探索行为识别方法的结论及意义

探索行为识别方法的结论及意义

【摘要】:结果表明,如果能采集到合适的“C→A”规则,并让其在分类中起作用,可以有效提高分类精度。证明了以下结论:1)具有方向性质的形状特征对行为的表征能力好于单纯的形状特征。结论说明以差分序列为源探索行为识别方法的可行性,这是这部分工作的意义所在。进一步联合差分序列的运动特征提高了表达行为的鲁棒性,且不降低表观特征的表征能力。

数字技术的广泛应用和数据存储技术的快速进步形成了海量数据积累。数据挖掘是一类数据分析技术,它将传统的数据分析方法与处理大量数据的复杂算法相结合。其任务包括频繁项集挖掘、关联规则挖掘、聚类、分类、特异数据挖掘和时间序列挖掘等。随着网络与多媒体技术的发展,数据的形式更加多样化,数量日益增大,这对数据挖掘算法的研究和数据挖掘与领域知识技术的融合都提出了新的挑战。本书的研究工作以数据挖掘算法分析与改进为基础,分析了相关算法在智能视频监控领域的应用构架,对行为识别的视频特征进行了分析与验证,具体内容有:

(1)研究了利用聚类来简化全局特异数据挖掘计算的方法。特异数据被定义为在数据集中只被少数对象拥有,并且与其他数据显著不同的数据。特异数据挖掘算法有两类:一类是基于密度的局部特异数据挖掘;一类是基于距离的全局特异数据挖掘。Zhong Ning等人提出了一种基于距离的全局特异数据挖掘算法,计算一个数据的特异程度,要计算其与其他所有数据的距离之和,其计算时间复杂度为O(N2),其中,N是数据集的势。如果先将数据集根据距离聚类,聚类后数据较多的类和距离数据集平均值很近的类,其类中的每一个数据都不可能成为特异数据,将这样的类按其均值整体参加运算。只有很少的小类中的数据每一个单独参加运算,这样可将运算复杂度降低到O(n2),其中,n是单独参加运算的数据个数与整体参加运算的大类的类个数之和。由特异数据的特点,n可能远小于N,从而大大提高了运算效率。实验表明,基于聚类的特异数据挖掘算法其挖掘特异数据能力强于Zhong Ning教授的原算法,与基于密度的局部特异数据挖掘算法的能力相当,时间效率显著好于Zhong Ning教授的算法。

(2)研究了规则“C→A”在分类中的作用。分类是有监督的机器学习与识别过程,C 4.5算法、CBA算法等被归类为基于规则的分类算法。这类算法的共同点是采集和利用形如“A→C”的规则特征,其中,A表示全部或部分条件属性的一些取值组成的集合,C表示某个类标号。在逻辑上,“A→C”表示A对C的支持,而“C→A”表示A对C的必要,在分类中如果能利用“C→A”的特征也许会提高分类精度。按这样的想法,编制了两种实验方法,方法1只考虑“A→C”的影响,方法2考虑“A→C”和“C→A”的影响。两种方法时间复杂度均为线性的。分别在UCI机器学习库的5个分类集Mushroom、Wine、Zoo、Breast和KDDCUP99网络访问记录数据集上进行了实验测试。结果表明,如果能采集到合适的“C→A”规则,并让其在分类中起作用,可以有效提高分类精度。并且,对不平衡数据集,只有小类的规则被采集和利用,具有生成规则集小,训练与测试时间线性的优势。

(3)分析了视频监控技术现状,提出一种智能监控系统的构架,提出并验证一类行为识别的视频特征。监控系统构架中数据由原始录像的视频文件、模式和实时数据3层构成。从原始录像中提取数据形成特征模式,由特征识别行为,由行为确定异常。观察人运动的2D视频,不同的运动行为在一定程度上表现为人身体不同部位的伸与缩。将人运动前景矩形在横和纵方向上划分为均匀的区间,采集这些区间的宽度及其内部空档变化的序列,以序列的频率和时间平均方差构成特征向量。为了验证此特征对行为识别的有效性,采用线性判别式方法、支持向量机方法、k最近邻方法、线性参数分类方法等模式识别方法,进行了分类交叉检验、特征值分析,进行了不同粗细划分的特征数据识别精度对比,进行了不同视频分段的识别精度对比。并对数据集进行了线性判别分析与特异分析。实验结果表明,当视频分段长度达到一定值,区间划分达到一定精细程度时,利用特征数据能有效识别不同的行为,特征向量的各分量在分类中均有效。并且,特征数据线性可分性较好,具有较好的“不同类别间的特征值距离较远,同一类别内的特征距离较近”特性。

(4)从全前景序列和从差分序列中提取了10个方面的表观特征,利用属性选择和投票的方法进行了分析。证明了以下结论:

1)具有方向性质的形状特征对行为的表征能力好于单纯的形状特征。

2)基于差分序列的特征对行为的表征能力稍强。

结论说明以差分序列为源探索行为识别方法的可行性,这是这部分工作的意义所在。进一步联合差分序列的运动特征提高了表达行为的鲁棒性,且不降低表观特征的表征能力。

当然,计算机视觉技术还在发展,适应复杂场景的行为分析方法还有待深入探索。本书的方法是基于全局特征的,全局特征对遮蔽很敏感。另外,基于差分的方法可能对群体行为的识别有优势,因为在群体行为视频中全景个体提取更加困难。人类可以利用局部的少量特征识别行为,进一步深化人类的感知特点,开发更鲁棒和实用的方法是计算机视觉持久努力的方向。