在生物医药领域,功能性染色体、蛋白质组成和生物制药的研究在近10年中进展迅猛。DNA序列构成了所有生命基因代码的基础,氨基酸是构成蛋白质的基石,其中包含着生命特征的决定信息,分析其结构序列是生物研究的重要手段。数据挖掘技术在生物领域研究中扮演着重要角色,如多蛋白质序列中的连接、检索、相似性搜索和对比分析;基因网络和蛋白质路径的结构分析;共生基因序列的关联分析等[25]。...
2023-06-16 理论教育
在生物医药领域,功能性染色体、蛋白质组成和生物制药的研究在近10年中进展迅猛。DNA序列构成了所有生命基因代码的基础,氨基酸是构成蛋白质的基石,其中包含着生命特征的决定信息,分析其结构序列是生物研究的重要手段。数据挖掘技术在生物领域研究中扮演着重要角色,如多蛋白质序列中的连接、检索、相似性搜索和对比分析;基因网络和蛋白质路径的结构分析;共生基因序列的关联分析等[25]。...
2023-06-16 理论教育
聚类分析发现强相关的对象组,而特异检测发现不与其他对象强相关的对象。图3.8K-means聚类方法与CpecuFind发现特异数据能力ROC曲线K-means聚类;CpecuFind表3.6K-means与CpecuFind发现特异数据能力ROC曲线面积对比上述对比说明,只简单地以簇类大小和对象与类心距离来评估对象的特异程度结果很粗糙,其评价特异数据的能力远不如Cpecu Find方法。...
2023-06-16 理论教育
本章方法基于第6章描述的差分图像,前述的光流计算方法用于差分图像会有一些限制,例如:差分图像是二值图像,所有的前景灰度和所有的背景灰度均相同,在灰度匹配时产生误差的可能性增加了。差分图像中前景成分很少,利用全局计算方法运算浪费严重。在前景范围内平滑光流向量。图7.2差分图像序列(第1行)、利用Horn-Schunck方法计算的光流场序列(第2行)和用新方法计算的光流场序列(第3行)...
2023-06-16 理论教育
模式识别是一门以应用为基础的学科,其目的是利用计算机实现人的类识别能力。进行处理分析前需要对这些连续量进行离散化。,xM中选择N个,使可分性判据J的值满足式(2.2),即:J(x1,x2,…这类方法称为变换法,主要有基于可分性判据的特征提取选择、基于误判概率的特征提取选择、离散K-L变换法及基于决策界的特征选择等。3)指数相似系数。...
2023-06-16 理论教育
,k只用来标识特征序号,不表示特征的顺序。图7.3光流的(u,v)坐标和四方向、八方向划分示意图光流的(u,v)坐标和四方向示意图;光流的(u,v)坐标和八方向示意图图7.4从各行为视频中采集m1~m12散点图四方向运动速度。结果达到了目标,如图7.4所示,图中每个行为,利用了15长度的差分光流场序列,提取出15×12的特征数据,显示在一个散点图中。...
2023-06-16 理论教育
针对不平衡数据集的分类问题是一类重要的分类问题,在网络入侵检测、信用卡欺诈识别及疾病诊断等领域有实际应用。表4.6中显示的是整个数据集的分类精度,在不平衡数据集中,小类是被关注的对象,其被识别的精度更能反映算法的性能判别。在4个数据子集Sub1、Sub2、Sub3、Sub4中,包含8个攻击类和一个正常类。图4.24个子集的规模与训练时间的关系图4.34个子集的规模与测试时间的关系...
2023-06-16 理论教育
利用前述的特征,在Weizmann行为数据库和KTH行为数据库上进行了实验测试。实验包括分类测试、特征贡献测试和鲁棒性测试。表7.1本章方法与近期相关方法比较续表本章的测试程序用Matlab实现。另外的测试表明处理“弯腰”视频的一帧需0.74s。利用子集进行识别测试,测试精度结果显示如图7.6所示。表7.2在特殊“走”行为视频上的精度测试结果在KTH行为数据库上的测试。...
2023-06-16 理论教育
本实验目标是测试必要规则对分类的影响,将采用最简单的方法。但相对实验目标,方法是有效的。表4.1示例训练集D训练时,设充分置信度阈值为70%,必要置信度阈值为90%,K=3。表4.2第2次访问D后得到簇与类关联关系的统计数据依据表4.2数据计算双向置信度,得到的分类规则按类索引,结果如表4.3所示,表4.3就是训练得到的规则集R。表4.3D训练得到的分类规则表测试时,分两种方法。...
2023-06-16 理论教育
由线性判别函数的设计过程可知,对于线性可分集,总能找到使模式样本正确划分的解。d维空间中线性判别函数的一般形式为g=ωX+b,分类面方程为:ωX+b=0将判别函数进行归一化,使两类所有样本都满足|g|>1,这样分类间隔就等于2/‖ω‖。对于线性不可分问题,可以用类似于广义线性判别函数的方法,通过事先选择好的非线性映射将输入模式向量映射到一个高维空间,在这个空间中构造最优分界超平面。...
2023-06-16 理论教育
区域和轮廓是最直接的表观特征。对于一帧图像,从前景区域和轮廓中提取的特征可以表示姿态或姿势。这种方法利用当前帧与背景图像的差分图像中具有较大差值的区域来获取前景。获得了前景图像,之后的首要问题就是什么样的特征可以有效表达行为。本章的目标是对比差分序列中的表观特征和全前景序列中的表观特征对行为的表征能力。...
2023-06-16 理论教育
当最近邻法应用于特定的一组样本时,所得到的错误率与样本的偶然有关。K-近邻法是最近邻法的一个显然的推广。无论是最近邻法还是K-近邻法,它们都有方法简单的优点,而且其错误率在贝叶斯错误率和两倍贝叶斯错误率之间。正是近邻法的这种优良性质,使它成为模式分类的重要方法之一。快速搜索近邻法考虑将样本分级分成一些不相交的子集,并在子集的基础上进行搜索。...
2023-06-16 理论教育
差分序列可以在一些场合提供支持信息用于进一步的精确分割。为了减少前景重叠带来的困难,本章和下一章中将利用的是半差分图像序列,为了表达方便,并且不至于引起混淆,以下所提及的差分图像均指半差分图像。另外,差分图像比全前景图像获取更容易,计算相对简单。图6.2全前景图像序列、差分图像序列和半差分图像序列的示例图6.3“走”视频的示例图像...
2023-06-16 理论教育
数据挖掘就是综合应用一系列先进的技术从大量数据中提取人们感兴趣的信息和知识,它们是隐含的、事先未知且潜在有用的概念、规则、规律及模式等。这个概念诠释了数据挖掘的3个要点:数据挖掘要处理的数据量是巨大的。因此,高效率常常是数据挖掘算法研究的目标。4)数据转换:数据要被转换和整理,使其符合挖掘程序的格式。图2.1典型的数据挖掘系统构架...
2023-06-16 理论教育
Apriori算法[3]是单维、单层、布尔关联规则挖掘算法,是最简单形式的关联规则挖掘。该算法是挖掘产生布尔关联规则频繁项目集的经典算法,对关联规则挖掘研究有着重要影响。图2.3Apriori-gen算法Apriori算法调用Apriori-gen,生成所有频繁项集,如图2.4所示。Apriori算法假定数据库驻留在内存中。Apriori算法之后,学者们不断研究其改进算法及其他思想的关联规则挖掘算法,取得了很多成果。图2.4Apriori算法图2.5找出频繁项集L后生成关联规则算法...
2023-06-16 理论教育
一种表示闭区域外形凹凸描述符如图6.4所示[172]。为了避免维缩减过程,将360°方向划分为8个扇区,如图6.4所示。引用Hu的7个矩作为形状与前述特征不同的表示,它们是m20~m26。图6.6几个从右到左运动的行为的路径...
2023-06-16 理论教育
基于密度的局部特异数据挖掘方法的文献一般基于两个基本概念:k-distance和DB-outlier。显然,k-distance越大,p点附近的点密度越低,p的特异程度越高。从而确定了这类方法与统计方法的一致性。正态分布的特异定义DefNormal:p是特异的,当且仅当,此定义将正态分布中与均值距离不小于3的对象称为是特异的。说明了当参数μ=3时,泊松分布的特异数据界定。泊松分布的特异数据定义DefPoisson为:p是特异的,当且仅当,p≥8。...
2023-06-16 理论教育