目前, 世界各国所装备和正在发展的各种弹药有数百种。弹药有多种分类方法, 可从不同的角度进行分类。枪弹是从枪膛内发射的弹药, 主要对付人员及薄装甲目标, 结构与定装式炮弹类似。装核弹头的大、中型中远程导弹, 主要打击固定战略目标, 起威慑作用。......
2025-09-29
1.多分类器融合
过去10多年中,对分类器研究的焦点从单个分类器的研究转移到多分类系统的研究。多分类器融合就是融合多个分类器提供的信息,得到更加精确的分类结果。融合多分类器的特长是系统研究的目标,其必要性体现在两个方面[91]:
(1)分类方法有很多,这些方法是基于不同的理论框架提出来的。每种分类器各有优点,对于特定的应用问题,都能够取得一定的成功。但是,没有一种方法适应所有的应用需求。从大量的实验和应用中发现,不同的分类器对于分类模式具有互补的信息,可以利用互补信息来提高识别性能。
(2)对于复杂的识别问题,输入的特征变量较多。变量类型、表现形式不同。对于不同表现形式和不同物理含义的特征变量,进行归一化处理非常困难,难以用一个分类器来处理。另外,当输入特征向量较大时,分类器的结构将变得非常复杂,限于样本的规模,学习的程度也不同。利用信息融合的思想,可能设计一个性能优良的高维输入分类器问题转化成多个性能较优的低维输入分类器的设计问题,为高维特征空间的划分和高可行性分类器的设计提供一个新的思路。
根据各分类器提供的信息的级别,多分类器的融合可分为以下3种类型[91]:
(1)决策层融合,即单个分类器输出为某个确定的类标号。假设R个分类器e1,e2,…,eR对同一输入标本x进行分类,事件ek(x)=jk表示分类器ek把x划分到Wjk中,其中,jk∈Λ∪{M+1},{M+1}表示分类器ek拒识x,k=1,2,…,R。决策层融合就是利用这些事件构造一个集成的分类器e对x进行分类,输出一个确定的类别号,e(x)=j,j∈Λ∪{M+1}。多数据投票法和BKS方法均是决策层的多分类器融合方法。
(2)排序层融合,即单个分类器输出为样本属于各类的可能性的一个排序列表。对于输入x,每个分类器ek(x)产生一个子集Lk⊆Λ,且Lk中标签排列成一个序列。排序层融合就是利用事件ek(x)=Lk,k=1,2,…,R,构造一个集成的分类器e,对x进行分类,输出一个确定的类别号,e(x)=j,j∈Λ∪{M+1}。
(3)度量层融合,即单个分类器输出为样本属于相应类的程度。对于输入x,每个分类ek(x)器产生一个度量向量Me(k)=[mk(1),mk(2),…,mk(M)]T,其中,mk(i)表示s属于相应类wi的程度。度量层融合就是利用事件ek(x)=Me(k),k=1,2,…,R,构造一个集成的分类器e,对x进行分类,输出一个确定的类别号,e(x)=j,j∈Λ∪{M+1}。
3类方法利用的分类器输出信息量集资增多,相应地也可能得到更好的结果。
2.分类算法性能评估
分类精度是度量分类效果的最主要指标,一般定义为被分类器正确分类的对象数与被分类的所有对象数之比。为测量分类精度,一般将数据集随机划分为两个部分:一个作为训练数据集;另一个则作为测试数据。通常训练集包含初始数据集的2/3的数据,而其余的1/3则作为测试数据集的内容。利用训练集数据学习获得一个分类器,然后使用测试数据集对该分类器分类精度进行评估。这种评估过程一般被称为holdout[97]。holdout评估分类器过程示意如图2.13所示(来源于文献[97]中图4.16)。由于仅使用初始数据集中的一部分进行学习,因此对所得分类器预测精度的估计应是悲观的估计。随机取样是holdout方法的一种变化。在随机取样方法中,重复利用holdout方法进行精度评估k次,最后对这k次所获得的精度求平均,来获得最终的精度值。

图2.13 用holdout方法评估分类器精度的过程
k-交叉检验(k-cross validation)是随机二次抽样方法的交叉验证。初始数据集被随机分为k个互不相交的子集S1,S2,…,Sk,每个子集大小基本相同。学习和测试过程分别进行k次,每一次选择一个子集作为测试集,其他子集则合并到一起构成一个大训练数据集,通过学习获得分类器,对测试集进行测试,获得精度。一般第1次选择S1作为测试集,第2次选择S2作为测试集……最终的精度可用k次测试的平均精度来表征。
除精度外,评估分类算法性能的还包括其速度、鲁棒性、可规模性和可解释性等。鲁棒性一般评估分类器对噪声的敏感程度;可规模性可以通过计算给定分类算法在渐增的数据集上的I/O操作次数评估;可解释性是主观的度量。
对于不平衡数据集的二分类问题,数据集中只有大类和小类两类,由于两类数据比例不均衡,精度值一般不能准确表征分类的效果。例如,对于网络访问数据集,其记录一般90%以上是大类数据,是正常访问的数据,小于10%的记录是入侵访问。如果简单地将所有记录判定成正常记录,其正常记录的分类精度也会大于90%,而这个值是无意义的。在这类数据集中,二类记录不是同等重要的,受关注的是小类记录,一般称为正类样本,而大类记录称为负类样本。为此,一些新的度量指标是必需的[97]。为说明这些指标,需声明4个数值术语的定义:真正、假负、假正、真负[97]。混淆矩阵是用来表示这4个术语的汇总表格,其示意如表2.2所示(源于文献[97]中的表5.6)。
1)真正(true positive,TP)对应于被分类模型正确预测的正样本数。
2)假负(false negative,FN)对应于被分类模型错误预测为负类的正样本数。
3)假正(false positive,FP)对应于被分类模型错误预测为正类的负样本数。
4)真负(true negative,TN)对应于被分类模型正确预测的负样本数。
表2.2 类不同等重要的二分类问题混淆矩阵

真正率(true positive rate,TPR),也称灵敏度(sensitivity),或称召回率(recall),被定义为模型正确预测的正样本的比例,即:
![]()
真负率(true negative rate,TNR),也称特指度(specificity),定义为被分类器正确预测的负样本的比例,即:(https://www.chuimin.cn)
![]()
假正率(false positive rate,FPR),定义为被分类器预测为正类的负样本比例,即:
![]()
假负率(false negative rate,FNR),定义为被分类器预测为负类的正样本比例,即:

那么,前述的精度即被正确分类的正样本数与被正确分类的负样本数之和占全部样本数的比例,表达为:

可以构造一个基线模型,它最大化其中一个度量而不管另一个。例如,将每个记录都声明为正类,则召回率永远是1,但它的精度等值会很差。构建一个最大化精度和召回率的模型是分类算法的一个主要挑战。
另外,一个可以调和精度和召回率的指标F 1被定义为:
![]()
接受者操作特征曲线(receiver operating characteristic curve,ROC)是显示分类器真正率和假正率之间折中的一种图形化方法[97]。在ROC图中,一般x轴表示假正率(在SPSS分析结果图中用1-sepecificity标记),y轴表示真正率(也称灵敏度,在SPSS的分析结果图中用sensitivity标记),其示意如图2.14所示[来源于本书第3.4节的图3.6(a)]。

图2.14 ROC曲线示例
ROC曲线上有几个关键点:
1)(TPR=0,FPR=0):把每个实例都预测为负类的模型。
2)(TPR=1,FPR=1):把每个实例都预测为正的模型。
3)(TPR=1,FPR=0):理想模型。
如果一个ROC曲线越靠图的左上角,则分类器的性能就越好。主对角线上对应的分类器应是一个随机分类的模型。
ROC曲线下方的面积提供了评价分类器平均性能的一种方法。理想模型ROC曲线下方的面积等于1。随机分类模型ROC曲线下方的面积等于0.5。如果一个分类器ROC曲线下方面积大于另一个分类器ROC曲线下方面积,则其性能好于另一个分类器。
欲绘制ROC曲线,分类器应当能够产生可以用来评价它预测的连续值输出,从最有可能成为正类的记录到最不可能成为正类的记录进行排序。利用排序后的序列绘制ROC曲线的过程一般为[97]:
1)选择正类可能性最高的记录,把选择的记录和可能性低于它的记录指定为负类,相当于把所有记录均指定为负类。那么,所有负类均被正确分类,所有正类均被错误分类,TPR=FPR=0。
2)从排序序列中取下一记录,把选择的记录和可能性低于它的记录指定为负类,相当于只把第一个记录指定为正类,计算此时的TPR和FPR的值。
3)重复步骤2),并计算TPR和FPR的值,直到序列中所有的值计算完。
4)根据产生的TPR和FPR的值绘制ROC曲线。
相关文章
目前, 世界各国所装备和正在发展的各种弹药有数百种。弹药有多种分类方法, 可从不同的角度进行分类。枪弹是从枪膛内发射的弹药, 主要对付人员及薄装甲目标, 结构与定装式炮弹类似。装核弹头的大、中型中远程导弹, 主要打击固定战略目标, 起威慑作用。......
2025-09-29
活塞式蓄能器的结构如图5-1a所示,图5-1b所示为活塞式蓄能器的图形符号。皮囊式蓄能器的优点是气囊体积小,重量轻,惯性小,反应灵敏,可吸收压力冲击和脉动,因此是目前应用最广泛的一种蓄能器。......
2025-09-29
但是,由于液压马达和液压泵的工作条件不同,对它们的性能要求也不一样,所以同类型的液压马达和液压泵之间仍存在许多差别。液压马达按其结构类型不同可以分为齿轮式、叶片式、柱塞式和其他形式,按液压马达的额定转速可分为高速和低速两大类。低速液压马达的基本形式是径向柱塞式,其主要特点是排量大,转速低,因此可直接与工作机构连接,不需要减速装置,使传动机构大为简化。......
2025-09-29
与玻璃型护栏的护壁板垂直水平面布置结构类似,直型金属护栏的护壁板也是呈垂直布置状态的区别在于两者的材质不同。因此,在正常情况下,金属材质护壁板相对于玻璃材质护壁板安全性更高。该护栏结构与直型金属护栏在结构组成上除了护壁板的倾斜角度和没有内盖板的区别之外,并无大的区别。......
2025-09-29
图4-22是一个典型的多挡转速控制线路,它由主电路和控制电路两部分组成。该线路采用了KA0~KA3共4个中间继电器,其常开触头接在变频器的多挡转速控制输入端,线路还用了SQ1~SQ3共3个行程开关来检测运动部件的位置并进行转速切换控制。图4-22所示线路中的变频器在运行前需要按前述方法设置多挡控制参数。3)中速转低速运转。按下按钮SB2→KA0线圈失电→STF端子外接KA0常开触头断开,切断STF端子的输入。图4-23 变频器输出频率变化曲线......
2025-09-29
通常情况下为方便制作及管理,可将上述几种结构的玻璃型护栏的特点归纳为:区别仅在于玻璃以上的部分,玻璃以下的部分的结构基本相同。标准型玻璃护栏的照明装置需根据要求进行配置,目前,市场上通用的照明灯常选用多根冷极灯管组合而成。......
2025-09-29
不同用途的弹药, 其威力要求也是不同的。弹药的威力大, 可以相应地减少弹药消耗量, 缩短完成战斗任务的时间。为了适应现代战争的需要, 用什么标准来衡量弹药威力的大小, 是一个值得进一步研究的问题。总的来说, 具体威力标准的提出与目标类型、弹药毁伤机理和战术使用等因素相关。表1-2弹药的威力指标影响弹药威力大小的因素有很多, 对具体弹药应当进行具体的分析。对此, 将在以后各章中分别予以说明。......
2025-09-29
常温下铜的热导率比铁大8倍,在1000℃时铜的热导率比铁大11倍。常用的铜及铜合金有纯铜、黄铜、青铜和白铜等四种。除铍青铜外,其他青铜的导热性比纯铜和黄铜低几倍至几十倍,而且结晶区较窄。......
2025-09-29
相关推荐