在实验2.3.2中曾对iris数据集进行描述和展示,在实验2.3.4中曾对iris数据集进行可视化.以下将对iris数据集进行进行聚类分析.根据实验2.3.4,我们只知道数据集内有三个品种鸢尾花而不知道每朵花的真正分类,只能凭借花萼及花瓣的长度和宽度分类.以下对鸢尾花iris数据集进行聚类分析,代码如下:>data(iris);attach(iris)>iris.hc1<-hclust(dist(......
2023-11-18
KDDCUP99数据集是网络访问数据记录集[117],它包含了若干个数据集,本书选用的是corrected.gz。其中的记录有两大类:正常访问记录和网络攻击记录,而网络攻击的记录又分为若干小类,在本实验中将只按两大类来区分记录。每个记录有42个属性,前41个是访问特征属性,最后一个属性是记录的类别标识。实验中可以选择前41个属性来计算特异因子。从corrected中按比例分别选择两类记录来构造若干子集,其中攻击记录所占比例均小于10%,以使其为特异记录。用“攻击记录数+正常记录数”来表示这些子集的记录规模,如“30+300”表示整个子集有330个记录,其中30个攻击记录,300个正常记录。分别在30+300、50+500、100+1000、200+2000、300+3000共5个子集上分别运行PecuFind算法程序和CpecuFind算法程序。在CpecuFind中,λ=10%,k=2。两个算法在30+300和50+500上的运行结果中,RPF值排序在前10%和15%的记录包含的攻击记录数显示于表3.3。很明显,Cpecu Find发现攻击记录的能力强于Pecu Find。
表3.3 30+300和50+500上的实验结果比较
有关数据挖掘算法及在视频分析中的应用的文章
在实验2.3.2中曾对iris数据集进行描述和展示,在实验2.3.4中曾对iris数据集进行可视化.以下将对iris数据集进行进行聚类分析.根据实验2.3.4,我们只知道数据集内有三个品种鸢尾花而不知道每朵花的真正分类,只能凭借花萼及花瓣的长度和宽度分类.以下对鸢尾花iris数据集进行聚类分析,代码如下:>data(iris);attach(iris)>iris.hc1<-hclust(dist(......
2023-11-18
染料在纤维上的固着是上染的最后阶段,它对染色牢度影响很大。染料在纤维上的固着,主要通过库仑力、范德瓦尔斯力、氢键、共价键、配位键等。因此在染料分子与纤维分子形成氢键的同时,原有的氢键将发生断裂。氢键的能量、作用半径都和范德瓦尔斯力的能量、作用半径属于一个数量级,染料和纤维分子中一般都含有供氢和吸氢基团,因此氢键也普遍存在于各纤维染色体系中。......
2023-06-15
图9-34比较了在不同任务规模下两种算法优化结果中的续传次数,MACA算法中的续传次数要低于NSGA-Ⅱ算法,平均减少了25.1%。图9-35是两种算法优化结果的资源负载失衡度,MACA算法与NSGA-Ⅱ算法结果相当,两算法的负载失衡度均在0.01以下。对本章场景仿真实验,分别得到整传调度和续传调度结果如图9-36和图9-37所示。......
2023-07-02
Wisconsin Breast Cancer数据集有699条记录,每条记录都是记录一位胸部有肿瘤的病人的特征数据。可以从中随机选择444条良性记录和39条恶性记录组成一数据集。文献[107]描述的是基于聚类的且基于密度局部特异数据挖掘方法—FindCBLOF,在Wisconsin Breast Cancer Data上的实验结果显示了其挖掘特异数据的能力在同类算法中是优越的。结果再次表明Cpecu Find挖掘特异数据的能力略优于pecu Find。表3.4Wisconsin Breast Cancer数据集上的实验结果比较......
2023-06-16
为了对本章提出的纹理图像特征提取和识别方法的性能进行评估,本节选择在两个常用的标准纹理图像数据库上进行实验,即CUReT纹理库[46]和KTH-TIPS纹理库[96]。图2-11CUReT纹理库的识别挑战性KTH-TIPS纹理库由10个类别的纹理材料组成,具体包括铝箔、砂纸、海绵、灯芯绒、亚麻布、棉织物、面包、橘子皮、聚苯乙烯泡沫和薄脆饼干。......
2023-06-29
对R 自带的stackloss数据集进行逐步回归.(1)首先显示stackloss数据集的信息其中,变量为stack.loss(氨气损失百分比),Air.Flow(空气流量),Water.Temp(水温),Acid.Conc.(硝酸浓度).(2)计算变量间的相关性——相关系数>cor(stackloss)结果如下:(3)散布图矩阵>library(car)>scatterplotMatrix(st......
2023-11-18
在R 软件中,有个MASS包,其中有一个caith数据集,是关于眼睛颜色和头发颜色的数据.(1)查看caith数据集的信息>library(MASS)>caith结果如下:从以上结果可以看出,caith数据集中眼睛颜色:blue,light,medium 和dark;头发颜色:fair,red,medium,dark和black.(2)进行χ2 检验——考察行变量和列变量是否独立>chisq.te......
2023-11-18
计算这些序列的频率和时间平均方差形成特征向量,利用此特征向量数据进行了多方面的实验,验证其在人的行为识别方面的有效性。实验表明,当分段长度达到30帧以上时,就可获得很高的分类精度,且分段长度的变化对识别精度影响就会很小了。......
2023-06-16
相关推荐