首页 理论教育应用多元统计分析:iris数据集的判别分析

应用多元统计分析:iris数据集的判别分析

【摘要】:在实验2.3.2中曾对iris数据集进行描述和展示,在实验2.3.4中曾对iris数据集进行可视化,在实验7.4.1中曾对iris数据集进行聚类分析.通过实验2.3.2对iris数据集进行描述和展示,我们知道iris数据集是对3个品种(species)鸢尾花:setosa、versicolor和virginica各抽取一个容量为50 的样本,测量其花萼长度(Sepal.Lenth)、花萼宽度(Se

在实验2.3.2中曾对iris数据集进行描述和展示,在实验2.3.4中曾对iris数据集进行可视化,在实验7.4.1中曾对iris数据集进行聚类分析

通过实验2.3.2对iris数据集进行描述和展示,我们知道iris数据集是对3个品种(species)鸢尾花:setosa、versicolor和virginica各抽取一个容量为50 的样本,测量其花萼长度(Sepal.Lenth)、花萼宽度(Sepal.Width)、花瓣长度(Petal.Lenth)、花瓣宽度(Petal.Width).

现在对iris数据集进行判别分析,其代码如下:

>data(iris)

>attach(iris)

>names(iris)

>library(MASS)

>iris.lda<-lda(SpeciesSepal.Length+Sepal.Width+Petal.Length+Petal.Width)

>iris.lda

>iris.pred=predict(iris.lda)$class(www.chuimin.cn)

>table(iris.pred,Species)

>detach(iris)

结果如下:

以上结果说明:

(1)Group means:包含了每组的均值向量;

(2)Coefficients of linear discriminants:线性判别系数;

(3)Proportion of trace:表明第i判别式对区分各组的贡献大小;

(4)Species:表明将原始数据代入线性判别函数后的判别结果,setosa是没有错判,versicolor是有2个错判,virginica是有1个错判.