为了说明什么是数据的主成分,先从数据降维说起。一般来讲,n维空间中的n个点一定能在一个n-1维子空间中分析。在上一段中,我们可以认为数据降维后并没有丢弃任何东西,因为这些数据在平面以外的第三个维度的分量都为0。主成分分析的思想:将n维特征映射到k维上(k<n),这k维是全新的正交特征。这k维特征称为主成分,是重新构造出来的k维特征,而不是简单地从n维特征中去除其余n-k维特征。......
2025-09-29
如果用x1,x2,…,xp 表示p 门课程,c1,c2,…,cp 表示各门课程的权重,那么加权之和就是
s=c1 x1+c2 x2+…+cp xp.
我们希望选择适当的权重能更好地区分学生的成绩.每个学生都对应一个这样的综合成绩,记为s1,s2,…,sn(n 为学生人数).如果这些值很分散,表明区分得好,就是说,需要寻找这样的加权,能使s1,s2,…,sn 尽可能的分散,下面来看它的统计定义.设X1,X2,…,Xp 表示以x1,x2,…,xp 为样本观测值的随机变量,如果能找到c1,c2,…,cp,使得方差
的值达到最大,则由于方差反映了数据差异的程度,因此也就表明我们抓住了这p个变量的最大变异.当然,式(9.1.1)必须加上某种限制,否则权值可选择无穷大而没有意义,通常规定
在此约束下,求式(9.1.1)的最优解.由于这个解是p 维空间的一个单位向量,它代表一个“方向”,它就是常说的主成分方向.
一个主成分不足以代表原来的p 个变量,因此需要寻找第二个乃至第三、第四主成分,第二个主成分不应该再包含第一个主成分的信息,统计上的描述就是让这两个主成分的协方差为零,几何上就是这两个主成分的方向正交.具体确定各个主成分的方法如下.
设Zi 表示第i个主成分(i=1,2,…,p),可设(https://www.chuimin.cn)
其中,对每一个i,均有,且(c11,c12,…,c1p)使得Var(Z1)的值达到最大;(c21,c22,…,c2p)不仅垂直于(c11,c12,…,c1p),而且使Var(Z2)的值达到最大;(c31,c32,…,c3p)同时垂直于(c11,c12,…,c1p)和(c21,c22,…,c2p),并使Var(Z3)的值达到最大;以此类推可以得到全部p 个主成分,这项工作用手工做是很繁琐的,但借助于计算机很容易完成.剩下的是如何确定主成分的个数,我们总结在下面几个注意事项中.
(1)主成分分析的结果受量纲的影响,由于各变量的单位可能不一样,如果各自改变量纲,结果会不一样,这是主成分分析的最大问题,回归分析是不存在这种情况的,所以实际中可以先把各变量的数据标准化,然后使用协方差矩阵或相关系数矩阵进行分析.
(2)使方差达到最大的主成分分析不用转轴(由于统计软件常把主成分分析和因子分析放在一起,后者往往需要转轴,使用时应注意).
(3)主成分的保留.用相关系数矩阵求主成分时,Kaiser主张将特征值小于1的主成分予以放弃(这也是SPSS软件的默认值).
(4)在实际研究中,由于主成分的目的是为了降维,减少变量的个数,故一般选取少量的主成分(不超过5或6个),一般只要它们能解释变异的70%~80%(称累积贡献率)就可以了.
相关文章
为了说明什么是数据的主成分,先从数据降维说起。一般来讲,n维空间中的n个点一定能在一个n-1维子空间中分析。在上一段中,我们可以认为数据降维后并没有丢弃任何东西,因为这些数据在平面以外的第三个维度的分量都为0。主成分分析的思想:将n维特征映射到k维上(k<n),这k维是全新的正交特征。这k维特征称为主成分,是重新构造出来的k维特征,而不是简单地从n维特征中去除其余n-k维特征。......
2025-09-29
主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。当然,这种情况也可以使用因子分析做到,所以它们的区分不是绝对的。可以说,因子分析是主成分分析的推广,也是一种把多个变量化为少数几个综合变量的多变量分析方法,其目的是用有限个不可观测的隐变量来解释原始变量之间的相关关系。因子分析主要用于:减少分析变量个数;通过对变量间相关关系探测,将原始变量进行分类。......
2025-09-30
对4 种植物不同器官的生物量、δ13C 值组成及N、P、K 营养元素含量进行主成分分析,结果如表6-5 所示,最终得到3 个特征值大于1的主成分,累计百分比为78.95%,可以反映原始指标的大部分信息。表6-5不同主成分的特征值和累积贡献值 Table 6-5Principal component variance analysis表6-6主成分载荷矩阵 Table 6-6Principal Component Load Matrix图6-5干旱胁迫对4 种植物生物量、δ13C 值及营养元素影响的主成分分析 Fig.6-5The principal component analysis of the effects of drought stress on biomass, δ 13C value and nutrient elements of 4 plant species......
2025-09-30
进行烟气成分分析的仪器种类很多,有化学方法进行分析的,也有用物理方法进行分析的。(一)奥氏气体分析仪1.烟气成分分析中的取样方法所取样品应能代表烟气的平均成分,反映烟气的真实情况,为正确判断与分析燃料燃烧状况,合理操作窑炉提供依据。氨气吸收液将10ml浓硫酸加入90ml蒸馏水中即可。重复上述操作2~3次,可以认为气体分析器已被待测烟气洗净。......
2025-09-30
表3.10给出了长江干支流控制站持续3个月枯季径流占年径流百分数。表3.11为长江宜昌以上地区1~3月份枯季径流组成情况及干流年际变化情况。金沙江、岷江及区间枯季径流所在比重较大。......
2025-09-30
无论车间属于哪种类型,车间的组成必须齐全。一般车间年产量在5000t以上,工人300人以上,应成立工段一级。少于以上年产量和工人数的车间,一般只成立小组,每小组人数最好为10~30人。......
2025-09-29
2.除锈铁锈的主要成分是FeO、Fe2O3、Fe3O4等,“四合一”处理液含有较高浓度的磷酸,其总酸度和游离酸度比普通磷化液要高得多,这些铁锈在游离酸的作用下被除去,反应式为FeO+2H3PO4→Fe2+H2O (5-9)Fe2O3+6H3PO4→2Fe3+3H2O Fe3O4+8H3PO4→Fe2+2Fe 3+4H2O 由于除锈能力强的盐酸和硫酸不能成膜,还会对磷酸盐膜产生破坏作用,所以处理液中不含盐酸和硫酸,只含磷酸,而磷酸除锈能力不太强,对于重锈所需的除锈时间太长,不利于后续处理。......
2025-09-29
相关推荐