主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。当然,这种情况也可以使用因子分析做到,所以它们的区分不是绝对的。可以说,因子分析是主成分分析的推广,也是一种把多个变量化为少数几个综合变量的多变量分析方法,其目的是用有限个不可观测的隐变量来解释原始变量之间的相关关系。因子分析主要用于:减少分析变量个数;通过对变量间相关关系探测,将原始变量进行分类。......
2023-08-23
实际上主成分分析可以说是因子分析(factor analysis)的一个特例.主成分分析从原理上是寻找椭球的所有主轴.因此,原先有几个变量就有几个主成分.而因子分析是事先确定要找几个成分(component),也称为因子(factor)(从数学模型本身来说是事先确定因子个数,但统计软件是事先确定因子个数,或者把符合某些标准的因子都选入).变量和因子个数的不一致使得不仅在数学模型上,而且在计算方法上,因子分析和主成分分析有不少区别.因子分析的计算要复杂一些.根据因子分析模型的特点,它还多一道工序:因子旋转(factor rotation),这个步骤可以使结果更加使人满意.当然,对于计算机来说,因子分析并不比主成分分析多费多少时间(可能多一两个选项罢了).和主成分分析类似,也根据相应特征值大小来选择因子.
因子分析是由英国心理学家Spearman在1904年提出来的,他成功地解决了智力测验得分的统计分析,长期以来,教育心理学家不断丰富、发展了因子分析理论和方法,并应用这一方法在行为科学领域进行了广泛的研究.因子分析可以看成主成分分析的推广,它也是多元统计分析中常用的一种降维方式,因子分析所涉及的计算与主成分分析也很类似,但差别也是很明显的:
(1)主成分分析把方差划分为不同的正交成分,而因子分析则把方差划归为不同的起因因子.
(2)主成分分析仅仅是变量变换,而因子分析需要构造因子模型.
(3)主成分分析中原始变量的线性组合表示新的综合变量,即主成分.而因子分析中潜在的假想变量和随机影响变量的线性组合表示原始变量.(www.chuimin.cn)
因子分析与回归分析不同,因子分析中因子是一个比较抽象的概念,而回归变量有非常明确的实际意义.
因子分析有确定的模型,观察数据在模型中被分解为公共因子、特殊因子和误差三部分.
根据研究对象的不同,因子分析可分为R 型和Q 型两种.当研究对象是变量时,属于R 型因子分析;当研究对象是样品时,属于Q 型因子分析.
有关应用多元统计分析:基于R的实验的文章
主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。当然,这种情况也可以使用因子分析做到,所以它们的区分不是绝对的。可以说,因子分析是主成分分析的推广,也是一种把多个变量化为少数几个综合变量的多变量分析方法,其目的是用有限个不可观测的隐变量来解释原始变量之间的相关关系。因子分析主要用于:减少分析变量个数;通过对变量间相关关系探测,将原始变量进行分类。......
2023-08-23
USJudgeRatings数据集(R 自带),该数据集来自psych包,需加载以及调用psych包.(1)首先查看USJudgeRatings数据集的信息该数据集包含了律师对美国高等法院法官的评分,数据包含43个观测值,12个变量.12个变量如下:CONT:律师与法官的接触次数;INTG:法官正直程度;DMNR:风度;DILG:勤勉度;CFMG:案例流程管理水平;DECI:决策效率;PREP:审......
2023-11-18
主成分分析法的主要优点包括:①可消除评估指标之间的相关影响。对于其他评估方法,由于难以消除评估指标间的相关影响,所以选择指标时要花费较多精力,而主成分分析法可以消除这种相关影响,所以在指标选择上相对容易些。对纽约交通事故进行主成分分析,从分析结果可以看出,KMO取样适宜性数量为0.491,巴特利特球形度检验的近似卡方值为1533.013,自由度为36,显著性小于0.001。表4.2旋转后的成分矩阵......
2023-06-15
那就是这些被选的主成分所代表的主轴的长度之和占了主轴长度总和的大部分.有些文献建议,所选的主轴总长度占所有主轴长度之和的大约80%即可.其实,这只是一个大体的说法;具体选几个,要看实际情况而定.但如果所有涉及的变量都不那么相关,就很难降维.不相关的变量就只有自己代表自己了.......
2023-11-18
为了说明什么是数据的主成分,先从数据降维说起。一般来讲,n维空间中的n个点一定能在一个n-1维子空间中分析。在上一段中,我们可以认为数据降维后并没有丢弃任何东西,因为这些数据在平面以外的第三个维度的分量都为0。主成分分析的思想:将n维特征映射到k维上(k<n),这k维是全新的正交特征。这k维特征称为主成分,是重新构造出来的k维特征,而不是简单地从n维特征中去除其余n-k维特征。......
2023-06-21
2009年14个首批沿海开放城市(大连市、秦皇岛市、天津市、烟台市、青岛市、连云港市、南通市、上海市、宁波市、温州市、福州市、广州市、湛江市、北海市)实现地区生产总值达到60 003.47亿元,全国国内生产总值为335 353.00亿元,首批沿海开放城市地区生产总值占全国的17.9%,大大高出了人口占全国的比重(7.1%).在遵循合理性、代表性、系统性、可比性、可操作性及可获得性的原则下,选取了能......
2023-11-18
,xp 表示p 门课程,c1,c2,…+cp xp.我们希望选择适当的权重能更好地区分学生的成绩.每个学生都对应一个这样的综合成绩,记为s1,s2,…,sn.如果这些值很分散,表明区分得好,就是说,需要寻找这样的加权,能使s1,s2,…,sn 尽可能的分散,下面来看它的统计定义.设X1,X2,…,Xp 表示以x1,x2,…,xp 为样本观测值的随机变量,如果能找到c1,c2,…,c1p)使得Var的值达到最大;(c21,c22,…,c3p)同时垂直于(c11,c12,…......
2023-11-18
Harman74.cor数据集是R 软件自带的数据集,以下对该数据集进行因子分析.(1)查看Harman74数据集中(前面)部分信息Harman74.cor数据集,包含了对芝加哥郊区145名七年级和八年级儿童进行的24 项心理测试指标的相关系数矩阵.其中的24 项心理测试指标包括:VisualPerception,Cubes,PaperFormBoard,Flags,GeneralInformat......
2023-11-18
相关推荐