首页 理论教育主成分分析与因子分析及其R应用

主成分分析与因子分析及其R应用

【摘要】:实际上主成分分析可以说是因子分析(factor analysis)的一个特例.主成分分析从原理上是寻找椭球的所有主轴.因此,原先有几个变量就有几个主成分.而因子分析是事先确定要找几个成分(component),也称为因子(factor)(从数学模型本身来说是事先确定因子个数,但统计软件是事先确定因子个数,或者把符合某些标准的因子都选入).变量和因子个数的不一致使得不仅在数学模型上,而且在计算方法上

实际上主成分分析可以说是因子分析(factor analysis)的一个特例.主成分分析从原理上是寻找椭球的所有主轴.因此,原先有几个变量就有几个主成分.而因子分析是事先确定要找几个成分(component),也称为因子(factor)(从数学模型本身来说是事先确定因子个数,但统计软件是事先确定因子个数,或者把符合某些标准的因子都选入).变量和因子个数的不一致使得不仅在数学模型上,而且在计算方法上,因子分析和主成分分析有不少区别.因子分析的计算要复杂一些.根据因子分析模型的特点,它还多一道工序:因子旋转(factor rotation),这个步骤可以使结果更加使人满意.当然,对于计算机来说,因子分析并不比主成分分析多费多少时间(可能多一两个选项罢了).和主成分分析类似,也根据相应特征值大小来选择因子.

因子分析是由英国心理学家Spearman在1904年提出来的,他成功地解决了智力测验得分的统计分析,长期以来,教育心理学家不断丰富、发展了因子分析理论和方法,并应用这一方法在行为科学领域进行了广泛的研究.因子分析可以看成主成分分析的推广,它也是多元统计分析中常用的一种降维方式,因子分析所涉及的计算与主成分分析也很类似,但差别也是很明显的:

(1)主成分分析把方差划分为不同的正交成分,而因子分析则把方差划归为不同的起因因子.

(2)主成分分析仅仅是变量变换,而因子分析需要构造因子模型.

(3)主成分分析中原始变量的线性组合表示新的综合变量,即主成分.而因子分析中潜在的假想变量和随机影响变量的线性组合表示原始变量.(www.chuimin.cn)

因子分析与回归分析不同,因子分析中因子是一个比较抽象的概念,而回归变量有非常明确的实际意义.

因子分析有确定的模型,观察数据在模型中被分解为公共因子、特殊因子和误差三部分.

根据研究对象的不同,因子分析可分为R 型和Q 型两种.当研究对象是变量时,属于R 型因子分析;当研究对象是样品时,属于Q 型因子分析.