首页 理论教育应用多元统计分析:对应分析简介

应用多元统计分析:对应分析简介

【摘要】:因子分析是用少数几个公共因子去提取研究对象的绝大部分信息,既减少了因子的数目,又把握住了研究对象的相互关系.在因子分析中根据研究对象的不同,分为R 型和Q 型,如果研究变量的相互关系时则采用R 型因子分析;如果研究样品间相互关系时则采用Q 型因子分析.但无论是R 型或Q 型都未能很好地揭示变量和样品间的双重关系,另一方面当样品容量n 很大(如n>1 000),进行Q型因子分析时,计算n 阶方阵的特

因子分析是用少数几个公共因子去提取研究对象的绝大部分信息,既减少了因子的数目,又把握住了研究对象的相互关系.在因子分析中根据研究对象的不同,分为R 型和Q 型,如果研究变量的相互关系时则采用R 型因子分析;如果研究样品间相互关系时则采用Q 型因子分析.但无论是R 型或Q 型都未能很好地揭示变量和样品间的双重关系,另一方面当样品容量n 很大(如n>1 000),进行Q型因子分析时,计算n 阶方阵的特征值和特征向量对于普通的计算机而言,其容量和速度都是难以胜任的.还有进行数据处理时,为了将数量级相差很大的变量进行比较,常常先对变量作标准化处理,然而这种标准化处理对样品就不好进行了,换言之,这种标准化处理对于变量和样品是非对等的,这给寻找R 型和Q 型之间的联系带来一定的困难.

针对上述问题,在20世纪70年代初,由法国统计学家Benzecri提出了对应分析方法,这个方法是在因子分析的基础上发展起来的,它对原始数据采用适当的标度方法.把R 型和Q 型分析结合起来,同时得到两方面的结果——在同一因子平面上对变量和样品一起进行分类,从而揭示所研究的样品和变量间的内在联系.对应分析由R 型因子分析的结果,可以很容易地得到Q 型因子分析的结果,这不仅克了服样品量大时作Q 型因子分析所带来计算上的困难,且把R 型和Q 型因子分析统一起来,把样品点和变量点同时反映到相同的因子轴上,这就便于我们对研究的对象进行解释和推断.

基本思想:由于R 型因子分析和Q 型因子分析都是反映一个整体的不同侧面,因而它们之间一定存在内在的联系.对应分析就是通过对应变换后的标准化矩阵将两者有机地结合起来.

具体地说,首先给出变量间的协方差矩阵SR=BT B 和样品间的协方差矩阵SQ=BBT,由于BT B 和BBT 有相同的非零特征值,记为λ1 ≥λ2 ≥…≥λm>0,如果SR 的特征值λi 对应的标准化特征向量vi,则SQ 对应的特征值λi 的标准化特征向量为(www.chuimin.cn)

由此可以很方便地由R 型因子分析而得到Q 型因子分析的结果.

由SR 的特征值和特征向量即可写出R 型因子分析的因子载荷矩阵(记为AR)和Q 型因子分析的因子载荷矩阵(记为AQ):

由于SR 和SQ 具有相同的非零特征值,而这些特征值又正是各个公共因子的方差,因此可以用相同的因子轴同时表示变量点和样品点,即把变量点和样品点同时反映在具有相同坐标轴的因子平面上,以便对变量点和样品点一起考虑进行分类.