首页 理论教育对应分析的原理和依据:应用多元统计分析

对应分析的原理和依据:应用多元统计分析

【摘要】:,λm 对应的特征向量,且.矩阵代数的这几个结论为我们建立了因子分析中R 型与Q 型的关系.借助以上引理11.2.2和引理11.2.3,我们从R 型因子分析出发可以直接得到Q 型因子分析的结果.由于SR 和SQ 有相同的非零特征值,而这些非零特征值又表示各个公共因子所提供的方差,因此变量空间Rp 中的第一公共因子、第二公共因子…

将原始数据矩阵A 变换为B 矩阵后,记SR=BT B,SQ=BBT,SR 和SQ 这两个矩阵存在明显的简单的对应关系,而且将原始数据aij 变换为bij 后,bij 关于i,j 是对等的,即bij变量和样品是对等的.

为了进一步研究R 型与Q 型因子分析,我们利用矩阵代数的一些结论.

引理11.2.2 设SR=BT B,SQ=BBT,则SR 和SQ 的非零特征值相同.

引理11.2.3 若v是BT B 相应于特征值λ 的特征向量,则u=Bv是BBT 相应于特征值λ 的特征向量.

定义11.2.1 (矩阵的奇异值分解)设B 为n×p 矩阵,且

rank(B)=m ≤min(n-1,p-1),

BT B 的非零特征值为λ1 ≥λ2 ≥…≥λm>0,令,则称di 为B 的奇异值.

如果存在分解式(www.chuimin.cn)

其中,U 为n×n 正交矩阵,V 为p×p 正交矩阵,Λ=,这里Λm=diag(d1,d2,…,dm),则称分解式B=UΛVT 为矩阵B 的奇异值分解.

记U=(U1⋮U2),V=(V1⋮V2),Λm=diag(d1,d2,…,dm),其中U1 为m×n 的列正交矩阵,V1 为p×m 的列正交矩阵,则奇异值分解式(11.2.4)等价于

引理11.2.4 任意非零矩阵B 的奇异值分解必存在.

引理11.2.4的证明就是具体求出矩阵B 的奇异值分解式(高惠璇,统计计算(1995)).从证明过程中可以看出:列正交矩阵V1 的m 个列向量分别是BT B 的非零征值为λ1,λ2,…,λm 对应的特征向量;而列正交矩阵U1 的m 个列向量分别是BBT 的非零征值为λ1,λ2,…,λm 对应的特征向量,且

矩阵代数的这几个结论为我们建立了因子分析中R 型与Q 型的关系.借助以上引理11.2.2和引理11.2.3,我们从R 型因子分析出发可以直接得到Q 型因子分析的结果.

由于SR 和SQ 有相同的非零特征值,而这些非零特征值又表示各个公共因子所提供的方差,因此变量空间Rp 中的第一公共因子、第二公共因子…,直到第m个公共因子,它们与样本空间Rp 中对应的各个公共因子在总方差中所占的百分比全部相同.

从几何的意义上看,即Rp 中诸样品点与Rp 中各因子轴的距离平方和,以及Rp 中诸变量点与Rp 中相对应的各因子轴的距离平方和是完全相同的.因此可以把变量点和样品点同时反映在同一因子轴所确定的平面上(即取同一个坐标系),根据接近程度,可以对变量点和样品点同时考虑进行分类.