实际上主成分分析可以说是因子分析(factor analysis)的一个特例.主成分分析从原理上是寻找椭球的所有主轴.因此,原先有几个变量就有几个主成分.而因子分析是事先确定要找几个成分(component),也称为因子(factor)(从数学模型本身来说是事先确定因子个数,但统计软件是事先确定因子个数,或者把符合某些标准的因子都选入).变量和因子个数的不一致使得不仅在数学模型上,而且在计算方法上......
2023-11-18
主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。在实际问题研究中,为了全面、系统地分析问题,必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析也就是希望用较少的变量去解释原来资料中的大部分变量,将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量。通常是选出比原始变量个数少,能解释大部分资料中变量的几个新变量,即所谓主成分,并用以解释资料的综合性指标。由此可见,主成分分析实际上是一种降维方法[3]。
因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重),运用这种研究技术,我们还可以为市场细分做前期分析。
和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术的帮助更好地解释。而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这种情况也可以使用因子分析做到,所以它们的区分不是绝对的。
可以说,因子分析是主成分分析的推广,也是一种把多个变量化为少数几个综合变量的多变量分析方法,其目的是用有限个不可观测的隐变量来解释原始变量之间的相关关系。
因子分析主要用于:减少分析变量个数;通过对变量间相关关系探测,将原始变量进行分类。即将相关性高的变量分为一组,用共性因子代替该组变量。
有关基于内容的服装图像情感语义识别和检索的文章
实际上主成分分析可以说是因子分析(factor analysis)的一个特例.主成分分析从原理上是寻找椭球的所有主轴.因此,原先有几个变量就有几个主成分.而因子分析是事先确定要找几个成分(component),也称为因子(factor)(从数学模型本身来说是事先确定因子个数,但统计软件是事先确定因子个数,或者把符合某些标准的因子都选入).变量和因子个数的不一致使得不仅在数学模型上,而且在计算方法上......
2023-11-18
主成分分析法的主要优点包括:①可消除评估指标之间的相关影响。对于其他评估方法,由于难以消除评估指标间的相关影响,所以选择指标时要花费较多精力,而主成分分析法可以消除这种相关影响,所以在指标选择上相对容易些。对纽约交通事故进行主成分分析,从分析结果可以看出,KMO取样适宜性数量为0.491,巴特利特球形度检验的近似卡方值为1533.013,自由度为36,显著性小于0.001。表4.2旋转后的成分矩阵......
2023-06-15
那就是这些被选的主成分所代表的主轴的长度之和占了主轴长度总和的大部分.有些文献建议,所选的主轴总长度占所有主轴长度之和的大约80%即可.其实,这只是一个大体的说法;具体选几个,要看实际情况而定.但如果所有涉及的变量都不那么相关,就很难降维.不相关的变量就只有自己代表自己了.......
2023-11-18
为了说明什么是数据的主成分,先从数据降维说起。一般来讲,n维空间中的n个点一定能在一个n-1维子空间中分析。在上一段中,我们可以认为数据降维后并没有丢弃任何东西,因为这些数据在平面以外的第三个维度的分量都为0。主成分分析的思想:将n维特征映射到k维上(k<n),这k维是全新的正交特征。这k维特征称为主成分,是重新构造出来的k维特征,而不是简单地从n维特征中去除其余n-k维特征。......
2023-06-21
图3-21为科龙458系列电磁炉整机电路。图3-20 主电路原理图时间t1~t2时当开关脉冲加至V1的G极时,V1饱和导通,电流i1从电源流过L1,由于线圈感抗不允许电流突变。2)当V6>V5时,V7转态为OFF,V5亦降至VD12与VD13的顺向压降,而V6则由C5经R54、VD29放电。3)V6放电至小于V5时,又重复1)形成振荡。......
2023-06-18
2009年14个首批沿海开放城市(大连市、秦皇岛市、天津市、烟台市、青岛市、连云港市、南通市、上海市、宁波市、温州市、福州市、广州市、湛江市、北海市)实现地区生产总值达到60 003.47亿元,全国国内生产总值为335 353.00亿元,首批沿海开放城市地区生产总值占全国的17.9%,大大高出了人口占全国的比重(7.1%).在遵循合理性、代表性、系统性、可比性、可操作性及可获得性的原则下,选取了能......
2023-11-18
USJudgeRatings数据集(R 自带),该数据集来自psych包,需加载以及调用psych包.(1)首先查看USJudgeRatings数据集的信息该数据集包含了律师对美国高等法院法官的评分,数据包含43个观测值,12个变量.12个变量如下:CONT:律师与法官的接触次数;INTG:法官正直程度;DMNR:风度;DILG:勤勉度;CFMG:案例流程管理水平;DECI:决策效率;PREP:审......
2023-11-18
,xp 表示p 门课程,c1,c2,…+cp xp.我们希望选择适当的权重能更好地区分学生的成绩.每个学生都对应一个这样的综合成绩,记为s1,s2,…,sn.如果这些值很分散,表明区分得好,就是说,需要寻找这样的加权,能使s1,s2,…,sn 尽可能的分散,下面来看它的统计定义.设X1,X2,…,Xp 表示以x1,x2,…,xp 为样本观测值的随机变量,如果能找到c1,c2,…,c1p)使得Var的值达到最大;(c21,c22,…,c3p)同时垂直于(c11,c12,…......
2023-11-18
相关推荐