首页 理论教育基于R的USJudgeRatings数据集主成分分析

基于R的USJudgeRatings数据集主成分分析

【摘要】:USJudgeRatings数据集(R 自带),该数据集来自psych包,需加载以及调用psych包.(1)首先查看USJudgeRatings数据集的信息该数据集包含了律师对美国高等法院法官的评分,数据包含43个观测值,12个变量.12个变量如下:CONT:律师与法官的接触次数;INTG:法官正直程度;DMNR:风度;DILG:勤勉度;CFMG:案例流程管理水平;DECI:决策效率;PREP:审

USJudgeRatings数据集(R 自带),该数据集来自psych包,需加载以及调用psych包.

(1)首先查看USJudgeRatings数据集的信息

该数据集包含了律师对美国高等法院法官的评分,数据包含43个观测值,12个变量

12个变量如下:

CONT:律师与法官的接触次数;

INTG:法官正直程度;

DMNR:风度;

DILG:勤勉度;

CFMG:案例流程管理水平;

DECI:决策效率

PREP:审理前的准备工作;

FAMI:对法律的熟稔程度;

ORAL:口头裁决的可靠度;

WRIT:书面裁决的可靠度;

PHYS:体能;

RTEN:是否值得保留.

(2)计算相关系数矩阵

(3)进行主成分分析

(www.chuimin.cn)

Standard deviation 为主成分的标准差,proportion of variance 为贡献率,cumulative of proportion为累计贡献率.从以上计算结果中可以得出每个成分的贡献率、累计贡献率:对于成分一的贡献率为0.844 458 6;成分二的贡献率为0.092 012 25,前两个成分的累计贡献率达0.936 470 89,因此可以选取两个主成分.

(4)画碎石图

>fa.parallel(USJudge Ratings,fa="pc",n.iter=100,show.legend=FALSE,main="screeplot")

结果如图9-2所示.

图9-2 碎石图

从图9-2(碎石图)也可以看出,选取两个主成分比较合理.

(5)计算特征值以及特征向量

可以得到特征值为10.133 5,1.104 1,0.332 9,0.253 8,0.084 4,0.037 3,0.019 7,0.015 4,0.007 8,0.005 6,0.003 3,0.002 1.

综合前面所选取的主成分个数,可以得出两个主成分,分别为:

(6)计算主成分得分及主成分排名

从以上排名结果可以看出:RUBINOW,J.E.排名第一;NARUK,H.J.排名第二;BERDON,R.I.排名第三;COHEN,S.S;遗憾排名最后.

由于判断法官综合能力的变量有限仅为12个变量,排名结果可能不能完全地体现各位法官的综合能力,因此排名可能并非全面,结果仅供参考.