首页 理论教育美国授予哲学博士学位的对应分析

美国授予哲学博士学位的对应分析

【摘要】:原教材中用MATLAB给出了美国授予哲学博士学位的对应分析,现在用R来进行对应分析.表11-1的数据是美国在1973年到1978年间授予哲学博士学位的数目(美国人口调查局,1979年),试用对应分析方法分析该组数据.如果把年度和学科作为两个属性变量,年度考虑1973年至1978年这6年的情况(6个类目),学科也考虑6种学科,那么表11-1就是一张两个属性变量的列联表.本实验采用两种方法,分别对表1

原教材中用MATLAB给出了美国授予哲学博士学位的对应分析,现在用R来进行对应分析.

表11-1的数据是美国在1973年到1978年间授予哲学博士学位的数目(美国人口调查局,1979年),试用对应分析方法分析该组数据.

如果把年度和学科作为两个属性变量,年度考虑1973年至1978年这6年的情况(6个类目),学科也考虑6种学科,那么表11-1就是一张两个属性变量的列联表.

本实验采用两种方法,分别对表11-1中的数据进行对应分析.

表11-1 美国1973年—1978年间授予哲学博士学位的数据

方法1:

(1)根据表11-1导入数据并进行χ2 检验——考察行变量和列变量是否独立

>x1=c(4489,4101,3354,2444,3338,1222)

>x2=c(4303,3800,3286,2587,3144,1196)

>x3=c(4402,3749,3344,2749,2959,1149)

>x4=c(4350,3572,3278,2878,2791,1003)

>x5=c(4266,3410,3137,2960,2641,959)

>x6=c(4361,3234,3008,3049,2432,959)

>X=data.frame(x1,x2,x3,x4,x5,x6)

>rownames(X)=c("L","P","S","B","E","M")

>chisq.test(X)

结果如下:

由于p 值远小于0.05,所以行变量和列变量不独立,即6个行点(学科)和6个列点(年份)有密切关系,可以进一步进行对应分析.

(2)计算行列得分

>library(MASS)

>ca2=corresp(X,nf=2)

>rownames(X)=c("L","P","S","B","E","M")

>ca2

结果如下:

(www.chuimin.cn)

(3)作对应分析图

>biplot(ca2);abline(v=0,h=0,lty=3)

结果如图11-1所示.

图11-1 行点和列点的散点图

在图11-1中x1,x2,x3,x4,x5,x6 分别代表1973,1974,1975,1976,1977,1978年的数据.

分析行点和列点的散点图时主要看两种散点的横坐标之间的距离(纵坐标的距离对于分析意义不大).

由图11-1可看出,6个行点(学科)和6个列点(年份)可以分为三类(其对应关系如下):第一类包括“行为科学(B)”,它在1978年授予的博士学位数目的比例最大;第二类包括“社会学(S)”和“生命科学(L)”,它们在1975年至1977年授予的博士学位数目的比例都是逐年下降;第三类包括“物理学(P)”“工程学(E)”和“数学(M)”,它们在1973年和1974年这两年授予的博士学位数目的比例最大.

以上结果与原教材中用MATLAB给出的结果是一致的.

方法2:

(1)(如果已导入数据)进行对应分析

>library(ca)

>a<-ca(X)

>a

结果如下:

在以上结果中,Dim.1和Dim.2是提取的两个因子对行、列变量的因子载荷(行列得分).

(2)使用函数“plot( )”提取对应分析的结果——画散点图

>plot(a)

结果如图11-2所示.

图11-2 行点和列点的散点图

在图11-2中x1,x2,x3,x4,x5,x6 分别代表1973,1974,1975,1976,1977,1978年的数据.

由图11-2可看出,6个行点(学科)和6个列点(年份)可以分为三类,其对应关系与方法1相同.

以上的方法1和方法2的结果是一致的(方法1中的行列得分与方法2中的Dim.1和Dim.2是一致的,图11-1和图11-2也是一致的),并且它们都与原教材中用MATLAB给出的结果是一致的.