首页 理论教育因变量、自变量及测量方法

因变量、自变量及测量方法

【摘要】:下面结合问卷和上节中我们对相关问题的设计、概念化和命题化,探讨因变量和自变量及其测量的问题。根据以上问题形成的变量虽然在大多数情况下是被用作因变量的,但在验证假设3的时候也会被用作自变量来对因变量集2进行考察。

三、因变量自变量及其测量

我们所使用的数据来自中国人民大学社会学系和香港科技大学社会科学部2003年10月实施的“全国综合社会调查2003年城市问卷”收集到的数据。该数据调查了全国28个省份,样本量为5894人。这里着眼于问卷的H部分——被调查者“获得目前这个工作的情况”。

下面结合问卷和上节中我们对相关问题的设计、概念化和命题化,探讨因变量和自变量及其测量的问题。

(一)因变量集1:求职过程中渠道利用和关系选择

在求职过程中,渠道利用和关系选择可以从两个问题中比较集中地反映出来,这两个问题如下。

1.您在获得目前这个工作的过程中,尝试过哪些就业渠道?

2.在您所尝试过的就业渠道中,哪种渠道对您获得目前工作单位/公司的工作起了决定性作用?

第一个问题是多选题,第二个问题是单选题。对于这两个问题,问卷提供了8个备选项,分别如下:(1)顶替父母/亲属(285人认为该渠道在其获得目前工作单位/公司的工作中起了决定性作用,占总样本的4.8%;尝试过该渠道的人占总样本的5.5%);(2)国家分配/组织调动(上述三个数值分别为2214、37.6%、44.8%);(3)个人直接申请(上述三个数值分别为623、10.6%、14.5%);(4)职业介绍机构(上述三个数值分别为55、0.9%、2%);(5)人才交流会(上述三个数值分别为64、1.1%、2.8%);(6)托人介绍推荐(上述三个数值分别为669、11.4%、15.2%);(7)自雇(上述三个数值分别为460、7.8%、10.2%);(8)其他(上述三个数值分别为391、6.6%、9.6%)。对于这些选项,我们可以进行0—1编码,从而形成8个因变量。

面对具体问题,我们很快就会发现对“关系选择”进行界定是非常困难的事情。“尝试过托人介绍推荐”显然就是主动地利用关系,因为是多选,所以它不与其他渠道互斥;但是这并没有涵盖被动地利用关系的情形,也没有涵盖那些隐性地不为求职者察觉地利用关系的情形。

为了弥补这一不足,笔者在“尝试过托人介绍推荐”的基础之上融合了另外两个问题:“对您获得这份工作,您的亲友和熟人中有多少人帮忙打听信息,沟通情况,提供帮助?”“在帮助您找这个工作的人中,是否有人起过关键性的作用?”[8]对这三个问题的任何一个问题做出了肯定性回答的都被计入“求职者认定有关系作用”的合计值中(有1461名被调查者对此做出了肯定回答,占总样本的24.8%。这一数值大大低于边燕杰在天津观察到的45%。为何如此,留待后文作进一步解释)。当然,特别值得注意的是,这一合计值也没有涵盖隐性地利用关系的情形,因为隐性地利用关系意味着被调查者自己并不能察觉求职过程中事实存在的关系影响。

对于强关系与弱关系的区分标准及相关内涵,下文具体涉及的时候会作介绍。

根据以上问题形成的变量虽然在大多数情况下是被用作因变量的,但在验证假设3的时候也会被用作自变量来对因变量集2进行考察。

(二)因变量集2:收入的相对位置(www.chuimin.cn)

在结构分化的问题上,这里主要考察的是收入的相对位置。这一收入位置的确定主要通过参照各省的平均收入来进行。具体因变量是用各个有效个体的年收入值减去其所在省份的平均年收入值得出的。在该值的基础上,还可以衍生出其他一些因变量值,比如将被调查者划分为高于本省平均收入者和低于本省平均收入者,以及其他精度更高的划分等。

(三)自变量集1:基本情况

个人的一些基本情况是理所当然的自变量,不过笔者主要从可能影响行为者求职过程中的机会集合的角度来选择一些特定的自变量。

第一,户口被划分为两类。(0)城镇常住户口;(1)非城镇常住户口(包括当地有效城镇户口和农业户口以及其他)。

第二,找工作时的政治面貌被划分为两类。(0)还不是中共党员;(1)已经是中共党员。因为衡量的是当时的政治面貌对找工作的影响,所以不能简单地利用问卷中“您是否是中共党员”得出的答案,而是需要加入时间限定。好在问卷询问了入党时间,所以,可以通过数据转化,生成找工作时行为者是否是中共党员这一变量。

第三,这里对教育程度进行了一定程度的融合,可分为以下几类。(0)小学及以下;(1)初中—私塾;(2)高中—中专;(3)大专;(4)本科及以上。值得注意的是,有些人在获取现在这个职位之后,又继续上学,所以在考虑行为者获得目前这份工作的受教育程度时,需要将行为者当前的受教育程度与行为者是否在此时已经完成学历教育结合起来考虑。

第四,求职时已经获得的资格证书等级,可分为以下几类。(0)没有获得资格证书;(1)获得初级资格证书;(2)获得中级资格证书;(3)获得高级资格证书。这一点也要作时间因素的考虑。资格证书等级可以作为一个很强的信号传递求职者的人力资本状况,增大求职者的机会集合。

第五,在获得本工作之前,求职者已经工作的年限也作为一个影响机会集合的因素被考虑了进来。

(四)自变量集2:拟聘单位的外部压力

因为所问的是被调查者获得目前这个工作的情况(如果被调查者一直没有换过工作,那么所问的就是其获得第一份工作的情况;如果受访者目前已经离退休或下岗失业,则所问的就是其离退休、下岗失业前的最后一份工作的情况),所以在这里时间因素是非常值得注意的,在不同的年代获取工作的情况可能是非常不同的。幸运的是,问卷其他部分详细询问了被调查者的职业履历,所以可以确定被调查者获得当前这个工作的时间。后文中虽然并不尝试作事件史分析,但是对这一时间因素的把握非常有利于了解这些年来我国求职情况的变动。通过分析可知,被调查者获取最近一份工作开始的最早时间是1947年。于是,这里对时间因素进行了一定的分段处理。在这些分段中1984年被看作城市市场化改革的一条非常重要的分界线:1984年之前被大致看作计划经济体制时代,1984年及之后被大致看作市场经济体制时代。

由于因变量多是0、1变量,而自变量也主要是定类变量,所以下文主要选择用Logistic回归模型作为统计方法来讨论回归问题。当然,在面对一些特殊情况的时候,有些地方也会使用其他统计方法。这种安排与调查问卷的问题设计是相吻合的。