首页 理论教育抽样估计与总体分析的重要性

抽样估计与总体分析的重要性

【摘要】:从想要研究的全部样品中抽取一部分样品单位,通过这些样品单位的分析与研究结果来估计和推断全部样品特性。抽样保证了在客观条件达不到的情况下,可能得出一个相对可靠的结论,让研究有的放矢。从抽样思维到总体思维,是从过去的小数据时代到如今的大数据时代最重要的思维转变。例如,为了获得中国的准确人口数量,为党和国家在制定政策与方针时,提供更加客观可靠的依据,我们基本不会采用抽样调查,而是采用人口普查。

首先,是抽样思维到总体思维的转变。

以前我们开展研究时,都习惯采用抽样调查的方式。从想要研究的全部样品中抽取一部分样品单位,通过这些样品单位的分析与研究结果来估计和推断全部样品特性。

抽样调查是科学实验、质量检验社会调查普遍采用的一种经济有效的研究方法,它在一定历史时期内,极大地推动了社会的发展。在数据采集难度大、分析和处理困难的时候,抽样调查绝对是一种非常好的权宜之计。

例如,我们想要计算洞庭湖中银鱼的数量,就可以事先对10000条银鱼打上特定记号,并将这些鱼均匀地投放到洞庭湖中。过一段时间进行捕捞,假设捕捞上来的10000条银鱼,有4条是打了记号的,那么我们可以得出结论,洞庭湖大概有2500万条银鱼。

这样的抽样调查既有优点,也有缺点。抽样保证了在客观条件达不到的情况下,可能得出一个相对可靠的结论,让研究有的放矢。

但抽样也带来了新的问题:抽样是不稳定的,从而可能导致结论与实际差异非常明显。上面的例子,有可能今天去捕捞得到打了记号的银鱼有4条,明天去捕捞得到打了记号的银鱼有400条。同样,我们不能因为一个高考状元后来发展得不好,就得出所有高考状元一定走向平庸的结论,这是抽样在极端情况下结论不稳定的极端表现。

以前我们对数据的收集、储存和处理的能力有限,随机抽样是最有效且成本最低的调查方法。但随着大数据技术的发展,我们已经具备了洞察所有样本的能力,进而解析全部的数据,这更能让我们无限接近100%的真相。

比如,以前要了解全国人均寿命,只能随机调查全国几个城市的部分人均寿命,从而推断出全国大概的人均寿命。但是现在我们每一个人从出生到死亡的信息都会被记录,这样就可以分析出最准确的平均寿命。

从抽样思维到总体思维,是从过去的小数据时代到如今的大数据时代最重要的思维转变。

实际上,在很多情况下,现实是不允许我们进行抽样的。例如,为了获得中国的准确人口数量,为党和国家在制定政策与方针时,提供更加客观可靠的依据,我们基本不会采用抽样调查,而是采用人口普查。所谓人口普查,就是获得中国所有人的样本,计算中国的精确人口数量。