首页 理论教育应用统计学:二手数据的基本利用

应用统计学:二手数据的基本利用

【摘要】:辛迪加数据是具有高度专业化、从一般数据库中获得的外部数据。辛迪加数据的一个优点就是可以分摊信息的成本;另一个优点就是信息需要者可以非常快地获得所需的信息,原因在于信息供应商总在不间断地获取有关信息。辛迪加数据主要应用于:测量消费者态度以及进行民意调查;确定不同的细分市场;进行长期的市场跟踪。

(一)二手数据的定义

二手数据是相对于原始数据而言的,指那些并非为正在进行的研究而是为其他目的已经搜集好的统计资料,这些数据通常可以快速、低成本地获得。与原始数据相比,二手数据在搜集目的、搜集程序、搜集成本和搜集时间等方面都存在很大的区别。原始数据与二手数据的区别如表2-1所示。

表2-1 原始数据与二手数据的区别

(二)二手数据的特点

二手数据具有省钱、省时、省力的优点,但缺点也十分明显。

1.相关性差

二手数据不是专门为研究者需要解决的问题而搜集的,它是为其他目的而搜集的,这就会不可避免地造成二手数据与项目要求的数据在很多方面不一致。

(1)测量单位与研究者所要求的测量单位不一致。例如,收入信息分为总收入、税后收入、家庭收入、人均收入等,测量单位需要的是家庭收入,而二手数据可能只能提供人均收入等。

(2)二手数据的分类定义可能对研究者来说无用。例如,某豪华轿车公司特别关注年收入在20万元以上的家庭百分比,但所搜集到的二手数据却只能提供年收入在10万元以上的家庭百分比,此时该公司就不能使用这种分类方法的数据资料。

2.时效性

二手数据是在当前研究项目之前已经存在的数据,因此反映的市场、消费者以及环境等信息可能与当前情况存在差距。

3.可靠性

二手数据存在不真实的情况,统计数据存在一定程度的误差,甚至不排除部分数据有很大的水分。

(三)二手数据的分类

二手数据可分为内部二手数据和外部二手数据。

1.内部二手数据

内部数据是指来自正在进行市场研究的企业或组织内部的数据。当数据是为其他目的搜集的,就是内部二手数据,包括会计账目、销售记录和其他各类报告等。内部数据有两个最突出的优点:可获得性、低成本性。对于内部二手数据,需要判断数据是可以直接使用,还是需要整理后才可使用。

2.外部二手数据

外部二手数据来源广泛,包含公开出版的数据、辛迪加数据及计算机数据库

(1)公开出版的数据。

公开出版的数据是指那些可从图书馆或政府部门及其他实体获得的公开出版的数据,习惯上分为政府数据和普通商业数据。

政府数据包含普查数据和其他正版出版物数据,比如国家统计局的人口普查数据,此外,还有经济普查、农业普查、工业普查和第三产业(服务业)普查数据等。政府数据除了普查数据外,还包括发布或出版的大量的统计数据及一些定期出版的出版物中的数据,比如《中国统计年鉴》《中国发展报告》《中国科技统计年鉴》《中国高技术产业统计年鉴》等。

除了政府提供的大量的二手数据外,普遍存在的商业数据也非常丰富,形式上有书籍、报纸、杂志、专题报告和行业数据等大量公开出版的数据。也有帮助研究者搜索有关数据的工具出版物,比如指南、目录、索引等。

(2)辛迪加数据。

辛迪加数据是具有高度专业化、从一般数据库中获得的外部数据。信息供应商把信息卖给多个信息需要者,使每一个需要者获得信息的成本更为合理。

辛迪加数据的一个优点就是可以分摊信息的成本;另一个优点就是信息需要者可以非常快地获得所需的信息,原因在于信息供应商总在不间断地获取有关信息。辛迪加数据主要应用于:测量消费者态度以及进行民意调查;确定不同的细分市场;进行长期的市场跟踪。

(3)计算机数据库。

数据库是按照数据结构来组织、存储和管理数据的仓库,是一个长期存储在计算机内的有组织、可共享、统一管理的大数据的集合。数据库的主体是计算机化的,因为数据库包含大量的信息,只有通过计算机进行编辑、分类和分析才可以较为容易地运用。按照在数据库中的数据记录的性质进行分类,可以将数据库分为四类:文献目录、数字、名录和全文。