首页 理论教育应用多元统计分析:数据可视化与表示

应用多元统计分析:数据可视化与表示

【摘要】:,xn 是从一元总体中抽取的.一元数据的数字特征主要有:均值,方差s2=,标准差s=,等等.对于多元数据,除分析各分量的取值特征外,还要分析各分量之间的相关关系.由于多元统计分析中的符号多而杂,因此需要说明:在一元统计学中一般用大写和小写字母分别来区分随机变量及其观测值,在本书后面的章节里,由于其他复杂的符号,我们可能不再遵守此约定,请读者注意一个符号在每一章中的意义.

翻开报纸,打开电视或上网络浏览,就可以看到各种数据.比如高速公路通车里程、物价指数、股票行情、外汇牌价犯罪率、房价、流行病的有关数据;当然还有国家统计局定期发布的各种国家经济数据、海关发布的进出口贸易数据等.从这些数据中,各有关方面可以提取对自己有用的信息.

某些企业每年都要花数目可观的经费来收集和分析数据.他们调查其产品目前在市场中的状况和地位并确定其竞争对手的态势;他们调查不同地区、不同阶层的民众对其产品的认知程度和购买意愿,以改进产品或推出新品种争取新顾客;他们还收集各地方的经济交通等信息,以决定如何保住现有市场和开发新市场.市场信息数据对企业是至关重要的.面对着一堆数据,我们该如何简洁明了地反映出其中规律性的东西或所谓的信息呢?一般首先对收集来的数据进行描述性分析,以初步发现其内在的规律性,然后再选择进一步分析的方法.

数据作为信息的载体,当然要分析数据中包含的主要信息,也就是分析数据的主要特征——数字特征.对一元数据,即样本数据(或观测值)x1,x2,…,xn 是从一元总体中抽取的.一元数据的数字特征主要有:均值方差s2,标准差s=,等等.对于多元数据,除分析各分量的取值特征外,还要分析各分量之间的相关关系.(www.chuimin.cn)

由于多元统计分析中的符号多而杂,因此需要说明:在一元统计学中一般用大写和小写字母分别来区分随机变量及其观测值,在本书后面的章节里,由于其他复杂的符号,我们可能不再遵守此约定(Anderson在An Introduction to Multivariate Statistical Analysis(3rd ed.,2003)中也采用了类似的作法),请读者注意一个符号在每一章中的意义.