首页 理论教育应用多元统计分析:基于R的实验-框架与内容安排

应用多元统计分析:基于R的实验-框架与内容安排

【摘要】:随着大数据、人工智能在我们日常生活的渗透,学习多元统计分析的人越来越多.“多元统计分析”课程已经被越来越多高校列为相关专业的必修课或选修课.《多元统计分析》教材的特点各有不同,有的教材侧重理论的讲述,读者需要具备较深厚的数学基础;有的教材则注重模型的应用,理论和技术细节不是重点.作者认为,对于侧重“应用”多元统计方法进行数据处理和分析的读者,重点不在于理解多元统计方法的理论证明和公式推导,而是要应

随着大数据、人工智能在我们日常生活的渗透,学习多元统计分析的人越来越多.“多元统计分析”课程已经被越来越多高校列为相关专业的必修课或选修课.《多元统计分析》教材的特点各有不同,有的教材侧重理论的讲述,读者需要具备较深厚的数学基础;有的教材则注重模型的应用,理论和技术细节不是重点.作者认为,对于侧重“应用”多元统计方法进行数据处理和分析的读者,重点不在于理解多元统计方法的理论证明和公式推导,而是要应用有关软件对数据进行分析,特别是要理解多元统计方法的目的、应用条件和结果的解释.

多元统计分析通常涉及较为复杂的理论,计算繁琐.大多数多元统计方法几乎无法手工计算,必须借助计算机和有关软件来实现.相关软件的种类很多,有些功能齐全,有些价格便宜,有些容易操作,有些需要更多的实践才能掌握.这里就不一一罗列了.其实,读者只要学会使用一种软件,使用其他的软件也不会困难,看看帮助和说明即可.学习软件的最好方式是在使用中学

R软件是完全免费的、由志愿者管理的软件,其编程语言与S-plus所基于的S语言一样,很方便.在网站(http://cran.r-project.org/bin/windows/base)上可免费下载R 软件的Windows 版(当然也可以免费下载R 软件的其他版本,如UNIX、LINUX、Mac OS),点击“Download R3.5.1 for Windows”下载(注:作者在写作本书后期时的最新版本为R3.5.1),按照提示安装即可.还有不断加入的从事各个方向研究者编写的软件包和程序.在这个意义上可以说,其函数的数量和更新远远超过其他软件.它的所有计算过程和代码都是公开的,它的函数还可以被用户按需要改写.它的语言结构和C++、Fortran、MATLAB、Pascal、Basic等很相似,容易举一反三.对于一般非统计工作者来说,主要问题是它没有“傻瓜化”.

考虑到作为一款免费软件,R 软件具有丰富的资源(涵盖了多种行业数据分析中几乎所有的方法),良好的扩展性(方便的编写函数和程序包,可以胜任复杂数据的分析、精美图形的绘制),完备的帮助系统(每个函数都有统一格式的帮助).本书的实验均采用R 软件,并给出了相应的代码.(www.chuimin.cn)

近几年来有关R 语言/软件与统计分析相结合的书越来越多,代表性的有:Clark(2007),薛毅(2007),汤银才(2008),Kabacoff(2013),Tsay(2013),James et al.(2013),吴喜之(2013),薛薇(2014),陈景祥(2014),韩明(2017)等.

本书按照《应用多元统计分析》(第2版)(韩明,同济大学出版社)的内容(有修改),编写了基于R 的实验.全书由12章组成,在每一章(从第2章开始)的前面,首先按照原教材简要介绍本章的有关概念、理论和相关背景,然后是与本章内容对应的实验.本书注重可读性,图文并茂(配图76幅);通过40个实验,突出R 软件的应用,着重培养学生的动手能力、应用R 软件分析和解决多元统计问题的能力.书名为《应用多元统计分析——基于R 的实验》,主要是突出R 软件在多元统计分析中的应用.