应用多元统计分析：基于R的实验-框架与内容安排

2023-11-18 理论教育版权反馈

【摘要】：随着大数据、人工智能在我们日常生活的渗透，学习多元统计分析的人越来越多．“多元统计分析”课程已经被越来越多高校列为相关专业的必修课或选修课．《多元统计分析》教材的特点各有不同，有的教材侧重理论的讲述，读者需要具备较深厚的数学基础；有的教材则注重模型的应用，理论和技术细节不是重点．作者认为，对于侧重“应用”多元统计方法进行数据处理和分析的读者，重点不在于理解多元统计方法的理论证明和公式推导，而是要应

随着大数据、人工智能在我们日常生活的渗透，学习多元统计分析的人越来越多．“多元统计分析”课程已经被越来越多高校列为相关专业的必修课或选修课．《多元统计分析》教材的特点各有不同，有的教材侧重理论的讲述，读者需要具备较深厚的数学基础；有的教材则注重模型的应用，理论和技术细节不是重点．作者认为，对于侧重“应用”多元统计方法进行数据处理和分析的读者，重点不在于理解多元统计方法的理论证明和公式推导，而是要应用有关软件对数据进行分析，特别是要理解多元统计方法的目的、应用条件和结果的解释．

多元统计分析通常涉及较为复杂的理论，计算繁琐．大多数多元统计方法几乎无法手工计算，必须借助计算机和有关软件来实现．相关软件的种类很多，有些功能齐全，有些价格便宜，有些容易操作，有些需要更多的实践才能掌握．这里就不一一罗列了．其实，读者只要学会使用一种软件，使用其他的软件也不会困难，看看帮助和说明即可．学习软件的最好方式是在使用中学．

R软件是完全免费的、由志愿者管理的软件，其编程语言与S-plus所基于的S语言一样，很方便．在网站（http：//cran．r-project．org/bin/windows/base）上可免费下载R 软件的Windows 版（当然也可以免费下载R 软件的其他版本，如UNIX、LINUX、Mac OS），点击“Download R3．5．1 for Windows”下载（注：作者在写作本书后期时的最新版本为R3．5．1），按照提示安装即可．还有不断加入的从事各个方向研究者编写的软件包和程序．在这个意义上可以说，其函数的数量和更新远远超过其他软件．它的所有计算过程和代码都是公开的，它的函数还可以被用户按需要改写．它的语言结构和C＋＋、Fortran、MATLAB、Pascal、Basic等很相似，容易举一反三．对于一般非统计工作者来说，主要问题是它没有“傻瓜化”．

考虑到作为一款免费软件，R 软件具有丰富的资源（涵盖了多种行业数据分析中几乎所有的方法），良好的扩展性（方便的编写函数和程序包，可以胜任复杂数据的分析、精美图形的绘制），完备的帮助系统（每个函数都有统一格式的帮助）．本书的实验均采用R 软件，并给出了相应的代码．(www.chuimin.cn)

近几年来有关R 语言/软件与统计分析相结合的书越来越多，代表性的有：Clark（2007），薛毅（2007），汤银才（2008），Kabacoff（2013），Tsay（2013），James et al．（2013），吴喜之（2013），薛薇（2014），陈景祥（2014），韩明（2017）等．

本书按照《应用多元统计分析》（第2版）（韩明，同济大学出版社）的内容（有修改），编写了基于R 的实验．全书由12章组成，在每一章（从第2章开始）的前面，首先按照原教材简要介绍本章的有关概念、理论和相关背景，然后是与本章内容对应的实验．本书注重可读性，图文并茂（配图76幅）；通过40个实验，突出R 软件的应用，着重培养学生的动手能力、应用R 软件分析和解决多元统计问题的能力．书名为《应用多元统计分析——基于R 的实验》，主要是突出R 软件在多元统计分析中的应用．

应用多元统计分析：基于R的实验-框架与内容安排

相关推荐