,βp的线性函数.因此,对μ 作变换,则可得到下面几种分布的连接函数的形式:正态分布m(μ)=μ=∑βi xi.二项分布.Poisson分布m(μ)=lnμ=∑βi xi.上述推广体现在以下两个方面:通过一个连接函数,将响应变量的期望与解释变量建立线性关系m[E]=β0+β1 x1+β2 x2+…......
2023-11-18
对于广义线性模型,除了以上介绍的Logistic回归模型外,还有其他的模型,如Poisson模型,这里就不作详细介绍.以下简要介绍R 软件中“glm( )”关于这些模型的使用方法.
Poisson分布族模型和拟Poisson分布族模型的使用方法如下:
fm<-glm(formula,family=poisson(link=log),data.frame)
fm<-glm(formula,family=quasipoisson(link=log),data.frame)
其直观意义是
ln[E(y)]=β0+β1x1+β2x2+…+βp xp,
即
E(y)=exp(β0+β1 x1+β2 x2+…+βp xp).
Poisson分布族模型和拟Poisson分布族模型的唯一差别就是:Poisson分布族模型要求响应变量y 是整数,而拟Poisson分布族模型则没有这个要求.(www.chuimin.cn)
对于联列表还可以用(多项分布)对数线性模型来描述.以二维联列表为例,只有主效应的对数线性模型为
ln mij=αi+βj+εij.
这相当于只有主效应αi 和βj,而这两个变量的效应是简单可加的.但是有时两个变量在一起时会产生交叉效应,此时相应的对数线性模型为
ln mij=αi+βj+(αβ)ij+εij.
对于表中数目代表一个观测数目时,就要考虑是否用Poisson对数线性模型.例如,如果有两个定性变量、一个定量变量的Poisson对数线性模型可以表示为
lnλ=μ+αi+βj+γx+εij,
其中,μ 为常数项;αi 和βj 为两个定性变量的主效应;x 为连续变量;而γ 为其系数;εij 为残差项.这里之所以对Poisson分布的参数λ 取对数,是为了使模型左边的取值范围为整个实数轴.
有关应用多元统计分析:基于R的实验的文章
,βp的线性函数.因此,对μ 作变换,则可得到下面几种分布的连接函数的形式:正态分布m(μ)=μ=∑βi xi.二项分布.Poisson分布m(μ)=lnμ=∑βi xi.上述推广体现在以下两个方面:通过一个连接函数,将响应变量的期望与解释变量建立线性关系m[E]=β0+β1 x1+β2 x2+…......
2023-11-18
下面是普林斯顿大学(Princeton University)提供的数据集The Children Ever Born Data.读者也可在网址(http://iccm.cc/poisson-regression-in-r/)找到其他根据统计分析类型(线性回归、广义线性回归、生存分析等分类)的其他数据集.(1)首先查看该数据集中的变量>ceb<-read.table("ht tp://data.p......
2023-11-18
多元线性回归的数学模型可以用矩阵形式表示为1.参数β的最小二乘估计设b0,b1,…表4-1 回归正交设计计算表通过推导,可以得到方差分析表4-2。表4-2 方差分析表3.回归方程的显著性检验F>Fα 若式成立,我们可以认为在显著水平α下,线性回归方程(4-6)是有显著意义的。反之,则认为线性回归方程没有什么意义,这时需要查明原因,具体情况具体分析。......
2023-06-27
,Xp 来表示.在回归分析中,主要研究以下问题:确定Y 与X1,X2,…,Xp 之间的定量关系表达式,这种表达式称为回归方程;对所得到的回归方程的可信程度进行检验;判断自变量Xi(i=1,2,…,p)对因变量Y 有无显著影响;利用所求得的回归方程进行预测或控制.......
2023-11-18
因子分析是用少数几个公共因子去提取研究对象的绝大部分信息,既减少了因子的数目,又把握住了研究对象的相互关系.在因子分析中根据研究对象的不同,分为R 型和Q 型,如果研究变量的相互关系时则采用R 型因子分析;如果研究样品间相互关系时则采用Q 型因子分析.但无论是R 型或Q 型都未能很好地揭示变量和样品间的双重关系,另一方面当样品容量n 很大(如n>1 000),进行Q型因子分析时,计算n 阶方阵的特......
2023-11-18
,xn 是从一元总体中抽取的.一元数据的数字特征主要有:均值,方差s2=,标准差s=,等等.对于多元数据,除分析各分量的取值特征外,还要分析各分量之间的相关关系.由于多元统计分析中的符号多而杂,因此需要说明:在一元统计学中一般用大写和小写字母分别来区分随机变量及其观测值,在本书后面的章节里,由于其他复杂的符号,我们可能不再遵守此约定,请读者注意一个符号在每一章中的意义.......
2023-11-18
,F5 的线性组合表示出来Xi=μi+ai1 F1+ai2 F2+…,F5 的值却是未知的,有关参数的意义也有很大的差异.因子分析的首要任务就是估计因子载荷aij 和方差σ2i,然后给因子Fi 一个合理的解释,若难以进行合理的解释,则需要进一步作因子旋转,希望旋转后能发现比较合理的解释.特别需要说明的是这里的因子和试验设计里的因子(或因素)是不同的,它比较抽象和概括,往往是不可以单独测量的.......
2023-11-18
多元统计分析是统计学中应用性很强的一个分支,它的应用范围十分广泛.多元统计分析可以应用于几乎所有的领域,主要包括经济学、农业、地质学、医学、工业、气象学、金融、精算、物理学、地理学、军事科学、文学、法律、环境科学、考古学、体育科学、遗传学、教育学、生物学、管理科学、水文学等,还有一些交叉学科或方向等.多元统计分析的应用实在是难以一一罗列,以下简要地介绍一下多元统计分析在文学、数据挖掘(作为交叉学科......
2023-11-18
相关推荐