对于广义线性模型,除了以上介绍的Logistic回归模型外,还有其他的模型,如Poisson模型,这里就不作详细介绍.以下简要介绍R 软件中“glm( )”关于这些模型的使用方法.Poisson分布族模型和拟Poisson分布族模型的使用方法如下:fm<-glmfm<-glm其直观意义是ln[E]=β0+β1x1+β2x2+…+βp xp,即E=exp(β0+β1 x1+β2 x2+…......
2023-11-18
下面是普林斯顿大学(Princeton University)提供的数据集The Children Ever Born Data.读者也可在网址(http://iccm.cc/poisson-regression-in-r/)找到其他根据统计分析类型(线性回归、广义线性回归、生存分析等分类)的其他数据集.
(1)首先查看该数据集中的变量
>ceb<-read.table("ht tp://data.princeton.edu/wws509/datasets/ceb.dat")
>names(ceb)
[1]"dur" "res" "educ" "mean" "var" "n" "y"
变量说明如下:
(2)对响应变量——育子数作直方图
hist(ceb$y,breaks=50,xlab="children ever born",main="Distribution of CEB")
结果如图5-2所示.
图5-2 育子数直方图
从图5-2可以清楚看到育子数的偏倚情况(大体上符合泊松分布).
(3)建立对数线性模型(泊松回归)
>hist(ceb$y,breaks=50,xlab="children ever born",main="Distribution of CEB")
>fit<-glm(y~educ+res+dur,offset=log(n),family=poisson( ),data=ceb)
>summary(fit)
结果如下:
(www.chuimin.cn)
(4)为了更好地解释模型参数,将其指数化
>exp(coef(fit))
结果如下:
可见随着婚龄的增长,期望的育子数将相应增长;教育程度越高,期望育子数越低;农村预期育子数比城市高等.
对数线性回归(泊松回归)中需要注意过度离势问题.泊松分布中均值与方差相等,当观测到的响应变量实际分布不满足这一点时,对数线性回归(泊松回归)可能会出现这样的问题.这个问题一般原因是缺少解释变量.我们可以用qcc包检验对数线性回归模型(泊松回归)过度离势.
>require(qcc)
>qcc.overdispersion.test(ceb$y,type="poisson")
结果如下:
p 值为0,果然该数据存在过度离势的问题,可以用拟泊松(quasi-poisson)模型对数据进行分析.
>fit2<-glm(y~educ+res+dur,offset=log(n),family=quasipoisson( ),data=ceb)
>summary(fit2)
结果如下:
比较以上两个模型参数结果,发现参数估计值一致,而t/p 不同.在过度离势的情况下,应采用拟泊松结果的t/p 检验自变量的显著程度.
有关应用多元统计分析:基于R的实验的文章
对于广义线性模型,除了以上介绍的Logistic回归模型外,还有其他的模型,如Poisson模型,这里就不作详细介绍.以下简要介绍R 软件中“glm( )”关于这些模型的使用方法.Poisson分布族模型和拟Poisson分布族模型的使用方法如下:fm<-glmfm<-glm其直观意义是ln[E]=β0+β1x1+β2x2+…+βp xp,即E=exp(β0+β1 x1+β2 x2+…......
2023-11-18
在建立控制系统的数学模型时,常常会遇到非线性的问题。严格地说,实际物理元件或系统都是非线性的。这种线性化方法称为小偏差线性化方法。通过上述讨论,在非线性数学模型进行线性化时应注意以下几点。若非线性特性是不连续的,处处不能满足展开成为泰勒级数的条件,这时就不能进行线性化处理。这类非线性称为本质非线性,对于这类问题,要用非线性自动控制理论来解决。......
2023-06-28
业务规则过少管理的重要原因是,将数据质量管理当作一次性工作,疏于发掘与扩张测定数据质量的业务规则。数据库的表和行列以物理数据模型呈现。图4-2数据模型2②业务规则2:商品交付单位表的商品交付合作单位代码是Not Null,且必须为在合作单位表中登录的公司。原因是作为业务规则1和业务规则2导出基础的数据模型2是物理数据模型,而物理数据模型要充分表现其数据业务特性是有局限性的。......
2023-11-16
在柑橘花定果后,每隔10天测量柑橘单果直径x 与单果重量y,有关数据见表5-3,试选择x 与y 之间最优模型.表5-3单果直径x 与单果重量y 的数据(1)输入表5-3的数据,并画出x 和y 的散点图>x=c(2.71,3.26,3.59,4.02,4.42,4.69,4.89,4.97,5.32,5.61,5.55,5.31)>y=c(11.49,18.68,24.07,40.10,55.70......
2023-11-18
为了保证本构行为模型有足够的覆盖面,应该给出足够大的相对位移取值范围。图2-3 非线性本构模型示意图必须提供按升序排列的相对位移的数据。对应一个完整的载荷循环过程,图2-4给出了由模型预测得到的、对应一个简单的本构模型的应力-应变本构响应。......
2023-06-24
同一维类似,基本系统分类如下。从连续到数字转换的一个重要函数是冲激函数或δ函数,在二维情况下可写成:凡是不满足叠加性或齐次性的系统属于非线性系统。本书中讨论的都是线性时不变系统模型。根据卷积性质,若系统对输入图像就进行了线性运算H后将得到输出图像,结合线性系统叠加性和齐次性,可得如下表达式:可分离性质δ=δ(x-α)δ(y-β) 尽管δ函数并不是普通意义上定义的函数。......
2023-06-23
材料模型的选择是非线性动力学数值模拟中的另一个重要环节,在很大程度上决定了分析结果的精度。因为在绝热线上熵是常量,从而具备均匀初始条件的气体状态方程为2.强度模型强度模型是描述材料在冲击载荷作用下,屈服应力与应变、应变率、温度等参量之间复杂关系的数学模型。1)Johnson-Cook强度模型Johnson-Cook强度模型是一个能较好地反映材料应变率强化效应与温度软化效应的理想刚塑性强度模型。......
2023-06-18
对两个具有线性关系的变量,配合线性回归方程,并根据自变量的变动来测定因变量平均发展趋势的分析方法,称为一元线性回归分析,也称简单直线回归分析。(三)一元线性回归分析的特点两个变量的地位不是对等关系。估计的结果表明,该社区居民月消费支出随可支配收入的增加而增加。估计的结果表明,该地交通事故数随机动车辆数的增加而增加。......
2023-08-13
相关推荐