首页 理论教育基于R的实验-Logistic模型

基于R的实验-Logistic模型

【摘要】:,xp,用向量表示X=(x1,x2,…,βp 为待估参数.Logistic回归模型中的参数估计常用极大似然估计法得到.设y 是0-1变量,x1,x2,…,n),取P=πi,P=1-πi,则yi 的联合概率函数为,yi=0,1;i=1,2,…,yn 的似然函数为对数似然函数为对于Logistic回归,将代入,得令=0,可以用数值计算求待估参数β0,β1,β2,…,βp 的极大似然估计.用R 软件可以解决Logistic回归模型中的参数估计、检验等问题.

在一般线性模型中,变量y 服从正态分布,当y 服从二项分布(Binomial),即y~b(n,p),针对0-1变量,回归模型须作一些改进.

(1)回归函数应该改用限制在[0,1]区间内的连续曲线,而不能再沿用线性回归方程.应用较多的是Logistic函数(也称Logit变换),其形式为

它的图形呈“S”形,如图5-1所示.

图5-1 S形曲线

(2)因变量yi 本身只取0,1值,不适于直接作为回归模型中的因变量,设p=P(y=1),q=P(y=0),q=1-p.假设观测了p 个解释变量x1,x2,…,xp,用向量表示X=(x1,x2,…,xpT.与线性模型不同的是,我们不是研究因变量与解释变量之间的关系,而是研究因变量取某些值的概率p 与解释变量之间的关系.实际观测结果表明,概率p 与解释变量之间的关系不是呈线性关系,而是呈“S”形曲线关系.

一般用Logistic曲线来描述概率p 与解释变量之间的关系.

对上式作Logit变换,有

(www.chuimin.cn)

式(5.1.4)称为Logistic回归模型,其中β0,β1,β2,…,βp 为待估参数.

Logistic回归模型中的参数估计常用极大似然估计法得到.设y 是0-1变量,x1,x2,…,xp 为与y 相关的变量,对它们的n 次观测数据为(x1,x2,…,xp;yi)(i=1,2,…,n),取P(yi=1)=πi,P(yi=0)=1-πi,则yi 的联合概率函数为,yi=0,1;i=1,2,…,n.于是y1,y2,…,yn 的似然函数为

对数似然函数为

对于Logistic回归,将

代入,得

=0,可以用数值计算(改进的Newton-Raphson迭代法等)求待估参数β0,β1,β2,…,βp 的极大似然估计.用R 软件可以解决Logistic回归模型中的参数估计、检验等问题.