医学科研中常用的几种多重回归模型

2023-02-22 13:22:11   文档大全网     [ 字体: ] [ 阅读: ]

#文档大全网# 导语】以下是®文档大全网的小编为您整理的《医学科研中常用的几种多重回归模型》,欢迎阅读!
多重,模型,回归,科研,常用
学科研中常用的几种多重回归模型

王立芹;唐龙妹;闫丽娜 【期刊名称】《临床荟萃》 【年(),期】2013(028)005 【总页数】2(P前插1,575)

【关键词】统计学,医学;回归分析;模型,统计学 【作 者】王立芹;唐龙妹;闫丽娜

【作者单位】河北医科大学统计学教研室,河北石家庄050017;河北医科大学统计学教研室,河北石家庄050017;河北医科大学统计学教研室,河北石家庄050017 【正文语种】 【中图分类】R195.1

学科研中许多结果的出现往往不是相互独立的,一种结果的出现常受多个因素的共同作用。多重回归模型可以同时考虑多个因素对同一结果的影响,一般结果变量称为应变量,Y表示,影响因素变量称为自变量,Xi表示。根据结果变量Y的资料性质不同需采用不同的回归模型,现将常用的多重线性回归模型、logistic回归模型与Cox比例风险回归模型介绍如下。

多重线性回归(multiplelinearregression)是简单线性回归的推广。当应变量Y有一个且为定量变量,而自变量有多个(两个及以上),YX1,X2,…Xm之间的线性回归称为多重线性回归。多重线性回归自变量Xi可以为定量变量、有序定性或无序定性变量。有序定性变量按等级数量化或做哑变量变化,无序定性变量需做


哑变量变化,并且应该在文章中列表说明。哑变量变化大家可参考孙振球主编的研究生教学用书《医学统计学》[1]。样本含量n至少是自变量个数的510[1-2] 多重线性回归,除要求YX1,X2,…Xm之间具有线性关系外,还应满足各例观测值Yi(i=1,2,…,n)相互独立以及残差e服从均数为0的等方差正态分布。

Y为应变量,X1,X2,…Xm为自变量,并且自变量与应变量之间为线性关系时,则多重线性回归模型为:

建立回归方程主要就是求解回归系数,一般多采用最小二乘法。实际应用时可通过统计软件直接得到各偏回归系数及其标准化偏回归系数。其中,β0为常数项,表示当所有自变量为0时应变量Y的平均值;βi为偏回归系数,表示其他自变量固定时,Xi每增加一个单位,应变量Y的平均改变量,改变的方向由βi的正负号决定。相应的由样本估计而得的多重线性回归方程为:

式中b0为常数项,bi为第i个自变量的偏回归系数βi的估计值。由于bi有单位,比较各XiY的作用大小时需进行标准化得到标准化偏回归系数

(standardizedpartial regressioncoefficient)。也可以先将原始数据进行标准化处理,得到的偏回归系数直接就是标准化偏回归系数。

logistic回归与多重线性回归有很多相同之处,最大的区别是应变量的不同,logistic回归常用的应变量为二分类的,这也是比较简单的一种形式。但在现实中,应变量的分类有时候多于两类,多分类logistic回归又分为两种,一种是有序分类,一种是无序分类。有序分类的logistic回归可以采用比例优势模型

(proportionaloddsmodel),又称累积logit模型或累积比数模型,无序分类的logistic回归采用多项logit模型(polynomiallogitmodel)logistic回归自变量Xi取值与赋值方法与上述多重线性回归分析相同。logistic回归的统计推断应建立在大样本的基础上,应变量频数较少的一组样本含量n至少是自变量个数的1020倍以上[2]。根据设计的不同,logistic回归又分为完全随机设计的非条件logistic


回归和配对设计的条件logistic回归。非条件logistic回归应用时要求一组自变量X1,X2,…Xmlogit(P)呈线性关系。下面以二分类的非条件logistic回归加以叙,其回归模型为: 线性模型的表达: 非线性的模型表达:

通常用最大似然函数(maximumlikelihoodestimate, MLE)估计β,由统计软件完成。β0(常数项):暴露因素Xi=0,个体发病概率与不发病概率之比的自然对数。回归系数βi的含义:其他自变量固定不变,某因素Xi增加一个单位时,Xi=1Xi=0,发生结果(Y=1)优势比(Odds ratio,OR)的自然对数值,即。回归系数βOR应了XY的关联,iiβi=0,OR=1,XiY无关,βi>0,OR1,XiY有关, Xi为危险因素,βi<0,OR1,XiY有关,Xi为保护因素。如研究吸烟、饮酒与食管癌关系的logistic回归,应变量Y为是否食管癌患者,为二分类变量,一般Y=1(食管癌患),Y=0(对照),自变量X1=1(吸烟),X1=0(不吸烟),X2=1(饮酒),X2=0(不饮酒),如经logistic回归计算后得b1= 0.886,exp(0.886)=OR=2.4,表示控制饮酒因素后,吸烟患食管癌的优势(Odds)(P1/(1-P1))是不吸烟患食管癌优势(P0/(1-P0))2.4,烟是食管癌的危险因素。

多分类logistic回归,对于无序分类的logit模型,其分析结果是以其中一类作为参,其余各类均与参照类比较。对于有序分类的logistic回归,如疗效分为痊愈、显效、无效,则会出现“累积”(cumulative)的含义,一是“痊愈+显效”相对“无效”的结果,二是“痊愈”相对“显效+无效”的结果,它实际上体现了一种累积疗效。 一般来说多类结果的logit分析比二分类的要稍微复杂一些,但基本思路都是一致的。 医学研究,经典的研究方法如上面介绍的logistic (下转正文第575)


本文来源:https://www.wddqxz.cn/82c6332bff4ffe4733687e21af45b307e871f9b3.html

相关推荐