预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共75页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

15章常用多变量统计方法简介MultipleVariableAnalysis第一节概述常用的多变量统计方法第二节多重线性回归线性方程参数估计的最小二乘法两个自变量与应变量的散点图在满足上述的假设条件下,一般线性模型参数的最小二乘估计的统计性质包含在著名的高斯——马尔科夫定理(Gauss-MarkovTheorem)之中:在给定经典线性模型模型的假定条件下,最小二乘估计量在所有线性无偏估计量中具有最小的方差,也即是最小二乘估计量是最优线性无偏估计量(bestlinearunbiasedestimator,BLUE)。模型概述中的R(0.884)称为复相关系数:表示y和m个自变量的线性组合的线性相关的密切程度。也就是y和yhat的简单相关系数。复相关系数平方(Rsquare=78.1%)称为决定系数,表示线性回归模型(所有的自变量)能在多大程度上解释应变量的变异。本例中表示胸围、体重和呼吸差能够解释肺活量变异的比例为78.1%。调整的R2(adjustedRSquare),由于R2只增加不减少,这意味着,增加没有意义的自变量也会提高模型的拟合效果,为了惩罚增加的没有意义的自变量,对R2进行校正,调整的R2可增大可减少。Y的总变异分解结果解释表15-4回归系数表前进法(forward)从零模型开始,首先纳入最有意义的变量;后退法(backward从全模型开始,首先提出最没有意义的变量;逐步(stepwise)在前进法的基础进行一步后退筛选。逐步回归将有意义的自变量保留在方程中,没有意义的自变量剔除。按每个自变量对因变量的贡献大小,从大到小引入模型或者从小到大剔除模型,但每次引入或剔除都需要对回归方程或者对方程外的变量进行检验,引入有意义者,剔除无统计学意义的自变量,直到不能引入或剔除为止。forwardbackward282930四、注意事项第三节logistic回归34问题的提出率(P)的特点优势(odds)一、Logistic回归的概念定义logitP为优势的对数(logodds):二、Logistic回归模型logistic回归模型的几种形式二项分布常数项0及偏回归系数1,…,m用极大似然法(maximumlikelihood)进行估计与检验。系数的解释Logistic回归分析logistic回归分析结果54三、Logistic回归的假设检验计算检验统计量G:用于比较包含某个或某几个变量的模型是否有统计学意义。其中:L′和L分别为模型中包含活不包含某个或某几个变量的似然函数统计量。G值的大小反映了增加了某个或某几个变量的模型拟合优度提高的程度,渐近服从卡方分布。自由度为增加变量的个数。2.Wald检验主要用于对回归方程中某个偏回归系数是否有统计学意义的检验。建立检验假设:H0:i=0H1:i≠0=0.05Wald检验统计量为和多重线性回归的的区别与联系多重线性回归logistic回归因变量Y连续二分类误差e正态分布二项分布回归系数最小二乘法极大似然法假设检验F,tWald检验,似然比检验四、Logistic回归应用条件第四节Cox比例风险回归64一、Cox回归的概念二、Cox回归模型相对危险度70结果解释:x1的系数是-0.079,RR=0.924,表示自理能力评分每增长一岁,死亡的相对危险度减少到是0.924或者减少约8%。X4为4分类无序资料,需要设置了3个哑变量,这里以大型细胞癌作为对比,其系数的解释也必须是以大型细胞癌为基准。三、Cox回归的假设检验四、Cox回归应用条件over