用一个案例来说明。欲研究性别、两种治疗方法对某病疗效的影响,疗效的评价分为3个有序的等级:显效、有效和无效,变量编码数据如下表所示:
简单分析一下,研究目标是疗效,是我们的因变量Y,它呢有3个水平,分别是无效、有效、显效。解释变量,即自变量为性别、疗法,均是二分类变量。
这是一组汇总后的频率统计数据,所以在开始logistic回归前,需要用频数进行加权。此外也是非常重要的一环,有序多分类logistic回归的原理要求数据能通过平行线检验,这个检验我们就在接下来的logistic回归中直接解读结果即可。
心中有数之后,我们开始logistic回归建模。打开【分析】→【回归】→【有序】菜单。
告诉软件谁是因变量,谁是自变量。
点开【输出】对话框,除了默认要求输出的【拟合优度】【摘要统计】【参数估算值】外,有序logistic回归必须勾选【平行线检验】,这是基本条件。
其他参数都可以按照软件默认的设置,可满足多数场景。点主对话框底部的【确定】按钮,命令软件执行此次分析。
来解读一下结果。
先从众多结果中,把平行线检验拎出来。因为这是有序logistic回归的使用条件,如果不满足这个条件的话,其他结果也就不用看了。
χ² =1.469,P=0.48,说明平行性检验是通过的,即各回归模型的系数是一致的,可以使用有序logistic回归。
接下来用似然比卡方检验给模型做总体性评价,χ² =19.887,P=0.000,说明模型有统计学意义,两个自变量中至少有一个是有统计学意义的。
也可以参考拟合优度中输出的皮尔逊卡方检验和偏差检验,P>0.05,说明模型有统计学意义。
最后可以解读回归参数了。
【估算】列就是回归系数了,最后两列给出回归系数的95%置信区间;
【瓦尔德】检验的显著性概率P值,当P<0.05时,说明自变量对因变量有统计学意义,性别和疗法这两个因素对疾病疗效均有统计学意义。
SPSS没有直接输出比数比OR值,怎么办呢,最简单的办法就是在Excel里面输入EXP()函数,括号里面的参数就是回归系数。自己计算OR并解读即可。
比如疗法这个因素,OR=EXP(1.797)=6。可以通俗粗暴理解为,新疗法对于提高治疗疗效有积极作用,是传统疗法的6倍。
End.作者:数据小兵来源:博客本文均已和作者授权,如转载请与作者联系。
- 我的微信公众号
- 微信扫一扫
- 我的微信公众号
- 微信扫一扫
评论