SPSS实战:回归中哑变量的设置和结果解读

2018-11-07 医咖会 医咖会

在构建回归模型时,如果自变量X为连续性变量,回归系数β可以解释为:在其他自变量不变的条件下,X每改变一个单位,所引起的因变量Y的平均变化量;如果自变量X为二分类变量,例如是否饮酒(1=是,0=否),则回归系数β可以解释为:其他自变量不变的条件下,X=1(饮酒者)与X=0(不饮酒者)相比,所引起的因变量Y的平均变化量。 但是,当自变量X为多分类变量时,例如职业、学历、血型、疾病严重程度等等,此

在构建回归模型时,如果自变量X为连续性变量,回归系数β可以解释为:在其他自变量不变的条件下,X每改变一个单位,所引起的因变量Y的平均变化量;如果自变量X为二分类变量,例如是否饮酒(1=是,0=否),则回归系数β可以解释为:其他自变量不变的条件下,X=1(饮酒者)与X=0(不饮酒者)相比,所引起的因变量Y的平均变化量。 但是,当自变量X为多分类变量时,例如职业、学历、血型、疾病严重程度等等,此时仅用一个回归系数来解释多分类变量之间的变化关系,及其对因变量的影响,就显得太不理想。 此时,我们通常会将原始的多分类变量转化为哑变量,每个哑变量只代表某两个级别或若干个级别间的差异,通过构建回归模型,每一个哑变量都能得出一个估计的回归系数,从而使得回归的结果更易于解释,更具有实际意义。 哑变量 哑变量(Dummy Variable),又称为虚拟变量、虚设变量或名义变量,从名称上看就知道,它是人为虚设的变量,通常取值为0或1,来反映某个变量的不同属性。对于有n个分类属性的自变量,通常需要选取1个分类作为参照,因此可以产生n-1个哑变量。 将哑变量引入回归模型,虽然使模型变得较为复杂,但可以更直观地反

作者:医咖会



版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (3)
#插入话题
  1. 2019-10-22 147612bem32暂无昵称

    写得好

    0

  2. 2018-11-07 lovetcm

    很直观,一直在用SPSS

    0

  3. 2018-11-07 lietome15

    感谢小编为我们准备了如此丰盛的精神大餐,同时也向作者致谢!认真学习了,点赞!

    0

相关资讯

分层回归分析理论及意义,以及SPSS操作演示

分层回归(hierarchical multiple regression),也称层次回归,其实是对两个或多个回归模型进行比较。我们可以根据两个模型所解释的变异量的差异来比较所建立的两个模型。一个模型解释了越多的变异,则它对数据的拟合就越好。假如在其他条件相等的情况下,一个模型比另一个模型解释了更多的变异,则这个模型是一个更好的模型。两个模型所解释的变异量之间的差异可以用统计显著性来估计和检验

用局部加权回归散点平滑法(LOWESS)观察二维变量之间的关系

二维变量之间的关系研究是很多统计方法的基础,例如回归分析通常会从一元回归讲起,然后再扩展到多元情况。局部加权回归散点平滑法(locally weighted scatterplot smoothing,LOWESS或LOESS)是查看二维变量之间关系的一种有力工具。 LOWESS主要思想是取一定比例的局部数据,在这部分子集中拟合多项式回归曲线,这样我们便可以观察到数据在局部展现出来的规律和趋势;

样本量过少回归分析如何分析处理与解释

回归是统计学中最常用的模型,但是,有时使用回归后发现结果难以解释,或者与临床实际并不符合,十分困惑。这可能是什么原因呢? 虽然,实际原因很多,但是重要原因之一是样本量太小!很小小样本得出回归的结果,其实并不"回 归",因此,在处理小样本做多因素回归分析时,要慎重。传统一般认为在logistic回归时,变量与样本量之比为至少5倍,即纳入5个变量时,样本量至少也需要25例,实际上,这是保守估计。如果

有序多分类Logistic回归SPSS实战操作教程

1、问题与数据 在某胃癌筛查项目中,研究者想了解首诊胃癌分期(Stage)与患者的经济水平的关系,以确定胃癌筛查的重点人群。为了避免性别因素对结论的混杂影响,研究者将性别(Sex)也纳入分析(本例仅为举例说明如何进行软件操作,实际研究中需控制的混杂因素可以更多)。研究者将所有筛查人群的结果如表1,变量赋值如表2。 表1. 原始数据 表2. 变量赋值情况 2、对数据结构的分析

更优尺度回归(CATREG)的SPSS分析

1、什么是最优尺度回归?英文简称CATREG,也称分类回归。 普通线性回归对数据的要求十分严格,当遇到分类变量时,线性回归无法准确地反映分类变量不同取值的距离,比如性别变量,男性和女性本身是平级的,没有大小、顺序、趋势区分,若直接纳入线性回归模型,则可能会失去自身的意义。最优尺度回归就是为了解决类似问题,它擅长将分类变量不同取值进行量化处理,从而将分类变量转换为数值型进行统计分析。可以说有了最优尺

用Stata处理RDD断点回归

断点回归设计RDD是当前最热门的因果推断计量方法,最主要的原因在于它的透明性和强因果识别性,里面的每一步都可以成功运行出来 gen y = outcome // 结果变量 gen d = running>0 // 处理变量(0/1种类) gen v = running // 分配变量或参考变量 gen vd = v*d // 交互项 local i=1