中文English
ISSN 1001-5256 (Print)
ISSN 2097-3497 (Online)
CN 22-1108/R

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

关于卡方检验与单因素logistic回归的个人看法

阅读次数:5137
  • 分享到:

用微信扫码二维码

分享至好友和朋友圈

发布日期:2015-09-09
来源:MedSci

关于卡方检验和单因素logistic回归,其实我个人很久以前就一直认为是等同的,从来没有觉得二者不同。但后来偶然发现有的人认为二者不同。最典型的就是有次帮别人做统计,作了单因素logistic回归,投稿后,有的审稿专家认为,从来就没有“单因素 logistic回归”这一说法,logistic回归一定是指多因素logistic回归,所谓单因素logistic回归必须用卡方检验。看了之后我承认确实没想到有人会这么想,难道是我以前想法太单纯?

我也曾利用数据验证了一下,当然结果二者肯定是一致的。我只是奇怪为什么有的人会认为二者不等同。即使现在,仍有的杂志,要么认为单因素logistic回归必须用卡方检验,要么认为单因素logistic回归不应该用卡方检验,只能用单因素logistic回归。其实这么简单的问题,只要利用统计软件验证,很容易得出结论。但总是有人把一些结果容易想当然化,以致对不少医学生造成困惑。本来他们就对二者关系不确定,再看到一些不同的声音,更不知道该怎么办了。

其实,不仅卡方检验和单因素logistic回归是等同的,t检验和单因素线性回归也是等同的,把组别作为自变量,做线性回归,回归系数就是两组的差值。方差分析和单因素线性回归也是一致的,如果你把组别作为自变量,而且将其虚拟化或哑变量化,因为方差分析中组别数超过2组,因此可以将其转化为虚拟变量,这时你可以看出单因素线性回归跟方差分析的关系。

所以,其实好多东西,书本上都不会讲,或者编书的作者也根本没想到,只能靠自己去发现不同方法之间的联系,这种联系可能帮助我们更好地理解方法。慢慢就会脱离课本的束缚,建立自己的思想体系。

有时候看到老师给出的表格,在做完卡方又搞个unadjusted OR,我觉得挺纳闷的。卡方列出交叉表频数和百分比还有个统计量和P值,logistic多了OR值和95%的可信区间,得到的信息丰富了一些。又看到发表的一篇文章,明明做了卡方,然后又做unadjusted OR,我觉得为什么做两次单因素分析,都是一样的。所以我觉得有必要看看到底这个单因素logistic和卡方有啥子的不同,有啥子一样。

查阅了一下相关的书籍:得分检验的χ2值等于采用χ2检验所求得的χ2值,似然比结果等于χ2检验中的似然比χ2值。Logistic回归的单因素分析结果与χ2检验结果一致。(冯国双,罗凤基. 医学案例统计分析与SAS应用[M],北京:北京大学医学出版社:2010:167)有的文章采用logistic进行单因素分析,有的采用χ2检验进行单因素分析,实际上结果是相同的。Logistic回归提供了比χ2检验更为丰富的内容,且结果一致。(冯国双,刘德平. 医学研究中的logistic回归及SAS实现[M],北京:北京大学医学出版社,2011:31-32)。

我自己用SAS运行了一遍,以下面的表格为例子。

变量

 

 

 

 

P

n

%

 

N

%

 

 

居住时间

04

12

11.76

 

90

88.24

21.7849

<.0001

 

59

12

14.81

 

69

85.19

 

1019

27

21.43

 

99

78.57

 

20

46

35.11

 

85

64.89

似然比卡方的结果为21.5874,P<0.0001

logistic回归的结果:

Likelihood Ratio=21.5874,P<0.0001;SCORE=21.7849,P<0.0001;

确实得分检验的χ2值等于采用χ2检验所求得的χ2值,似然比结果等于χ2检验中的似然比χ2值。

因为只是验证性的,所以把最后一项作为参照。logistic回归的结果:

变量

OR(95%CI)

P

RESIDE 1 vs 4

0.25(0.12-0.5)

<.0001

RESIDE 2 vs 4

0.32(0.16-0.65)

0.0017

RESIDE 3 vs 4

0.5(0.29-0.88)

0.0158

RESIDE 4

1.00

 

然后再进行卡方的两两比较。可以看到,1vs4 的P值,卡方为与logistic均为<.0001; 2vs4 的P值,logistic为0.0017,卡方为0.0013;3vs4的P值,logistic为0.0158,卡方为0.0150,感觉P值相差不大。 我又试着做了几个不同的例子,差异无统计学意义的,得出的P值都非常接近。

所以,我觉得单因素还是做logistic回归比较好吧,这样得出的信息比较多,至于logistic回归与两两比较的方法,和Bonferroni 有什么关系,1vs2, 1vs3等等,这个logistic回归的P值还需不需要调整,我觉得我们仅仅是做单因素分析,并不是重点描述,只是用这个来选择一些变量,进入到多元分析,有个直观的认识就行了。

  • 分享到:

用微信扫码二维码

分享至好友和朋友圈

阅读次数:5137
  • 1 病毒性肝炎
    • 1.1 乙型肝炎
    • 1.2 丙型肝炎
    • 1.3 甲型肝炎
    • 1.4 戊型肝炎
    • 1.5 其他肝炎
  • 2 肝硬化及并发症
  • 3 酒精性肝病
  • 4 非酒精性脂肪性肝病
  • 5 肝衰竭/肝性脑病/人工肝
  • 6 肝肿瘤
  • 7 自身免疫性肝病
  • 8 药物性肝病
  • 9 肝移植
  • 10 其他肝病
    • 10.1 遗传及代谢性肝病
    • 10.2 胆汁淤积性肝病
    • 10.3 肝脏血管病
  • 11 一般肝病/肝脏检查
  • 12 胆道疾病
  • 13 胰腺疾病
  • 14 全身疾病与肝病/内镜
  • 15 肝胆胰疾病相关评分系统汇总