如何区分常见的回归模型呢?在什么情况下,应该用什么回归模型呢? 本文将汇总分析三种最常用回归模型:多重线性回归、Logistic回归、Cox回归,更直接比较它们间最基本的联系与区别。
三者联系:
它们都属于回归分析,目的都在于探讨多个自变量对因变量的影响,且自变量具有共同属性——自变量均为多个,可以为连续变量、等级变量和分类变量,其中,分类变量需转换为哑变量进行处理,等级变量按连续变量或哑变量进行处理。
三者区别:
1、多重线性回归:用于寻找连续性因变量数值随多个自变量变化而变化的直线趋势;强调因变量为连续变量。如研究肺癌患者某肿瘤标记物的水平(连续变量)是否受年龄、性别、吸烟与否及数量等自变量的影响。操作流程为:
2、Logistic回归:用于分析分类变量(或等级变量)和一些影响因素之间的关系,由于因变量非连续变量,与自变量间失去了线性关系的可能性,于是经过Logit变化,将模型转换为线性关系;强调因变量为分类变量或等级变量。如研究肺癌患病与否(二分类变量)是否受年龄、性别、吸烟与否及数量等自变量的影响。以二分类Logistic回归为例,操作流程为:
3、Cox回归:用于研究多个因素对结局事件的影响;因变量与二分类Logistic回归相似,唯一的区别在于Cox回归的因变量引入了时间因素。如分析肺癌生存时间(二分类变量,含时间因素)是否受年龄、性别、吸烟与否及数量等自变量的影响。操作流程为:
可见,三种常用的回归模型有着某些相同点,也由于因变量的情况不同而适用于不同的数据。