首 页   本刊简介  编委会  审稿专家  在线期刊  写作规范  广告合作  联系我们
您现在的位置:首页 => >写作规范 > 统计学知识 >
线性回归分析的思路梳理
文章发布日期:2020-07-22   来源:SPSS学堂   作者:  点击次数:154次

 
调整字体大小:


 
  简单线性回归
  1 根据研究目的确定因变量和自变量。
  2 判断有无异常值。
  通过绘制散点图直观观察;亦可通过线性回归的【统计】→【个案诊断】→【所有个案】进行分析,若标准残差超过[-3,3],则可视为异常值。
  如果发现异常值,则首先应该检查是否是数据收集或录入方面的错误,如是则应及时纠正。如不是数据收集或录入方面的错误,则需根据实际情况,选择剔除或者保留异常值。
  3 判断数据是否满足简单线性回归假设条件。
  第一,线性(linear),因变量与自变量呈线性关系,通过绘制散点图判断。
  第二,独立性(independent),任意两个观察值之间相互独立,通过线性回归的【统计】→【德宾-沃森】进行分析,一般来说Durbin-Waston检验值分布在0-4之间,越接近2,观察值相互独立的可能性越大。
  第三,残差正态性(normal),随机误差近似正态性,可通过直方图或者P-P图判断残差是否符合正态分布。
  第四,通过线性回归的【图】→【产生所有部分图】,即可得到残差随着估计值的变化趋势,若所有点均匀分布于直线Y=0的两侧,则可认为方差齐性。
  4 估计回归模型参数,建立模型。
  5 对模型进行假设检验。
  对回归模型进行假设检验一般使用方差分析法,对回归系数进行假设检验一般使用t检验方法。
  多重线性回归
  1 根据研究目的确定因变量和自变量。
  2 判断有无异常值。
  通过线性回归-统计-个案诊断,线性回归-保存-勾选学生化删除、库克距离、杠杆值,根据新生成的学生化删除残差、库克距离、杠杆值来判断。
  学生化删除残差的值在-3至3的范围内,库克距离均小于1,杠杆值均均小于0.2,不存在异常值。
  如果发现异常值,则首先应该检查是否是数据收集或录入方面的错误,如是则应及时纠正。如不是数据收集或录入方面的错误,则需根据实际情况,选择去除异常值、转换异常值的变量,或者选用非参数分析法、最小一乘法来处理。
  3 判断数据是否满足多重线性回归假设条件。
  第一,因变量与所有自变量之间是否存在线性关系。
  通过建立未标化预测值(PRE_1)和学生化残差(SRE_1)的散点图判断,未标化预测值(PRE_1)和学生化残差(SRE_1)的散点图呈水平带状,则满足因变量与所有自变量之间存在线性关系的假设。
  第二,因变量与每一个自变量之间是否存在线性关系。
  通过线性回归的【图】→【产生所有部分图】中的散点图判断。
  第三,方差齐性。通过线性回归的【ANOVA】表的Sig值判断,小于0.05为方差齐性,大于0.05为方差不齐。
  第四,各自变量之间是相互独立的。
  通过线性回归的→【统计】→【共线性诊断】的结果,容许度越接近1,多重共线性越弱,膨胀因子越接近1,多重共线性越弱;膨胀因子小于10为弱多重共线性,大于10则存在严重共线性。
  如果各自变量之间存在严重共线性,则可选用岭回归或者主成分分析法来处理。
  第五,残差近似正态性。可通过直方图或者P-P图判断残差是否符合正态分布。
  4 估计回归模型参数,建立模型。
  可根据实际情况,选用强迫引入法、逐步引入法、强迫剔除法、向后剔除法、向前引入法来进行模型估计。
  方差不齐时,则需要用加权最小二乘法来进行模型估计。
  5 对模型进行假设检验。
  对回归模型进行假设检验一般使用方差分析法,对回归系数进行假设检验一般使用t检验方法。
 
 
 
 
地址:长春市东民主大街519号《临床肝胆病杂志》编辑部 邮编:130061 电话:0431-88782542/3542
临床肝胆病杂志 版权所有 Copyright © 2009 - 2013 Lcgdbzz.org. All Rights Reserv 吉ICP备10000617号

吉公网安备 22010402000041号