两个变量之间存在一次方函数关系,就称它们之间存在线性关系。临床医学统计中有三种主要的线性关系:线性相关(Pearson相关)、秩相关(Spearman相关)和曲线相关(曲线拟合)。
一、线性相关
线性相关是最常见的相关分析,也叫做Pearson相关分析。定性资料相关:当一个变量增大,另一个变量也随之增大,称为共变或相关。两个变量有共变现象即称有相关关系。反映两定量指标间呈线性关系趋势的关系称为线性相关,又称简单相关,统计学指标为Pearson相关系数。
两变量间的线性关系密切程度与相关方向用直线相关系数r表示(-1≤ r ≤ 1)。r>0为正相关,r<0为负相关,r=0为零相关或无相关,|r|=1为完全相关,|r|越大说明相关程度越密切。
案例:
求总胆固醇(TC)与低密度脂蛋白(LDL)间的相关性。
分析思路:散点图 » 计算相关系数 » 相关系数的假设检验。
SPSS相关分析模块
Bivariate(双变量):用于进行两个/多个变量间的参数/非参数相关分析。如果是多个变量,则给出两两相关的分析结果。最常用——线性相关、秩相关。
Partial(偏相关):如果需要进行相关分析的两个变量,其取值受到其他变量的影响,则偏相关分析可以对其他变量进行控制,输出控制其他变量后的相关系数。
Distance(距离):该过程一般不单独用,作为因子分析、聚类分析和多维尺度分析的预分析过程。
SPSS » Analyze » correlate » bivariate correlation
结果
计算相关系数:Pearson相关系数r=0.491>0,说明正相关。相关系数的假设检验:P<0.001,说明该r具有统计学意义。
注意事项:
1、进行线性相关分析前,必须先做散点图,以初步判断两变量之间是否存在相关趋势?该趋势是否为线性趋势?以及数据中是否存在异常点?
2、相关分析不一定是因果关系!
例如:某夫妇生儿种树,儿长树高,相关关系有统计学意义,但非因果关系。
二、秩相关
秩相关也叫等级相关或Spearman秩相关,适用于非正态/总体分布未知/分类等级资料的相关分析。秩相关分析对原变量的分布不作要求,属非参数统计方法;最常用的统计量为Spearman秩相关系数,又称等级相关系数。
Spearman等级相关分析步骤:将各变量X,Y分别编秩RX, RY;计算RX与RY的Pearson相关;所得结果即为Spearman等级相关rS(-1≤rs≤1)。
案例
求总胆固醇(TC)与年龄等级间的相关性。其中,年龄等级划分如下:<45=1;45~60=2;61~75=3;>75=4。
SPSS软件操作
Analyze » correlate » bivariate correlation
Kendall 与Spearman比较:两者均对数据进行排序。但Spearman是以复合样本整体进行排序,而Kendall‘s是以每个样本单独进行排序,考察其方向的一致性。Spearman比较常用!
结果
Spearman相关系数为-0.017,给出两个信息!P<0.001,说明相关系数具有统计学意义。
相关系数绝对值越大,相关性越强。
注意事项:对于相同的数据,Spearman相关系数和Kendall‘s相关系数的绝对值均小于Pearson相关系数,显然是由于秩变换或者数据有序分类处理时损失信息所导致的。Spearman相关系数的计算公式可以完全套用Pearson相关系数的计算公式,但公式中的X和Y用对应的秩次代替即可。
三、曲线相关
曲线相关,也就是曲线拟合,当两变量关系不呈线性变化且有曲线趋势时,如何选择相应的曲线模型。一般步骤:①依据分析目的确定X与Y,根据两变量散点图、结合专业知识选择曲线类型;②求回归方程:曲线直线化;③拟合优度:R2,反应两变量曲线关系的密切程度。
SPSS操作
Analyze » Regression » Curve Estimation