中文English
ISSN 1001-5256 (Print)
ISSN 2097-3497 (Online)
CN 22-1108/R

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

方差分析中深层次统计学问题

阅读次数:1609
  • 分享到:

用微信扫码二维码

分享至好友和朋友圈

发布日期:2015-09-07
来源:MedSci

1、关于正态性检验的问题

     正态性检验是统计学分析中非常基础的一个问题,但也很关键,它牵扯到你应该使用什么样的方法,数据是否满足正态性决定了你是否应采用参数方法还是非参数方法。所谓正态性检验,也就是看你的数据是不是满足正态分布,也就是说,如果把你的数据做个频数图,是不是看起来像个钟形。

    正态性检验最简单的就是直接画频数图,看形状是不是类似于对称的钟形形状,如果有明显的数据都集中在某一边,那图形看起来就会偏向一侧,这可能意味着你的数据不满足正态性,可以考虑用非参数方法来分析。

    正态性检验常用的有四种方法,即Shapiro-Wilk检验、Kolmogorov-Smirnov检验、Cramer-von Mises检验和Anderson-Darling检验。这是SAS软件中输出的四种检验。

    Shapiro-Wilk检验是专门用于正态性检验的方法,其思想是基于峰度和偏度来考虑偏离正态的程度,该法可用于例数在3至50之间。但后来经Royston改进后,可用于例数在3至2000之间的正态性检验。因此,有的统计书上还在强调说SAS中的Shapiro-Wilk检验只能用于50例以下的数据,实际上是不对的,作者没有仔细看一下方法的进展。SAS中输出的Shapiro-Wilk检验是可以用在2000例以内数据的检验的。

    其余三种方法是通用方法,可用于多种分布的拟合优度检验,正态性检验只是其中之一。其思想都是基于理论分布函数与实际分布函数的差距,当假定理论分布函数是正态分布时,便是正态性检验。当假定理论分布为其它分布(如Poisson分布)时,便成了其它分布的拟合优度检验。

所以说,Shapiro-Wilk检验是专门检验正态分布的,其它三种方法是顺便检验的。就像诺基亚是专做手机的,而联想只是业余做手机的,也做其它的,手机只是其中之一。

    正常情况下,如果例数在2000以内,Shapiro-Wilk检验可作为首选的结果,该法具有较好的检验效能。

    对于图形验证和方法检验,个人倾向于图形方法,因为方法的检验过于敏感,略微偏离正态便会给出阳性结果,认为数据不满足正态分布。而实际中数据的轻度偏离不会对结果造成多大影响,尤其样本量较大的时候,仍然可以采用参数检验,其结果是稳健的。因此,如有可能,可以既作检验,也绘制图形,两者结合来判断,不一定非要以检验的结果为准。

2、关于方差分析两两比较方法的选择

     进行方差分析时,如果多组间比较认为总的有统计学差异,通常还可进一步做组间多重比较。

多重比较的方法比较多,这里主要介绍sas软件中常用的方法,主要有Tukey法、Scheffe法、Bonferroni法、Dunnett法等。

    Tukey法只能用于组间例数相同的情形,而且只能用于成对的两两比较。

    Scheffe法可用于组间例数不等的情形,不仅可用于成对的两两比较,而且还可以用于综合比较,如组2、3的均值与组1进行比较。

    Bonferroni用途最广,几乎可用于任何多重比较的情形,包括组间例数相等或不等、成对两两比较或综合多重比较等。

    Dunnett法主要用于多个实验组与一个对照组的比较,实验组之间不做比较。

如果各组间例数相等,Tukey法效率较高,这也是国外不少统计学家喜欢用的方法。但在国内tukey法始终不流行,甚至很少有人知道他的名字,不知道为什么。国内最流行的方法是Bonferroni法,我想可能是因为这一方法理解和计算最简单吧。但不管怎样,该法应用也没什么大错,只要比较次数不多,用起来还是蛮有用的。

    如果比较次数太多,比如10次甚至更多,用Bonferroni法就有问题了,临界p值会变得特别小,你可能会发现总的组间有差异,但两两比较却都达不到临界值,因为比较次数太多,导致p值太小,无法拒绝h0。所以此时可以考虑用Scheffe法。Scheffe法在国内也不流行,同样不知道为什么。也行是因为教材上不大介绍吧,可见国内学生深受教材毒害之深。好像教材上介绍的才是权威,其实不然,教材上介绍的不一定是最好的,而是最不容易犯错误的,也就是说,不求有功,但求无过。

不同书中对如何选择比较方法各有观点,因为确实没有一种方法能完全压倒所有的,所以必然存在争议。所以最好的做法就是自己仔细看一下这些方法的原理,这样在选择时就有底了,也就有依据了。

3、关于方差齐性检验

     方差齐性检验与正态性检验一样,也是决定你采用何种统计分析方法的一个重要条件。

当两组数据做组间比较时,如果两组数据符合正态分布但方差不齐,可以考虑用Cochran近似t检验或Satterthwaite近似t检验,这两种近似t检验分别通过对临界值或自由度的调整实现对t检验结果的校正。

    当多组数据做组间比较时,如果数据为正态分布但方差不齐,有时也采用Welch检验。但通常情况下,即使方差不齐,只要不是很严重,仍可采用方差分析。只有在方差齐性偏离较大时才用该法或用非参数检验。

    两组比较时,方差齐性检验常采用F检验,其思想是以两组中较大的方差除以较小的方差,其值越大,越有理由认为方差不齐。

    多组比较时,常用的有四种方差齐性检验,分别为Bartlett检验、Levene检验、BF检验和O’Brien’s检验。

    Bartlett法主要用于正态数据的检验,一旦数据偏离正态,结果会导致较大偏差。

    Levene法可用于非正态数据的检验,反映了对均值的偏离程度。

    O’Brien’s法是对Levene法的修正方法,也是基于对均值的偏离程度。

    BF法是基于对中位数的偏离程度。

    统计模拟显示,BF法对控制一类错误的效能较高,但组别较多时可能不是很合适。实际中最常用的是Levene法。

 

  • 分享到:

用微信扫码二维码

分享至好友和朋友圈

阅读次数:1609
  • 1 病毒性肝炎
    • 1.1 乙型肝炎
    • 1.2 丙型肝炎
    • 1.3 甲型肝炎
    • 1.4 戊型肝炎
    • 1.5 其他肝炎
  • 2 肝硬化及并发症
  • 3 酒精性肝病
  • 4 非酒精性脂肪性肝病
  • 5 肝衰竭/肝性脑病/人工肝
  • 6 肝肿瘤
  • 7 自身免疫性肝病
  • 8 药物性肝病
  • 9 肝移植
  • 10 其他肝病
    • 10.1 遗传及代谢性肝病
    • 10.2 胆汁淤积性肝病
    • 10.3 肝脏血管病
  • 11 一般肝病/肝脏检查
  • 12 胆道疾病
  • 13 胰腺疾病
  • 14 全身疾病与肝病/内镜
  • 15 肝胆胰疾病相关评分系统汇总