中文English
ISSN 1001-5256 (Print)
ISSN 2097-3497 (Online)
CN 22-1108/R

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

Nature:P值争议,我们是否需要一个统一的P值阈值?

阅读次数:2638
  • 分享到:

用微信扫码二维码

分享至好友和朋友圈

发布日期:2018-02-06
来源:Nature自然科研

一部分科学家反对进一步提高统计显着性发现的认定标准。

何为“显着性”发现?研究人员对此意见不一。2017年7月,72名研究人员将目标锁定P值,呼吁降低这个常用却饱受诟病的统计数值的阈值。9月18日,88名研究人员回应表示,更好的解决方式是让学者证明他们使用某个特定P值的合理性,而不是随意采用一个阈值。
几十年来,P值一直被用于衡量显着性,但是学者越来越意识到它的缺陷以及它被滥用的可能。2015年,一本心理学期刊全面禁止使用P值。
P值被用来检验“零假设”,一个假定被检测的现象之间不存在任何关联的默认状态。P值越小,结果为随机产生的可能性越小——假定该零假设是真的。当P值小于0.05时,结果通常被认为“具有统计显着性”——零假设被推翻。
7月,一些研究人员(包括积极推动提高研究结果再现性的人)在PsyArXiv预印本平台发表了一篇评论文章(之后发表在《自然-人类行为》上),认为该阈值应该降低至0.005,以防止假阳性出现在社会科学和生物医学文献中。
但是,该文章的第一作者、荷兰爱因霍芬科技大学的实验心理学家Daniel Lakens说:“在所有科学领域都推行一个阈值太极端了。”“当你让大家解释自己的研究时,科学就会进步,”他补充道。
意外后果
一些研究人员担心降低P值阈值会加剧“发表偏倚”(包含阴性结果的研究得不到发表)。更严格的P值阈值也有可能导致更多的假阴性——称一种实际存在的现象不存在。“在你执行任何一条政策前,你必须确定不会产生任何预期之外的负面结果,”Lakens说。
他和同事提出,研究人员应该在收集数据前,选择他们实验的P值阈值,并说明理由。阈值的大小将基于研究发现的潜在影响力以及它的惊人程度等因素。这样的阈值可以通过注册报告(registered reports)加以评估。注册报告指这样一类科学文章,在开展实验前,报告中的实验方法和拟议分析要先经过同行评议。
“我认为没有一个研究人员会主动说他们需要一个更严格的证据阈值,”德州农工大学的统计学家Valen Johnson提出反对意见,他是上述7月发表的文章的其中一位作者。而另一位作者、南加州大学的行为经济学家Daniel Benjamin则表示,许多科学家都倾向于宽待自己的研究。
但是Lakens认为通过研究人员提供的理由和解释,就能看清任何企图操控P值的行为。“至少所有人都认为改变0.05这未经仔细考量的数值是件好事,”他说。
美国统计协会的执行总监Ronald Wasserstein指出,为证据标准设定特定阈值“对科学无益”。去年,该协会发布了关于使用P值的明确建议,这在其177年的历史上还是第一次。
Wasserstein说他还没有加入目前关于P值阈值的争论,但是表示“我们应该接受不止存在一个‘魔法’数字”。
 
原始出处:One-size-fits-all’ threshold for P values under fire.nature.19 September 2017
  • 分享到:

用微信扫码二维码

分享至好友和朋友圈

阅读次数:2638
  • 1 病毒性肝炎
    • 1.1 乙型肝炎
    • 1.2 丙型肝炎
    • 1.3 甲型肝炎
    • 1.4 戊型肝炎
    • 1.5 其他肝炎
  • 2 肝硬化及并发症
  • 3 酒精性肝病
  • 4 非酒精性脂肪性肝病
  • 5 肝衰竭/肝性脑病/人工肝
  • 6 肝肿瘤
  • 7 自身免疫性肝病
  • 8 药物性肝病
  • 9 肝移植
  • 10 其他肝病
    • 10.1 遗传及代谢性肝病
    • 10.2 胆汁淤积性肝病
    • 10.3 肝脏血管病
  • 11 一般肝病/肝脏检查
  • 12 胆道疾病
  • 13 胰腺疾病
  • 14 全身疾病与肝病/内镜
  • 15 肝胆胰疾病相关评分系统汇总