P值的统计学意义与临床意义的区别?

2017-12-06 佚名 交医临床研究中心

在医学科研领域,P值是特别神奇的数值,无数人为之欢喜或悲伤,甚至有无数种方法追求有统计学显著意义P值(P< 0.05)。但是我们真的应该只关注是否P< 0.05吗?P值有统计学意义等于有临床意义吗?

在医学科研领域,P值是特别神奇的数值,无数人为之欢喜或悲伤,甚至有无数种方法追求有统计学显著意义P值(P< 0.05)。但是我们真的应该只关注是否P< 0.05吗?P值有统计学意义等于有临床意义吗?

实际上在P值存在的90多年里,它一直饱受争议。一般来说临床研究的意义大抵可以分为两个水平,临床意义水平和统计学意义水平。临床意义显著性主要关注的是效应大小,而统计学学显著性主要关注的是P值。真正有临床意义的研究,不仅需要证明统计学角度有意义,更应该明确临床角度的获益程度。只关注P值给医学研究者们带来了很多困扰。有统计学显著意义的文章更容易发表,而可能同样重要的非统计学显著结果则锁在抽屉里,别人永远无法看到,这就是抽屉效应(File-drawer effect)。2014年《Nature》曾发表一篇新闻题为“Scientific method:Statistical errors”,其中提到:P值虽然是统计有效性的黄金标准,并不像许多科学家认为的那么可靠。也就是说,很多科学家在写论文时其实错用或滥用了P值这个概念。

当我们面临一个统计学上不显著的P值和有临床意义的组间差异,该如何抉择?

从数理统计的角度来看,P值大小的最重要影响因素是样本含量和组间差异大小。再微小的差异,达到足够大的样本量和测量精度,都能得到有统计学意义的P值;再大的差异,在样本量过小和测量精度不那么高的时候,也可能只能得到P>0.05。所以在临床研究中不应该唯P值是论,单看P值大小并不代表临床差异大小。美国统计学会(American Statistical Association, ASA)2016年正式发布的使用和解释P值的“六原则”中也提到:“P值或统计显著性并不能衡量效应的大小和结果的重要性。”。

当我们在开展临床研究时,得到了P<0.05的结果,该从哪些角度考虑和审视这个结果呢?

首先,考虑是否由于样本含量过小,统计学检验效能不足导致的阴性结果,可以根据目前研究所得到的数据,重新估算研究实际的检验效能,如果检验效能过低,一般认为可以进一步扩大样本含量进行研究;其次,临床研究结果用于指导实践,需要综合考虑试验设计、数据质量、实际临床获益、外部证据等等因素,决不能仅仅依靠P值下结论;最后,审视P值的同时应重点关注同时报道的效应量和可信区间,千万不要忘了环绕在P值周围的小伙伴们,比如OR值、RR值、HR值、95%CI等等,与P值进行同时报道,这些小伙伴们提供的信息往往比P值本身来得更有意义。

作者:佚名



版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (4)
#插入话题
  1. 2021-02-18 mxwssz

    无统计学意义的_有时更有意义

    0

  2. 2017-12-06 changjiu

    学习一下谢谢

    0

  3. 2017-12-06 惠映实验室

    学习了.生活需要统计学.

    0

相关资讯

美国统计协会吐槽P值滥用

P值的历史 P值得历史可以追溯到1770年,数学家拉普拉斯在处理50万左右的生育数据时,发现男性的生育率超过女性,对于这个无法解释的“超越”,他计算了一个叫做“P值”的东西,以确定这个“超越”是真实的。 很多统计学家误以为关于P值的正式文献是Fisher发表的,其实不然,最早在文献中正式阐述P值及其计算的,是统计学家Karl Pearson,你可能不了解他,但是他的Pearson卡方检验你

科学研究中数据分析的弊病-“P-值”

世界上顶尖的统计学家们发言称:目前的科学研究中需要停止使用P-值以及显著性差异作为检验他们实验结果是否重要的依据。也许你会觉得这个说法毫无道理。什么时候研究者们会用到P-检验呢?当发现实验结果的自变量与因变量之间存在一定的相关性,为了证明该相关性是合理的或仅仅是随机误差,他们会使用P-检验。P值越低,说明他们的结果可信度越高。如果P值小于0.05,就说明两组之间存在显著性差异(statistica

JAMA:生物医学文献中P值的演化

研究者对P值的使用和滥用产生了广泛的辩论。为了评估在过去25年生物医学文献的摘要和全文中大规模P值的报道,并探究除P值外其他统计信息出现的频率进行了一项研究。使用自动文本采集分析了文献中P值的报道,包括12 821 790篇MEDLINE摘要和1990-2015年PubMed中心(PMC)的843884篇摘要和全文。也评估了151个英文核心期刊和PubMed分类的特定的文章类型。随机抽取1000个

Nature:P值争议新一季:我们是否需要一个统一的P值阈值?

一部分科学家反对进一步提高统计显着性发现的认定标准。