教師培訓
當前位置: 首頁 網絡教學 教師培訓 正文
    11 2017.06
科研助力:P值到底是什麼?
日期:2017.06.11 點擊:

在科研中P值是一個神奇的指标,但是現在又有種說法稱P值已死。為什麼?因為P值根本起不到我們期望的作用,甚至更絕望地說,P值根本就起不到這個作用。那究竟是怎麼一回事情呢?那麼,P值到底是幹什麼的?隻是上帝派來玩弄我們的嗎?它到底是真有用還是我們想的太多了?本文簡單談一下自己的一些小看法。

形狀分割線

簡單說一下P值的曆史,P值是由統計學界最牛的人Fisher老先生(相當于物理領域的牛頓級别人物)提出并推動的,這來源于他以及以後由奈曼和皮爾遜發展的假設檢驗思想(假設檢驗會在以後文中專門介紹)。簡單地說,如果你有一個50人的班級,已經知道你們班上50人的身高平均是4250px,如果現在給你1個人,身高是4750px,那麼讓你來判斷,這個人是不是你們班的人?

對于這個問題,你會怎麼判斷呢?很明顯,兩種答案,要麼是,要麼不是。通常我們會假定他是這個班上的人,因為即使是平均身高4250px,但也不是所有人都4250px,肯定有高有矮,高的人是有可能達到4750px的。但是我們不得不承認,對于一個平均身高是4250px的50人來說,出現一個4750px高的人,這種幾率是相當低的。這個“幾率”就是P值。

換句稍微專業一點的術語來說,對于一個均值是4250px的總體,有人的身高比均值高500px,如果這個人真的是這個群體中的,那麼出現500px這麼大的差異的概率有多大?這個概率就是P值。如果這個概率很小(如P值=0.01),那就可以說,出現這麼大的差異的概率隻有百分之一。對于這麼小的概率,我們認為它不大可能出現,也就是說,這個人不大可能是屬于這個群裡中的,更大的可能是屬于其他群體中的。

現在還面臨一個問題,P值到底小于多少,我們才能下結論認為這個人不大可能屬于這個群體呢?換句說話,小于多少才算“不大可能”?現在我們通用的标準是0.05,也就是說,概率小于5%,就認為“不大可能”。那這個0.05是怎麼來的呢?這個0.05也是Fisher老先生提出來的,可是他沒有對此做任何解釋,隻是說他突然想起來了,或許覺得0.05是他的幸運數字吧,然後就用0.05了,然後我們就一直沿用了。不管0.05是Fisher老先生的一個偶然想法還是怎麼樣,起碼我們真的就有了一個标準了。隻要能統一,始終是好事的,尤其在以前的時候。不過在當前計算機已經超級發達的時代,有這麼一個标準就不一定是好事了。很多人都曾有過這種經曆,P值正好等于0.049或0.052之類的。等于0.049的,感覺神都在眷顧他;等于0.052的,恨不得一頭去撞牆。也有人問過我,我的P值等于0.052,我可不可以四舍五入到0.05?

實際上,對于P值等于0.052之類的問題,也不用太煩惱。現在的雜志一般都要求提供具體的P值,而不是簡單寫為P比0.05多了千分之二的可能性,難道你覺得增加這千分之二的可能性可以讓你推翻你的結論嗎?我相信大多數人都不會這麼認為。所以你大可不必糾結于想方設法非要改成小于0.05的事情,大大方方地把自己的P值放上,我想讀者會有自己的判斷的。如果一個雜志因為你的P值=0.052而拒絕承認你的結論,我想這個雜志也不值得發表。

目前仍有人認為P值代表了差異大小,認為P值越小,差異越大,因此力求一個小的P值。而事實上,P值跟差别大小沒什麼太大關系,真正有關的反而是其他因素,比如例數的多少,這是個很重要的因素。例數少的話,就容易出現一個大的P值。以前就有臨床大夫質疑統計學,說:你看你們統計學,20個數據P值就大于0.05,我原封不動地複制成200個,P值就小于0.05,有統計學意義了。這不是在玩數字遊戲嗎?

我要說:你說的恰恰相反,20個數據時, P值大于0.05,不讓你有統計學意義,是在給你一個提醒,說明你的數據不足以支持你的結論。就像是你治療了20個人,即使都治好了,你如果宣稱治愈率100%,估計沒人會相信你。但是200個人就變成P值小于0.05,這正好說明了結論更可靠了,如果你對200個人治療還是都治好了,那你這時候說治愈率100%,我相信一定會有更多的人相信你。所以,好好想想P值吧,它是有現實意義的。統計學不是數字遊戲,而是讓你的結論更有說服力。靠什麼來體現你的結論的說服力呢,P值。

作者:楊老師 (中國統計網特邀認證作者)

本文轉自中國統計網