假設檢定 - HackMD

# 假設檢定假設檢定在做的事情是，根據手中取得的資料，判斷在某個特定假設成立的狀況下觀察到這樣資料的可能性有多高」。 ## 一個買雞蛋的例子小明某一天在樓下買雞蛋的時候，聽到老闆說「我賣的是大顆的雞蛋，一顆有80公克重」，心想大顆的雞蛋吃起來比較過癮，就跟老闆買了三盒(一盒8入)回家。但沒想到買回家之後隨便拿起一顆放到磅秤上一量發現居然只有70公克(**小明是個謹慎的人**)，因此下樓質問老闆為什麼跟說的不一樣。老闆說：「每個蛋還是有大有小啦，我的意思是平均而言，我賣的蛋每顆有80公克那麼重」，之後就去招呼其他客人了。小明上樓量了一下每顆蛋的重量，發現這24顆蛋平均而言只有74.0公克，又跑下樓準備找老闆吵架。老闆聽完之後又說：「每次我裝盒子的時候就是隨便拿八顆，沒有在量他們到底多重啦，阿本來就有可能剛好都拿到小顆一點的蛋所以重量稍微少一點」，小明想了一下感覺也對，但是有科學精神的小明為了判斷老闆到底有沒有說謊，還是他只是剛好運氣差，決定做個假設檢定來確認。 ### 假設檢定脈絡小明的思考脈絡是這樣子的，假設老闆沒有說謊，那小明手上的24顆蛋(**樣本**)就是從平均80公克的一大堆蛋(**母群**)裡面隨機拿出來的(這個假設叫做**虛無假設**)，因此我們可以這樣做 a. 從這個母群裡面隨便拿24顆蛋 b. 計算這24顆蛋的平均重量 c. 紀錄平均重量之後把蛋放回母群裡面重複這個流程超級多次(N次)之後，我們就可以得到N個24顆蛋的平均重量，代表的是如果我從母群隨機拿24顆蛋並且算重量的話可能的數值狀況(也就是**樣本平均數的抽樣分配**)，接著再比較實際上買的24顆蛋重量平均是不是屬於這堆數值中比較極端的狀況，如果是的話就可以推論我們手上拿到的蛋比較不可能是從這個假想的母群中取得的(**拒絕虛無假設**)，但如果手上的蛋其實重量平均不是這群數值中比較極端的狀況，那我們就會推論這批蛋的確可能是從假想的母群中隨機取出來的，而計算出來的平均數比較低/高只是因為運氣比較差(**保留虛無假設**)。而在極端狀況的設定上，小明覺得只有在蛋的重量過小時才需要判斷成極端狀況，另外他決定以0.05作為門檻(**p-value**)，意思是如果手上的平均數在抽樣分配中最小的5%數值中，那就拒絕虛無假設(老闆騙人)，反之則保留虛無假設(老闆沒騙人)。 ![](https://i.imgur.com/MFPuQ4c.png) ### 抽樣分配估計想完之後小明差點就要衝下樓開始從老闆的貨車上面拿蛋跟計算重量了，室友阿綱默默看著這一切，最後還是決定阻止小明。阿綱說：「你忘記統計課上老師有教了嗎？我們其實不用真的花時間實際去量雞蛋的重量，在這個問題上統計學家有推論出，如果原本那一大堆雞蛋的重量是常態分配的話，那取24顆蛋作為樣本計算平均形成的抽樣分配也會符合特定的分配，而且從手上的樣本就可以估計出這個抽樣分配的平均數跟標準差」。 (計算過程下略...) 經過一番努力之後，阿綱幫小明計算出以下的數值 - 手上樣本 - 平均數: 74.0 - 標準差: 14.7 - 虛無假設成立下樣本平均數的抽樣分配 - 平均數: 80.0 - 標準差(*註*): 3.0 `註: 樣本平均數抽樣分配的標準差又被稱作"標準誤"` 另外針對這個問題，阿綱也推論出這個樣本平均數的抽樣分配會符合自由度為23的t分配，因此他請小明先計算手上的樣本平均是在抽樣分配中的什麼位置，小明的公式如下： ``` t = (74 - 80)/3.0 = -2.0 ``` 意思是小明這次買到的雞蛋重量平均在虛無假設符合的狀況下距離抽樣分配的平均-2.0個標準差的位置(*註*)。 `這邊計算出來的t值叫做"檢定統計量"` 接著阿綱查了一下後得到「在自由度為23的t分配中，只有0.028722比例的資料會落在低於平均數2.0個標準差以外的地方」，以小明先前設定的極端值門檻為0.05做比較，已經落在門檻之外，代表這筆資料的平均數的確在抽樣分配中是屬於極端的狀況。 ![](https://i.imgur.com/wjmQeOc.png =334x271) 阿綱下了一個結論：「看起來這個結果在統計上顯著(*p*<.05)，拒絕虛無假設，代表老闆應該是騙你的，你要不要再去找老闆問看看？」話還沒說完，已經聽到小明在樓下跟老闆大小聲了。