# 四、假設檢定
###### tags: `統計學`
## 4.1 統計假設
**假設檢定**包含**統計假設**與**統計檢定**。
研究者提出統計假設,對它進行統計檢定,進而做出**統計決策**。
### 4.1.1 假設
**研究假設**,簡稱**假設**,是指「研究者對於所關心的現象或問題所抱持的觀點或信念」,或是「研究者對於研究問題所提出有待驗證的假設性看法」。
從統計的觀點來看,假設是變數間關係的**陳述**,有兩個內涵——變數與關係。前者說明研究者所分析的內容,後者是這些數據可能存在、需要被驗證的關係。「⋯⋯與⋯⋯相同/不同」、「⋯⋯與⋯⋯有關/無關」、「⋯⋯比⋯⋯高/低」、「⋯⋯影響⋯⋯」均是關係的文字描述。
### 4.1.2 虛無假設與對立假設
對於母體1與母體2的期望值 $\mu_1$ 與 $\mu_2$:
- **虛無假設**主張「母體1與母體2相同」(不具任何關係),以 $\text{H}_0: \mu_1 = \mu_2$ 表示。
- **對立假設**主張「母體1與母體2不同」(具有特定關係),以 $\text{H}_1: \mu_1 \neq \mu_2$ 表示。
### 4.1.3 虛無假設分布與對立假設分布
* 基於以上兩種假設而進行抽樣的抽樣分布分別是**虛無假設分布**($\text{H}_0$ 分布)、**對立假設分布**($\text{H}_1$ 分布),兩者的樣本空間機率和都是 $1.0$。
* 在沒有特定證據被提出以前研究者須承認 $\text{H}_0$ 為真,稱為「==保留 $\text{H}_0$==」。經分析後,發現變數間確實存在具有特定關係,則要承認 $\text{H}_0$ 為假,稱為「==拒絕 $\text{H}_0$、接受 $\text{H}_1$==」。
* 一般繪製假設檢定圖形時,僅能確認 $\text{H}_0$ 分布的集中趨勢(以平均數表示)與分散趨勢(以標準誤表示),而無法表示 $\text{H}_1$ 分配的確實位置與型態。
### 4.1.4 單尾假設與雙尾假設
研究者可能抱持不同的看法,而做出不同形式的假設。
- 「主張 $\mu_1$ 相同於或不同於 $\mu_2$」的假設稱為**無方向性**假設或**雙尾假設**,使用運算子 $=$ 或 $\neq$ 表達。用雙尾假設進行的檢定為**雙尾檢定**,對應到**雙尾機率**。

- 「主張 $\mu_1$ 大於或小於 $\mu_2$」的假設稱為**方向性**假設或**單尾假設**,使用運算子 $<$、$>$、$\leq$、$\geq$ (不等式)表達。用單尾假設進行的檢定為**單尾檢定**,對應到**單尾機率**。


注意:
- $\text{H}_0$、$\text{H}_1$ 為競爭關係,$\text{H}_0$ 的總是與 $\text{H}_1$ 互斥。
- 採用應採用母體符號系統(即 $\mu$、$\sigma$ 等希臘字母),因為假設檢定關心的是母體間的關係。
- 單/雙尾機率模式的結論並不同。
- 從結果來看,要拒絕雙尾假設的 $\text{H}_0$ 相對不容易。可以說雙尾假設比較保守而嚴格,單尾假設比較特定而寬鬆
當雙尾假設包含單尾假設的兩種狀況,就說單尾假設**嵌套於**雙尾假設之內。
## 4.2 假設檢定的程序
### 4.2.1 檢定量
- [**檢定統計量**](http://homepage.ntu.edu.tw/~clhsieh/biostatistic/6/6-5.htm),簡稱**檢定量**,是指將樣本統計量已特定數學關係加以轉換所得到的新統計量。
- 用 $z$ 分數形式得到 **$z$ 檢定量** $z_\text{obt}$ 。
- 用 $t$ 分數形式得到 **$t$ 檢定量** $t_\text{obt}$ 。
- 檢定量本身是隨機變數,因此檢定量的數據所形成分布可以估計其機率模式,檢定量所形成的分布是抽樣分布。
- $z$ 檢定量的分布服從 **$z$ 抽樣分布**。
- $t$ 檢定量的分布服從 **$t$ 抽樣分布**。
- 在某個檢定量在其對應的抽樣分布的基礎上,進行假設真偽的判斷,稱為**統計檢定**,
- 用 $z$ 抽樣分布可進行 **$z$ 檢定**。
- 用 $t$ 抽樣分布可進行 **$t$ 檢定**。
- 用 $F$ 抽樣分布可進行 **$F$ 檢定**。
### 4.2.2 顯著性
- 檢定量多為某種「效果」的強度與抽樣誤差的比值。==檢定量越大,代表「效果」大於抽樣誤差,反映出**顯著性**。==
- **顯著性檢定**:針對檢定量 $z_\text{obt}$ 或 $t_\text{obt}$ 將檢定量的顯著性判定為「顯著」或「不顯著」,稱為顯著性檢定。
- 顯著性檢定的判準有兩種——$p$ 法則($p$-rule)或臨界值法則(cv-rule)。
### 4.2.3 尾機率法則
- [**$p$ 值**](http://homepage.ntu.edu.tw/~clhsieh/biostatistic/6/6-6.htm):在一個機率分布上,比某個觀察值更極端的機率。由於此類極端事件分布在機率分布的尾端,故又稱為**尾機率**。
- 當檢定量接近 $\text{H}_0$ 分布的期望值,$p$ 值很大。
- 當檢定量遠離 $\text{H}_0$ 分布的期望值,$p$ 值很小。

- **$p$ 值**:計算檢定量在 $\text{H}_0$ 分布上的 $p$ 值,以此來判斷檢定量是否顯著。
- 研究者設定**顯著水準** $\alpha$(又稱為 $\alpha$ 水準)作為 $p$ 值的門檻。
- 顯著性判准如下表。
| 條件 | 宣稱 | 決策 |
|:-------------:|:----------------------------------------------------:|:------------------------------------:|
| $p<\alpha$ | 顯著 | 拒絕 $\text{H}_0$、接受 $\text{H}_1$ |
| $p\ge \alpha$ | 不顯著 | 保留 $H_0$ |
- 機率分布上比顯著水準還極端的區域稱為**拒絕區**。
- 當檢定量落入拒絕區,可以判定它過於極端而不屬於 $\text{H}_0$ 分布,也就是拒絕 $\text{H}_0$。
- 當檢定量未落入拒絕區,計算 $p$ 值 和顯著水準 $\alpha$ 時都是取左右兩半的和。

### 4.2.4 臨界值法則
我們也可以使用臨界值法則來進行顯著性檢定。
- **臨界值**就是對於某個抽樣分布與某個顯著水準而言,分隔拒絕區與非拒絕區的數值。
- 在 $z$ 分布中,臨界值以 $z_\text{cv}$ 表示;
- 在 $t$ 分布中,臨界值以 $t_\text{cv}$ 表示。
- 表示臨界值時,習慣上會把 $\alpha$ 標在下標。例如,
| 顯著水準 | 自由度 | 檢定形式 | 臨界值表示法 |
|:--------------:|:------:|:-------------:|:------------------------:|
| $\alpha = .05$ | 無 | 單尾 $z$ 檢定 | $-z_{.05}$ 或 $+z_{.05}$ |
| $\alpha = .01$ | 無 | 雙尾 $z$ 檢定 | $\pm z_{.005}$ |
| $\alpha = .01$ | $15$ | 雙尾 $t$ 檢定 | $\pm t_{.005(15)}$ |
- **臨界值法則**(cv法則):將 $\text{H}_0$ 分布上的檢定量與臨界值比大小,以此來判斷檢定量是否顯著。
- 拿 $p$ 值、顯著水準 $\alpha$ 比較大小,就相當於拿檢定量 $z_\text{obt}$ 與臨界值 $z_\text{cv}$ 比大小。所以 $p$ 法則與臨界值法則是等價的。
- 顯著性判准如下。
| 條件 | 等價條件 | 宣稱 | 決策 |
|:----------------------------------------------------------:|:-------------:|:--------------------:|:------------------------------------:|
| $\vert\pm z_\text{obt}\vert > \vert\pm z_\text{cv}\vert$ | $p<\alpha$ | 統計上有意義、顯著 | 拒絕 $\text{H}_0$、接受 $\text{H}_1$ |
| $\vert\pm z_\text{obt}\vert \le \vert\pm z_\text{cv}\vert$ | $p\ge \alpha$ | 統計上無意義、不顯著 | 保留 $H_0$ |
- 臨界值的數值特性:
1. 標準常態分布中,特定顯著水準對應到固定的臨界值,如下表所示。

2. 單尾檢定的臨界值大於雙尾檢定的臨界值。
3. 由於前一特性,對於同一大小的檢定量(不論正負),單尾檢定會比雙尾檢定更容易讓檢定量落入拒絕區而得到顯著結果,這種情形特別容易發稱在 $p$ 值很接近 $\alpha$ 的時候。參考下圖,同樣的 $z_\text{obtB}$ 在左圖單尾檢定下落入拒絕區,在右圖雙尾檢定下則否。

- 臨界值法則的使用限制:
1. 雖然臨界值法則容易判別檢定量的顯著性,也容易畫圖,但即使判斷檢定量落入拒絕區,也無法得知檢定量落入拒絕區的哪一位置。
2. 如果抽樣分配不是 $z$ 分布而是其他分布,例如 $t$ 分布、$F$ 分布,則在不同自由度下的臨界值不同,需要查表。
### 4.2.5 顯著性的標示
在學術界的論文撰述規定中(例如APA格式),會在檢定量右上方以星號($^*$)標示顯著性。方法如下:
- 當 $p<\alpha$,即「拒絕 $\text{H}_0$、接受 $\text{H}_1$」時,
- 若 $\alpha = .05$,標一個星號,例如 $z=2.12^*$。
- 若 $\alpha = .01$,標兩個星號 $z=2.12^{**}$。
- 若 $\alpha = .001$,標三個星號 $z=2.12^{***}$。
- 若使用異於常規的 $\alpha$,則標等「$^+$」、「$^\dagger$」特殊符號,例如 $z=2.12^\dagger$,並在行文中另外說明。
## 4.3 統計決策
### 4.3.1 統計決策的結果
綜合假設檢定的結果(保留 $\text{H}_0$、拒絕 $\text{H}_0$)和實際情況($\text{H}_0$ 為真、$\text{H}_0$ 為偽),統計決策會有四種結果:

### 4.3.2 正確決策與錯誤決策
積極意義的正確決定
消極意義的正確決定
第一類型錯誤,型一錯誤
第二類型錯誤,型二錯誤
檢定力
真陰性率 = 靈敏度
真陽性率 = 特異度
假陰性率
假陽性率

## 專有名詞中英對照
假設檢定, hypothesis testing
統計假設, statistical hypothesis
統計檢定, statistical testing
統計決策, statistical decision
研究假設, research hypothesis
假設, hypothesis
陳述, statement
虛無假設, null hypothesis
對立假設, alternative hypothesis
方向性, directive hypothesis
非方向性, non-directive hypothesis
單尾假設, one-tailed hypothesis
雙尾假設, two-tailed hypothesis
嵌套於, nested with
單尾檢定, one-tailed test
雙尾檢定, two-tailed test
單尾機率, one-tailed probability
雙尾機率, two-tailed probability
檢定統計量、檢定量, test statistic
統計顯著性, statistical significance
$p$ 法則, $p$-rule
$p$ 值, $p$-value
尾機率, tail probability
顯著水準, level of significance
顯著性檢定, test of significance
顯著, significant
不顯著, non-significant
拒絕, reject
拒絕區, region of rejection
臨界值, critical value (cv)
臨界值法則, cv-rule
型一錯誤, type-Ⅰ error
型二錯誤, type-Ⅱ error
檢定力, statistical power
偽陰性率, false negative rate
偽陽性率, false positive rate
真陰性率, true negative rate
真陽性率, true positive rate
靈敏度, sensitivity
特異度, specificity