# 來自常態分配隨機樣本的中央極限定理分析
###### tags: `中央極限定理` `central limit theorem` `機率分配` `抽樣分配`
---
## 1. 常態分配相加還是常態
常態分配(Normal distribution)以$Normal(\mu,\sigma^{2})$表示,其中,$\mu$為母體平均數,$\sigma$為母體標準差。
假設$X_{1}, X_{2}, \cdots , X_{n}$獨立來自$Normal(\mu,\sigma^{2})$,代表$X_{i} \sim Normal(\mu,\sigma^{2}), i = 1, 2, ..., n$。
### 1.1. $X_{1} + X_{2}$的分配
想求得分配須先求得參數。常態分配的加減還是常態分配,而加減則反映在參數上。所以,我們要求得兩隨機樣本相加的參數。
常態分配參數只有兩個,一個平均數,一個變異數。所以以下分別列出求得的結果。
$E(X_{1} + X_{2})= E(X_{1}) + E(X_{2})= \mu + \mu = 2 \mu$
$$Var(X_{1} + X_{2})= Var(X_{1}) + Var(X_{2}) - 2 Cov(X_{1}, X_{2})= \sigma^{2} + \sigma^{2} -0 = 2 \sigma^{2}$$
所以,$X_{1} + X_{2}$的分配為$Normal(2\mu, 2\sigma^{2})$。
依此類推,$X_{1} + X_{2} + \cdots + X_{n} \sim Normal(n \mu, n \sigma^{2})$。
### 1.2. $\frac{X_{1} + X_{2}}{2}$的分配
$$E(\frac{X_{1} + X_{2}}{2})= \frac{1}{2} \times \bigg (E(X_{1}) + E(X_{2}) \bigg )
= \frac{1}{2} \times (\mu + \mu) = \mu$$
$$Var(\frac{X_{1} + X_{2}}{2})= \frac{1}{4} \times \bigg ( Var(X_{1}) + Var(X_{2}) - 2 Cov(X_{1}, X_{2}) \bigg ) = \frac{1}{4} \times (\sigma^{2} + \sigma^{2} -0) = \frac{\sigma^{2}}{2} $$
所以,$\frac{X_{1} + X_{2}}{2}$的分配為$Normal(\mu, \frac{\sigma^{2}}{2})$。
依此類推,$\frac{X_{1} + X_{2} + \cdots + X_{n}}{n} \sim Normal(\mu, \frac{\sigma^{2}}{n})$。
### 1.3. 小結
1. 常態分配的特性在相加過程中維持常態分配,參數則可能有所改變,但維持母體平均數和母體變異數的線性組合。換言之,常態分配的加減維持穩定的分配特性。
2. 常態分配的母體平均數值和母體變異數值維持固定且相互不影響,甚至三階動差和四階動差各自為0和3的固定常數,這在分析過程中是非常方便的簡化假設,讓數學推導過程中更加輕鬆。
## 2. 常態分配的隨機樣本之中央極限定理
> 中央極限定理是愈多隨機樣本的相加會趨近常態分配。
> 現在隨機樣本來自常態分配,常態分配相加還是常態分配。
> 所以來自常態分配的愈多隨機樣本相加還是常態分配,不是中央極限定理特性,而是常態分配自己的特性。
來自常態分配的隨機樣本自身帶有常態分配,而參數如1.1和1.2的計算過程得到。所以隨著隨機樣本的個數$(n)$增加時,常態分配的隨機樣本相加或取平均數都是常態分配。
根據[驗證中央極限定理的方法介紹文](https://hackmd.io/@meiyulee/SyscqAalc),五種驗證方法都能夠得到愈多的隨機樣本服從常態分配。
相關的驗證過程可觀看Youtube影片的第四部份。
{%youtube 7gS-LAtdGb4 %}