來自常態分配隨機樣本的中央極限定理分析

# 來自常態分配隨機樣本的中央極限定理分析 ###### tags: `中央極限定理` `central limit theorem` `機率分配` `抽樣分配` --- ## 1. 常態分配相加還是常態常態分配(Normal distribution)以$Normal(\mu,\sigma^{2})$表示，其中，$\mu$為母體平均數，$\sigma$為母體標準差。假設$X_{1}, X_{2}, \cdots , X_{n}$獨立來自$Normal(\mu,\sigma^{2})$，代表$X_{i} \sim Normal(\mu,\sigma^{2}), i = 1, 2, ..., n$。 ### 1.1. $X_{1} + X_{2}$的分配想求得分配須先求得參數。常態分配的加減還是常態分配，而加減則反映在參數上。所以，我們要求得兩隨機樣本相加的參數。常態分配參數只有兩個，一個平均數，一個變異數。所以以下分別列出求得的結果。 $E(X_{1} + X_{2})= E(X_{1}) + E(X_{2})= \mu + \mu = 2 \mu$ $$Var(X_{1} + X_{2})= Var(X_{1}) + Var(X_{2}) - 2 Cov(X_{1}, X_{2})= \sigma^{2} + \sigma^{2} -0 = 2 \sigma^{2}$$ 所以，$X_{1} + X_{2}$的分配為$Normal(2\mu, 2\sigma^{2})$。依此類推，$X_{1} + X_{2} + \cdots + X_{n} \sim Normal(n \mu, n \sigma^{2})$。 ### 1.2. $\frac{X_{1} + X_{2}}{2}$的分配 $$E(\frac{X_{1} + X_{2}}{2})= \frac{1}{2} \times \bigg (E(X_{1}) + E(X_{2}) \bigg ) = \frac{1}{2} \times (\mu + \mu) = \mu$$ $$Var(\frac{X_{1} + X_{2}}{2})= \frac{1}{4} \times \bigg ( Var(X_{1}) + Var(X_{2}) - 2 Cov(X_{1}, X_{2}) \bigg ) = \frac{1}{4} \times (\sigma^{2} + \sigma^{2} -0) = \frac{\sigma^{2}}{2} $$ 所以，$\frac{X_{1} + X_{2}}{2}$的分配為$Normal(\mu, \frac{\sigma^{2}}{2})$。依此類推，$\frac{X_{1} + X_{2} + \cdots + X_{n}}{n} \sim Normal(\mu, \frac{\sigma^{2}}{n})$。 ### 1.3. 小結 1. 常態分配的特性在相加過程中維持常態分配，參數則可能有所改變，但維持母體平均數和母體變異數的線性組合。換言之，常態分配的加減維持穩定的分配特性。 2. 常態分配的母體平均數值和母體變異數值維持固定且相互不影響，甚至三階動差和四階動差各自為0和3的固定常數，這在分析過程中是非常方便的簡化假設，讓數學推導過程中更加輕鬆。 ## 2. 常態分配的隨機樣本之中央極限定理 > 中央極限定理是愈多隨機樣本的相加會趨近常態分配。 > 現在隨機樣本來自常態分配，常態分配相加還是常態分配。 > 所以來自常態分配的愈多隨機樣本相加還是常態分配，不是中央極限定理特性，而是常態分配自己的特性。來自常態分配的隨機樣本自身帶有常態分配，而參數如1.1和1.2的計算過程得到。所以隨著隨機樣本的個數$(n)$增加時，常態分配的隨機樣本相加或取平均數都是常態分配。根據[驗證中央極限定理的方法介紹文](https://hackmd.io/@meiyulee/SyscqAalc)，五種驗證方法都能夠得到愈多的隨機樣本服從常態分配。相關的驗證過程可觀看Youtube影片的第四部份。 {%youtube 7gS-LAtdGb4 %}