--- tags: Posibility --- # Ch03 一些機率分布 ## 3.2 二項和多項分布 ### 柏努利程序 - 嚴格地說,**柏努利程序必須具有以下的性質**: 1. 實驗由重複的數次試驗所組成。 2. 每次試驗均產生可分類為成功或失敗的一個結果。 3. 以 *p* 所表示的成功機率,在不同次試驗之間保持為常數。 4. 重複的數次試驗互為獨立的。 ### 二項分布 - 在 **n** 次柏努利試驗中的成功次數 ***X***,稱為一個**二項隨機變數 (binomial random variable)**。 - 此離散隨機變數的機率分布稱為**二項分布 (binomial distribution)**,且其值將以 $b(x; n, p)$ 來表示,因為他們與**試驗的次數**以及在一次所給試驗中**成功的機率**有關。 - 一次的柏努利試驗可產生具有機率 $p$ 的一次成功或具有機率 $q=1-p$ 的一次失敗。則二項隨機變數 $X$ (代表在 $n$ 次獨立試驗中成功的次數) 的機率分布為 $$ b(x; n, p) = (^{n}_{x})p^{x}q^{n-x},\ x=0,1,2,...,n $$ :::danger 二項分布 $b(x; n, p)$ 的平均數和變異數為 $$ \mu = np \ 和\ \sigma^2 = npq $$ ::: ### 多項分布 如果一個已知試驗可產生具有機率 $E_1,E_2,...,E_k$ 的 $k$ 個可能結果 $p_1,p_2,...,p_k$,則隨機變數 $X_1,X_2,...,X_k$ (代表在 $n$ 次獨立試驗中 $E_1,E_2,...,E_k$ 的出現次數) 的機率分布為 $$ f(x_1,x_2,...,x_k;p_1,p_2,...,p_k,n) = (^{n}_{x_1,x_2,...,x_k})p^{x_1}_{1}p^{x_2}_{x}...p^{x_k}_{k} $$ 其中 $$ \sum^{k}_{i=1}x_i = n\ \text{和}\ \sum^{k}_{i=1}p_i = 1 $$ ## 3.3 超幾何分布 - 一般而言,當從 $N$ 個物品中選取出一個大小為 $n$ 的隨機樣本時,我們所感興趣的是從 $k$ 個標記為成功的物品中選出 $x$ 個,且從 $N-k$ 個標記為失敗的物品中選出 $n-x$ 個的機率。 - 這稱為一個**超幾何實驗 (hypergeometric experiment)**,次實驗具有以下兩個性質: 1. 從 $N$ 個物品中選出一個大小為 $n$ 的隨機樣本並且**不放回去**。 2. 在此 $N$ 個物品中,$k$ 個可被分類為成功且 $N-K$ 個可被分類為失敗。 ![](https://hackmd.io/_uploads/HygJl6nL3.png) ![](https://hackmd.io/_uploads/HJ0-YlAUn.png) ## 3.4 負二項分布與幾何分布 **何謂負二項隨機變數?** - 在一個負二項實驗中產生 $k$ 次成功所需的試驗次數 $X$ 稱為**負二項隨機變數 (negative binomial random variable)**,而其機率分布稱為**負二項分布 (negative binomial distribution)**。 - 因為其機率取決於所要的成功次數和一次試驗成功的機率,所以我們應以 $b*(x;k,p)$ 表示他們。 ![](https://hackmd.io/_uploads/B1ToNZA8h.png) - 負二項分布縮減成如下的形式: $$ b*(x;1,p)=pq^{x-1},\ \ x=1,2,3... $$ 因為連續各項組成了幾何級數,習慣上將此特例稱為**幾何分布 (geometric distribution)** 並將其數值表示為 $g(x;p)$。 ![](https://hackmd.io/_uploads/rke9xzAL3.png) ## 3.5 卜瓦松分布與卜瓦松程序 - 產生一個隨機變數 $X$ (代表在一所給時段內或在一特定區域中出現結果的次數) 之數值的實驗稱為**卜瓦松實驗 (Poisson experiment)** 。 - 卜瓦松實驗是由**卜瓦松程序 (Poisson process)** 所衍生而來,並具有以下的性質。 1. 在一個時段內或在特定空間區域中出現的結果數量與在任意其他不相交的時段或區域內所出現的數量是**獨立**的。就此意義而言,我們說**卜瓦松程序沒有記憶**。 2. 在很短的時段內或在很小的區域中會出現單獨一次結果的機率,**與時段長度或區域大小成正比**,且與在此時段或區域外出現的結果次數無關。 3. 超過一次的結果會出現在如此短的時段內或落入至如此小的區域中的機率是可忽略的。 - 在一個卜瓦松實驗中出現的結果次數 $X$ 稱為**卜瓦松隨機變數 (Poisson random variable)** ,且其機率分布稱為**卜瓦松分布 (Poisson distribution)**。結果的平均次數由 $\mu = \lambda t$ 計算而來,其中 $t$ 是所感興趣的特定「時間」、「距離」、「區域」或「體積 ![](https://hackmd.io/_uploads/SkRfXXCIn.png) ![](https://hackmd.io/_uploads/rJy_UQR8h.png) ## 3.6 連續均勻分布 - **連續均勻分布 (continuous uniform distribution)**。此分布可用「平坦的」密度函數特性來描述,因而在一個封閉區間,如[A,B]內的機率是均勻的。 ![](https://hackmd.io/_uploads/rkFvYmA82.png) ![](https://hackmd.io/_uploads/rJy3tXRI2.png) ## 3.7 常態分布 ![](https://hackmd.io/_uploads/BkuxqmCUn.png) - 常態曲線的性質: 1. 眾數 (在橫軸上有曲線最大值的點) 出現在 $x = \mu$。 2. 曲線對稱於通過平均數 $\mu$ 的縱軸。 3. 曲線具有位在 $x = \mu \pm \sigma$ 處的反曲點; 如果 $\mu-\sigma < X < \mu + \sigma$,則它彎曲向下,否則彎曲向上。 4. 當我們開始以任一方向離開平均數時,常態曲線逐漸靠近橫軸。 5. 曲線之下及橫軸之上的總面積等於1。 ![](https://hackmd.io/_uploads/H1970e1vn.png) ## 3.8 常態曲線下的面積 ![](https://hackmd.io/_uploads/rJDMyZJvn.png) - 具有平均數 0 和變異數 1 之常態隨機變數的分布稱為**標準常態分佈 (standard normal distribution)**。 - **標準分數 $z$ (standard score)**,是藉由從單一(原始)分數中減去母體的平均值,再依照母體的標準差分割成不同的差距。 $$ z = \frac{X-\mu}{\sigma} $$ ## 3.10 連續均勻分布 ![](https://hackmd.io/_uploads/BJR1bD1Pn.png)