Probability (I), Benson === [TOC] # Week 1 # Probability ## Difference between Probability and Statistics - **機率**:機率模型*已知*,我們如何計算某些事件發生的機率 - Ex: 已知一骰子為公平骰,看到偶數的機率為何? - **統計**:機率模型*未知*,我們如何透過大量實驗結果建立機率模型 - Ex: 不知一骰灌鉛否,欲知各點出現之機率模型? ## 集合論 (Set) - 機率函數的*自變數*是:事件 - 而**事件**是一種**集合** ### De Morgan's Law - $(A\cup B)^C = A^C\cap B^C$ - $^C$ 表示補集 - 證明參考投影片 ## 機率名詞 一個機率實驗 (Experiment) 包含了 1. 步驟(procedures) 2. 模型(model) 3. 觀察(observations) - 結果(outcome)是實驗中可能的結果 - 樣本空間(sample space)是機率實驗所有可能的結果的集合,通常用 $S$ 來表示 - 事件(event)指的是對於實驗結果的某種敘述,可以看成是「結果(outcome)」的集合,亦即是「樣本空間(sample space)」的子集 - 事件空間(event space)是包含所有事件的集合 機率可以看成是一個映射 $P(事件) = 0.6 \implies$ 機率函數的自變數是:**事件**! **機率函數是從「事件空間」映射到 $[0, 1)$** --- # Week 2 # Axioms of Probability 機率三公理 1. 對任何事件 $A$ 而言,$P(A)\geq 0$ 2. $P(S) = 1$,$S$ 即宇集 3. 事件 $A_1, A_2, ...$ 互斥,$\implies P(A_1\cup A_2\cup ...) = P(A_1)+P(A_2)+...$ # 公理衍伸之機率性質(可證) - 若 $E = \{o_1,o_2,...,o_n\}$,則 $P(E) = P(\{o_1\})+P(\{o_2\})+...+P(\{o_n\})$ - $P(\phi)=0$ - $P(A) = 1-P(A^C)$ - $P(A) = P(A-B) + P(A\cap B)$ - $P(A\cup B) = P(A)+P(B)-P(A\cap B)$ ## 切麵包定理 (圖) 若 $C_1, C_2, ... ,C_n$ 互斥且 $C_1\cup C_2\cup...\cup C_n = S$ 則對任何事件 $A$:$P(A) = P(A\cap C_1)+P(A\cap C_2)+...+P(A\cap C_n)$ ## Boole's 不等式 $P(\cup_{i=1}^n A_i)\leq \sum_{i=1}^n P(A_i)$ ## Bonferroni's 不等式 $P(\cap_{i=1}^n A_i)\geq1-\sum_{i=1}^n P(A_i^C)$ # Conditional Probability 條件機率 $P(X|Y) = \dfrac{P(X\cap Y)}{P(Y)}$ ## 講法 - condition on - Suppose - if - Assuming - given that ## Properties of Conditional Probability 1. $P(X|Y) = \dfrac{P(X\cap Y)\geq0}{P(Y)\geq 0}\geq 0$ 2. $P(Y|Y) = 1$ 3. $A, B$ 互斥$\implies P(A\cup B|Y) = \frac{P(A)}{P(Y)}+\frac{P(B)}{P(Y)} = P(A|Y) + P(B|Y)$ ## Total Probability 定理 若 $C_1, C_2, ..., C_n$ 互斥且 $C_1\cup C_2\cup ... \cup C_n = S$,則對任意事件 $A$,我們有: $P(A) = P(A|C_1)P(C_1)+P(A|C_2)P(C_2)+...+P(A|C_n)P(C_n)$ - 可直接由切麵包定理推得 ## Bayes' Rule 貝式定理 若 $C_1, C_2, ..., C_n$ 互斥且 $C_1\cup C_2\cup ...\cup C_n=S$ 則對任意事件 $A$,我們有: $P(C_j|A) = \dfrac{P(A|C_j)P(C_j)}{\sum_{i=1}^nP(A|C_i)\cdot P(C_i)}$ ## 要不要換? (+圖文) (利用切麵包定理?) $C_1$: 第一次就抽到大獎 $C_2$: 第一次沒抽到大獎 $A$: 換了拿大獎 $A^c$: 換了沒拿到大獎 $P(C_1) = 1/3$ $P(C_2) = 2/3$ $P(A) = P(A|C_1)P(C_1) + P(A|C_2)P(C_2)\\ =0\cdot 1/3 + 1\cdot 2/3 \\ = 2/3$ --- # Week 3 # Independence 機率的獨立性 ## 常見定義 若兩事件 $A, B$ 之機率滿足 $P(A\cap B) = P(A)\cdot P(B)$ 則 $A, B$ 稱為機率上的獨立事件 ## 更好的定義 $P(A|B) = P(A)$ 則稱 $A, B$ 獨立 ## 多事件之獨立 若事件 $A_1, A_2, ..., A_n$ 滿足下列條件,則稱此 $n$ 事件獨立 ($n>2$) - 從中任選 $m$ 事件 $A_{i_1}, A_{i_2}, ...,A_{i_m}$ 均滿足 $P(A_{i_1}\cap A_{i_2}\cap...\cap A_{i_m}) = P(A_{i_1})P(A_{i_2})...P(A_{i_m}),\,m=2,3,...,n$ # 圖解繁複機率 略 # 排列組合算機率(數數) ## 重要判斷 - 所有物件是否可區分? - 實驗中抽選的物件是否放回供下次抽選? - 抽選順序是否有差異? (以下略) ## 排列 ## 重複選取 ## 組合 ## 多項組合 ## 應用在機率上 --- # Week 4 # Random Variable - *隨機變數* 的本質是 **函數** - input 是 outcome,output 是實數 ## 離散 RV v.s. 連續 RV - 離散 R.V. 的值是有限個,或是「可數的」無窮多個 - 連續 R.V. 的值是有無窮多個,而且是「不可數」的無窮多個 ## 無窮集合的元素數量 - 正整數的集合 跟 正偶數的集合,裡面的東西**一樣多** - 「長度為一的線段上的點」跟「邊長為一的正方形上的點」數量一樣多 **一樣多是因為都可以找到一對一的映射** ## RV 的函數 - *隨機變數的函數* 也是 **隨機變數** # CDF (Cumulative Distribution Function 累積分布函數) - CDF 就是 機率 - $F_X(x) \triangleq P(X\leq x)$ - $P(a<X\leq b) = F_X(b) - F_X(a)$ ## CDF 性質 - discrete R.V. 的 CDF - continuous 的 CDF # PMF (Probability Mass Function 機率質量函數) - $p_X(x) \triangleq P(X=x)$ - 任何一個 PMF (或之後介紹的PDF) 都是一種機率分布 - 機率分布:將總和為 1 的機率 分布在點上 ## Relationship between PMF and CDF - $F_X(x) = \sum_\limits{n=-\infty}^{\lfloor x\rfloor}p_X(n)$ - $P_X(x) = F_X(x^+)-F_X(x^-)$ --- # Week 5 # Discrete Probability Distributions ## Bernoulli distribution - **一次實驗**,2種結果。在意某結果是否發生 => Bernoulli 機率分布 - 實驗成功機率為 $p$,做 $1$ 次實驗,$X$ 表示成功次數,則 $X\sim Bernoulli(p)$ ## Binomial distribution - **n 次實驗,出現某結果 $x$ 次**之機率 -> Binomial 機率分布 - 實驗成功機率 $p$,做 $n$ 次實驗,$X$ 表示成功次數,則 $X\sim BIN(n, p)$ - $p_x(k) = P(X=k) = C^n_k p^k(1-p)^{n-k}$ ## Uniform distribution - $1$ 次實驗,$n$ 種結果,各結果機率相等,在意某結果發生否 -> Uniform distribution - $X \sim UNIF(3, 7)$ ## Geometric distribution - 某 outcome 發生的機率為 $p$,做第 $X$ 次實驗才發生該 outcome,$X=x$ 的機率? - 機率 = $(1-p)^{x-1}\times p$ - $X\sim Geometric(p)$ - 有 **失憶** 性質,即機率分布和已經做了多少次實驗無關,詳見 Probability (II) 的 **Exponential Distribution** ### CDF of Geometric distribution ![](https://i.imgur.com/EyEHYxy.png) ## Pascal Distribution - 某實驗成功機率為 $p$,在第 $X$ 次實驗正好成功第 $k$ 次,$X=x$ 的機率? - $C_{k-1}^{x-1}\times(1-p)^{x-k}\times p^{k-1}\times p = C_{k-1}^{x-1}\times(1-p)^{x-k}\times p^{k}$ ## Poisson Distribution - 某 outcome 出現之平均速率已知,問持續觀察某時間長度後,看到該結果出現 $k$ 次之機率。ex: - 平均每小時會有 10 人買消夜,則擺攤 5 小時有 60 人光顧之機率? - 平均每分鐘會有 5 人按讚,發文後 20 分鐘變成 $X = 100$ 個讚之機率? ### PMF of Poisson Distribution - 已知某事發生速率為每單位時間 $\lambda$ 次,則觀察 $T$ 時間單位,總共發生該事件 $X$ 次。 - $X\sim POI(\lambda T)$ - $p_X(x) = p(X = x) = e^{-\lambda T}\cdot\dfrac{(\lambda T)^x}{x!}$ - $\mu = \lambda T, X\sim POI(\mu) \implies P_X(x) = e^{-\mu}\cdot\dfrac{\mu^x}{x!}$ ### CDF of Poisson Distribution $F_X(x) = \sum_\limits{n=-\infty}^{\lfloor x\rfloor}p_X(x) = \left\{\begin{matrix} \sum_\limits{n=-\infty}^{\lfloor x\rfloor}e^{-\mu}\cdot\dfrac{\mu^n}{n!},\quad x=0, 1, 2... \\ 0,\quad\quad otherwise \end{matrix}\right.$ ### Poissson 公式推導、Poisson 和 Binomial 之關係 $\delta_T$ ###### tags: `lecture note` `probability`