考研
機率
數學
機率模型 | PMF | MGF | 模型關係 | ||
---|---|---|---|---|---|
白努利分布 | X | ||||
二項分布 | 、當時二項分布近似成波松分布 | ||||
波松分布 | |||||
幾何分布 | n次白努利試驗第1次成功的機率 | ||||
負二項分布 | |||||
均勻分布 | 設任意機率模型的CDF為轉換函數則轉換後為 | ||||
高斯分布 | |||||
指數分布 | X | ||||
gamma分布 |
一隨機試驗的樣本空間,為中的任一事件,因此所有事件的集合即為樣本空間的冪集,定義機率測度為樣本空間的冪集映射至實數的實係數函數,並滿足以下三大機率公理
根據三大機率公理就可以證明出很多機率的定理,大部分的證明幾乎都是用到是第三點公理。例如機率的排容原理的證明
對於兩機率不為0的事件而言 式(1)與式(2)代表條件無用 - 在事件發生有無的前提都與事件A會發生的機率無關;式(3)為ch1 計數原理有4個技巧乘法原理,代表交集機率等於個別機率相乘,可以由式(1)、式(2)移項推導。
與互斥
定理為
式(6)證明如下,使用"夾擊法"的證明技巧
需要注意3個以上的事件獨立,不只要兩個事件成對獨立,更要保證三個事件彼此也是獨立,同理推廣到個事件互為獨立的條件,由此可知獨立事件的條件是分嚴格。
獨立事件的應用為燈泡開關的迴路問題,若串聯元件彼此獨立,則導通機率為;若並聯元件彼此獨立,則導通機率為。
事件集,若集合中任二個事件為互斥,且樣本空間,稱為分割(partition)或是互斥無遺漏集合。對任意事件恆有 白話來說分割就是把樣本空間拆成一塊塊拼圖,全機率定理就是把拼圖一塊塊拼出來,再將其轉成個別條件機率,在實際情況中事件的全貌不容易取得,需要靠條件機率的一塊塊拼圖得知事情全貌。
適用於題目給,求,事件和條件對調的問題。若為樣本空間的一組分割,則任意機率大於0的事件恆有 分子使用條件機率推得,分母使用全機率定理推得,一般貝氏定理都是使用樹狀圖分析求得。
隨機變數不具有隨機性,也不是一個變數,隨機變數是函數,把定義域上"抽象"的樣本空間中每一個樣本點,映射到值域上"具體"、可執行加減乘除運算的實數系上,記為。隨機變數是一個劃時代的概念,從古典機率僅能執行集合運算,透過隨機變數將抽象的集合映射到實數系,到近代機率可以執行加減乘除、微分、積分運算。需要注意原機率空間透過隨機變數映射到新的機率空間依然滿足機率的三大公理。
根據隨機變數值域的種類又可分為3種
PMF常使用單位脈衝來表示,假設有樣本點,則PMF 。
機率密度函數(PDF, probability density function)
給定連續型隨機變數,且是其值域,為的任一部分集合,則機率密度函數滿足
PDF具有以下性質
累積分布函數(CDF, cumulative distribution function)
設連續型隨機變數的PDF為,則CDF則是把點以前的PDF"積分"起來。
連續型隨機變數的CDF具有以下5個性質
在解題上,第一步是畫出結合機率分析表。
結合機率質量函數(joint PMF, joint probability mass function)
若有2個離散型的隨機變數,則JPMF在的值為單點機率
JPMF類似PMF滿足以下2個性質
邊際機率質量函數(marginal PMF, marginal probability mass function)
將不要的變數全部相加,將兩個隨機變數退化為一個隨機變數。
JPMF類似PMF滿足以下2個性質
結合累積分布函數(joint CDF, joint cumulative distribution function) 若有2個離散型的隨機變數,則JCMF 就是把二維點以下的面積加起來,做機率累積 JCDF具有以下4個性質
在解題上,第一步是畫出值域圖。
結合機率密度函數(joint PDF, joint probability density function)
給定連續型隨機變數,且是其值域,為的任一部分集合,則機率密度函數滿足
PDF具有以下性質
邊際機率密度函數(marginal PDF, marginal probability density function)
將不要的變數全部積分起來,將兩個隨機變數退化為一個隨機變數。
JPDF類似PDF滿足以下2個性質
結合累積分布函數(joint CDF, joint cumulative distribution function)
設連續型隨機變數的JPDF為,則JCDF則是把點以前的JPDF"積分"起來。
連續型隨機變數的JCDF具有以下6個性質
個隨機變數,寫成向量的形式,稱為隨機向量,若皆是連續型隨機變數,同理可定義JPDF、MPDF、JCDF、MCDF。
若隨機變數的結合機率函數、邊際機率函數則
給定隨機變數, joint PDF , marginal PDF , joint CDF , marginal CDF 個隨機變數獨立的定義為個別PDF(CDF)相乘等於聯合的PDF(CDF),而ch1 獨立事件中個事件獨立的定義不僅需要個事件成對獨立,還需要兩兩事件成對獨立、三三事件成對獨立等,條件較為"嚴格"。欲快速判斷隨機變數是否互為獨立,首先判斷與的值域有無關聯,再來看joint PDF是否可以分離變數。
給定隨機變數與其PMF/PDF,則的期望值為 由上式可知,期望值就是加權平均,這個權重就是機率分布函數。
給定隨機變數,其PMF/PDF ,則的變異數為
變異數為將所有數值與平均值的誤差做平方再取期望值,稱為均方誤差(MSE - mean square
error),當隨機變數的PMF/PDF較鬆散時,變異數大;反之PMF/PDF較密集時,變異數小。進一步推導變異數
可以得到變異數較方便計算的公式 - 二階動差 - (一階動差)2。
由於變異數,因此定義標準差為變異數的開根號。
如2022上一段日記 03/14(一)的動差形成函數與特徵函數,需要注意動差形成函數有收斂範圍(ROC),而特徵函數則沒有。另外機率質量/密度函數、特徵函數、動差生成函數這三者中只要知道任一項,即可求其他兩項(可被唯一決定)。 其中Laplace Transform與Fourier Transform與工數的定義上差了一個負號,但這兩種定義是等效的。
期望值屬於一階(原點)動差,因此具有線性運算的性質,即,但是期望值的乘法不能拆開,只有在隨機變數是獨立的條件下。
線性代數篇 ch6 範數(norm)介紹線性代數版的柯西不等式,也有個機率版的柯西不等式,證明為令新的隨機變數,並計算
當時,"="才會成立。
變異數為二階中心動差,與期望值不同,不具有線性運算,而變異數的其他性質為
給定隨機變數與平均值,則共變數
其意義在於比較隨機變數之間的相關性,代表正相關、代表負相關、代表不相關。
進一步推導
可以得到共變數較方便計算的公式。
與變異數做比較
可以發現變異數就是自己跟自己的共變數,代表比較自己跟自己的關係。
共變數可以判斷兩隨機變數的相關性,但只能定性,不能定量,需要除以各自隨機變數的標準差,得到定量的相關係數。 性質 - 相關係數指介於-1到1之間,即。
由獨立與不相關等效的第3的定義可知,獨立是任意的階動差都可拆開,等效於,而不相關是僅有一階動差能拆開,因此獨立可以推得不相關,但不相關無法推得獨立。
但有兩個例外(獨立與不相關等價)
將共變數推廣至個隨機變數。給定隨機向量與平均值向量 共變數矩陣 共變數矩陣有兩個重要的特性
給定隨機變數與其PMF/PDF
其中為取這個函數的期望值,故先把這個函數拿進來;而期望值是作加權平均,這個權重在此就是條件機率函數,並對要做期望值的函數做相加/積分,也就是的函數。
可以觀察上式條件期望值就是條件的函數,當條件改變時,樣本空間改變,因此機率分布,也就是的範圍改變,最終期望值跟著改變。
口訣為條件期望值做兩次,則條件可以拿掉。證明如下
變數變換為機率的轉移,將舊的隨機變數對應到新的隨機變數,把那些機率合併起來,轉為的機率。
題目給定新的隨機變數,欲求其PDF 。由於連續型的PDF不具有機率的意義,故先求CDF,透過反函數求得與的關係,最後再微分得PDF。
法1無法計算,為理論證明,法2偏向一般的計算考題 - 給定題目為非單調函數,解題步驟有以下3步
題目較連續型簡單,也較少,直接求的單點機率即可,繪製值域圖,決定值域與累積區域,最後進行累加
繪製值域圖,決定值域與累積區域,最後進行積分
以下3步為公式記憶的方式
只證明公式法第1點,其他證明略省
給定隨機變數彼此獨立,而,若PDF分別為,MGF分別為,CF分別為,則
第1點證明從法2 - 公式法出發 第2點證明複習ch3 獨立 ⇒ 不相關,but不相關 !⇒ 獨立兩隨機變數獨立的等價條件 特徵函數同理動差生成函數的推法 由Laplace Transform與Fourier Transform的性質互推這3點的性質
ch3 動差形成函數(MGF)與特徵函數(CF)定義動差形成函數與特徵函數,給定隨機變數的JPDF ,在此定義聯合動差形成函數(JMGF)
上式即為維的Laplace Transform。若令或是,則JMGF會退化為單變數的邊際動差形成函數(MMGF)
欲計算與各階聯合動差
同理可定義聯合特徵函數(JCF)
上式即為維的Fourier Transform。若令或是,則JCF會退化為單變數的邊際特徵函數(MCF)
欲計算與各階聯合動差
可擴充ch3 獨立 ⇒ 不相關,but不相關 !⇒ 獨立中隨機變數獨立的等價條件 式(3)證明,同理式(6)、式(7) 式(4)證明,同理式(5)
給定個隨機變數獨立且其PDF為、CDF為。給定新的隨機變數為
求。
解題步驟為先求CDF,並利用隨機變數獨立的性質將JCDF拆分為MCDF。
再來連續型對CDF微分就是PDF、離散型CDF相減就是PMF。
ch1 隨機試驗與機率空間中定義的隨機試驗,滿足3個條件
舉例來說丟銅板、取後放回的隨機取球。
執行次白努利試驗,成功的機率為,令隨便變數為成功的次數,則白努利分布的PMF為
白努利分布即為執行一次白努利試驗,也就是二項分布在的特例,記為。
依序計算白努利分布的動差生成函數、期望值、變異數,這三個重要的參數。
執行次白努利試驗,成功的機率為,令隨機變數為成功的次數,則二項分布的PMF為
首先先排座位,挑選次成功次數,即為,再入座機率。
檢驗上式是否符合PMF總和機率為1的條件,使用到ch1 排列組合中的二項式展開。
依序計算白努利分布的動差生成函數、期望值、變異數(期望值、變異數另一種算法 - MGF取ln再微分),這三個重要的參數。
最後探討模型之間的關係
當二項分布白努利試驗次數趨近無限大(一般),成功機率(一般),而期望值趨於定值 將三式的後分別為 最後得波松分布的PMF為 舉例來說,在通訊傳輸,一次傳輸的bit十分巨大,且錯誤率極小,透過波松分布就可近似二項分布。 檢驗上式是否符合PMF總和機率為1的條件,使用到微積分自然對數的泰勒展開式。 依序計算波松分布的動差生成函數、期望值、變異數,這三個重要的參數。 最後探討模型之間的關係,獨立的波松分布相加還是波松分布。 由於波松分布是二項分布的特例,因此"繼承"二項分布的模型之間的關係。
已知在區間時間內共發生個事件,則在區間的時間內發生個點()的機率為何?
假設隨機程序為stationary,代表機率與絕對時間無關,只與相對時間長短有關,個點落在內的機率為
則個點落在的機率則為二項分布,假設將時間切割很細,切成每一小區段機率很低的白努利分布,因此,二項分布可近似於Poisson分布
將式(1)帶入式(2),並定義單位時間的平均發生率,可得在時間內發生的次數
其中隨機程序就是波松程序,可以視為Poisson分布的廣義結果,Poisson分布就是波松程序在時的特例。
執行一連串成功機率的白努利試驗,直到第次成功為止的機率,為負二項分布在成功次數時的特例。有兩種可能的隨機變數
執行一連串成功機率的白努利試驗,直到第次成功為止的機率。有兩種可能的隨機變數
ch5 白努利試驗(Bernoulli Trial)其中一項定義為"結果只有2種",若將其推廣結果為種,則稱為多項試驗(multinomial trials)。執行次多項試驗,成功的機率個別為,令隨便向量為個別隨機變數成功的次數,則多項式分布的PMF為
先排座位,根據ch1 排列組合中不盡相異物的排列數,再入座機率。
依序計算多項式分布的結合動差生成函數、單變數的期望值、單變數的變異數,這三個重要的參數。
觀察上式中與二項分布的期望值與變異數相同,此為多項試驗退化為白努利試驗的結果,取決於觀測者不同的觀察角度,舉例來說同一個骰子觀測者A觀察骰子有6種可能結果,屬於多項試驗,而觀測者B只在乎骰子點數一點有無出現次數,結果從6種退化成只有2種,屬於白努利試驗。
最後計算共變異數與相關係數。
由原關係可看出當增加,則在固定之下,必減少,因此呈現負相關,共變數與相關係數皆為負值。
隨機變數的PDF為 依序計算均勻分布的動差生成函數、期望值、變異數,這三個重要的參數。 任意隨機變數的CDF為連續函數,則經過ch4 單->單變數變換(連續型)法1 - 累積函數法,隨機變數必為均勻分布。 在應用分面,計算機生成的均勻分布,經過適當的變數變換後,就可以生成任意機率分布的CDF 。
對白努利試驗而言,當時二項分布可以近似於Poisson分布,而另一種近似的函數就是高斯分布,根據De Moivre-Laplace定理,當時,則是事件發生率為
因此定義高斯/常態分佈為隨機變數的PDF
其中稱為位置參數,為眾數(機率最大)、中位數(剛好把機率分半)、平均數;稱為形狀參數,為標準差,決定PDF的胖瘦。
檢驗上式是否符合PDF總和機率為1的條件,積分時做變數變換將指數上面的東西"打包"成一單變數,並使用到極座標的積分技巧。
依序計算高斯分布的動差生成函數、期望值、變異數,這三個重要的參數。
最後探討模型之間的關係,若個獨立的高斯分布相加還是高斯分布。
現實中許多隨機現象本身雖不具有常態分布,但經過ch4 變數變換單變數轉換,對其取對數後,就會表現出常態分布的性質,稱為對數常態分布(Log-Normal distribution)
高斯轉換經過線性運算依然是高斯分布。
因此就可定義高斯分布的標準化
將任意高斯經過標準化後化為,而稱為標準常態分布或是Z分布,其CDF稱為phi function
phi function的性質為對y軸對稱(),因此,而phi function的補事件就是Q function ,積分範圍為標準常態分佈的尾端機率(tail probability),在通訊領域會大量用到。
欲計算任意高斯分布的區間機率,首先做標準化後化為標準常態分布,再來查Phi function的表。
若phi function算出來是負的,則使用對稱性質,將其轉換為正的phi function才可以查到表。
波松程序(Poisson process) - 與時間有關提及,對波松程序而言,在秒時間內發生的次數呈現波松分布
首先令隨機變數為兩件事情的間隔時間,由於連續型隨機變數單點機率無意義,所以先求其CDF,為在時間內至少一次事件發生的機率,使用補事件改為,也就是說在時間內沒有任何事件發生,也就是發生的次數的波松分布,並對CDF微分可得PDF。
因此定義指數分布,其隨機變數的PDF遵循
其中隨機變數代表等待一次需要花的時間,而為事件的平均發生率(mean occurrence rate,單位是"次/時間"),由於單位時間內發生的次數為,因此兩次事件發生的時間間隔即為其倒數。
依序計算指數分布的動差生成函數、期望值、變異數,這三個重要的參數。
指數分布可視為gamma分布在時的特例
同理動差生成函數、期望值、變異數
gamma分布,其隨機變數的PDF遵循
gamma函數的定義與性質
其中稱為形狀(shape)參數、稱為尺度(scale)參數。意義在於等待次事件發生的時間,為指數函數的廣義推廣,因此就可探討模型之間的關係,若個獨立且同分布(iid)的指數分布相加後會是gamma分布。 依序計算gamma分布的動差生成函數、期望值、變異數,這三個重要的參數。
卡方分布,其隨機變數的PDF遵循
記為,其中稱為自由度(degree of freedom),,卡方分布可視為gamma分布在時的特例。
探討模型之間的關係,個標準常態分布的平方相加後,會是卡方分布。
使用ch4 單->單變數變換(連續型)法2 - 分割區間法證明自由度是1的卡方分布。
綜合上述觀念,波松程序解題流程第一步是由題意求得平均時間的發生率 (次數/時間),再來求以下3個
無記憶性代表過去發生的事件與現在無關,定義為 舉例來說客戶等待秒的前提下,還需要多等秒的機率,與之前是否等待秒無關。 根據上述定義可證明離散型的幾何分布無記憶性,因為前次失敗都不影響下次可能會失敗或是成功的機率,因為每次試驗都是獨立的白努利試驗;而連續型的指數分布無記憶性,因為事件的平均發生率(mean occurrence rate) 是常數,而不是時間的函數,故不隨時間改變。
在時間點,物品仍然存活的條件之下,在故障發生在下一刻的條件機率,也就是單位時間的事件發生率
失敗率為PDF除以CDF的補事件。
將指數函數帶入上式計算失敗率
代表物件今天故障與明天故障的機率是相同的,所以前面才會推得指數分布是無記憶性。
二維結合高斯分布的PDF為
欲計算二維結合高斯分布的邊際機率密度函數(MPDF) ,由於計算量太大,需要半背半推,依序與無關的常數提出來、補上數字使其變成完全平方式,接下來與常態分布相關的常數放在外面,最後後面那項的指數積分剛好與分母消掉得到答案。
因此可推得二維高斯分布的邊際機率密度函數就是一維高斯分布,同理。
欲計算二維結合高斯分布的條件機率密度函數(Conditional PDF) 、條件期望值、條件變異數
二維結合高斯分布的結合動差形成函數(JMGF)(證明省略,不會考)為
給定隨機向量,屬於n維結合高斯分布,若隨機向量為的線性組合,則也為結合高斯分布(證明省略),並且其平均值與變異數為
參照ch3 獨立 ⇒ 不相關,but不相關 !⇒ 獨立,但有兩個例外(獨立與不相關等價),一是二位元傳輸、二是結合高斯分布,二維結合高斯分布的證明如下 - 給定二維結合高斯分布的隨機變數不相關,因此相關係數
若隨機變數符合2個條件 - 值域大於0 、平均值存在,則
代表大於,單尾端的機率有上限,此上限為平均值除以。
證明
若隨機變數符合2個條件 - 平均值存在、變異值存在,則 代表向左右延伸以外雙尾端的機率有上限,此上限為變異數除以的平方。根據補空間概念,上式可推得以內中心區域的機率有下限為。
簡單隨機抽樣(simple random sampling)是指從母體任意抽取個單位作為樣本,每個簡單樣本獨立且同分布(idd),其分布等同母體分布。
樣本平均數
樣本變異數
當測量越精確,,樣本變異數,代表每次實驗都會是平均值,樣本平均數趨近於母體的平均值,稱為大數法則(large number rule)。
任意母體取出來的簡單樣本,做樣本平均數 再做標準化 當趨近無限大會是標準常態分佈 考題有2種,若取自母體的一組簡單樣本