機率與統計 - Ch3 : Random Variables and Probability Distributions

# 機率與統計 - Ch3 : Random Variables and Probability Distributions ###### tags: `statistics` <style> .red{color:red;} .blue{color:blue;} </style> ## 前言：本章要搞懂的 1. 隨機變數的定義： mapping函數的概念。 2. 離散、連續之下的函數性質： - 離散：機率函數。 - 連續：機率密度函數。 3. 多變數函數的性質： - 邊際分佈。 ## 一 . 隨機變數 ### (一) . 隨機變數的基本概念 1. 定義： **是一個相sample point 映射到一個數值set的函數**。 - sample point 是定義域；random variable 為值域 - - random variable常常視為事件。 2. 例：值一枚硬幣，設隨機變數的關係為此二次正面的次數。 - 多個sample point 可以指向同一個點：因為sample point是定義域。 - 依照函數的離散定義：一個sample point不可以有多個random variable。 3. 注意： **是同一個隨機變數會可能代表多個樣本點，這個概念很重要。** ![](https://i.imgur.com/IWnlheV.png) ### (二) . 機率分布 1. 離散型機率分佈：代表sample point 的數量是**有限的**。 - 良率、不良率。 3. 連續型機率分佈：代表sample point 的數量是**無限的**。 - 身高、體重。 ## 二 . 離散型機率分佈 ### (一) . 機率函數(Probability function) 1. 定義：將隨機變數映射到機率值的函數。 - random variable是定義域。 - random variable代表的機率是值域。 2. 例：以上例，可以將隨機變數對應到機率。 - 投擲兩次硬幣，0次為正的機率為： 1/4。 - 投擲兩次硬幣，1次為正的機率為： 1/2。 - 投擲兩次硬幣，2次為正的機率為： 1/4。 ![](https://i.imgur.com/3mYFKke.png) 4. 機率函數的性質： - $f(x)>=0$ : 代表每個事件的機率必大於1。 - $\sum_{x=1}^{x}f(x)=1$ : 所有事件的總何必為1。 - $f(x)=P(x) : 將隨機變數帶入即可得到所對應的機率。$ 4. **將實際發生的情況進行數值化** ：經由多次的mapping。 - 原本樣本空間的每一個樣本點都是機率相等的。 - 將樣本點映射到隨機變數，由隨機變數整合形成『事件』 - 隨機變數的機率，可以視為一個『事件』的機率。 ![](https://i.imgur.com/3XdZzMB.png) ### (二) . 機率累積函數 1. 定義：我們定義$F(X)=f(X>=x)$ - 其中： $F(x)$為機率累加函數。 - 其中： $f(x)$為機率函數。 - 可以知道機率累加函數即為隨機變數到某指的總和。 2. 注意：因為分佈是離散的，所以，$F(x)$的值是到某個點才上升的。 ![](https://i.imgur.com/gIVmkwK.png) ![](https://i.imgur.com/wx0F5LV.png) ## 三 . 連續型機率分佈 ### (一) . 機率密度函數(PDF) 1. 定義：將隨機變數映射到**機率密度**的函數。 - 機率密度： $隨機變數*機率密度=發生機率$。 - random variable是定義域。 - random variable代表的機率密度是值域。 2. 例子：若一群人的身高分佈為下。 - 連續下$f(x)$代表的意思：為機率密度，代表『相對』機率。 - 離散下$f(x)$代表的意思：為機率值，代表『絕對』機率。 ![](https://i.imgur.com/osL9Hep.png) 3. 機率密度函數的性質： - $f(x)>=0 , x屬於R$ - $\int_{-∞}^{∞}f(x)dx = 1$ : 代表機率密度『相對』的概念。 - $P(a<x<b)=\int_{a}^{b}f(x)dx$。 - $P(a)=\int_{a}^{a}f(x)dx = 0$。 ### (二) . 累積分佈函數 1. 定義： $F(x)=P(X<=x)=\int_{-∞}^{x}f(x)dx$。 - 其中： $F(x)$為累積分佈函數。 - 其中： $f(x)$為機率密度函數。 - 可以知道累加分佈函數即為隨機變數到某指的機率密度總和。 2. 和PDF的關係：由微積分基本定理可以知道 - $\dfrac{d}{dx}F(x)=f(x)$。 - $\int_{}^{}f(x)dx=F(x)$ ## 四 . 多變數機率分佈 ### (一) . 多變數時的函數 1. 隨機變數：將**兩個自變數的有序對** $x,y$ (代表的是x,y事件內的樣本點)，映射到同一個隨機變數 $g(x,y)$。 2. 機率函數、機率密度函數： (基本上定義不變) - 機率函數：離散下，將隨機變數映射到機率的函數。 - 機率密度函數：連續下，將隨機變數映射到機率密度的函數。 3. 例：以離散型機率為例 - 隨機變數： $g(x,y)$可以視為 $z$ 軸。 - 機率函數：可以視為在 $x-y$ 平面的向量。 ![](https://i.imgur.com/sd5BJxm.png) ### (二) . 離散型和連續的多機率分佈 1. 離散型機率分佈的機率函數： - $1>=f(x,y)>=0,(x,y)$。 - $\sum_{x}^{}\sum_{y}^{}f(x,y)=1$。 - $P(X=x,Y=y)=f(x,y)$。 2. 連續型機率分佈的機率密度函數： - $f(x,y)>=0,(x,y)$ : 注意，$f(x,y)$可能>1，因為$f(x,y)$不是機率。 - $\int_{-∞}^{∞}\int_{-∞}^{∞}f(x,y)dxdy=1$。 - $P[(x,y)∈A]=\int_{}^{}\int_{A}^{}f(x,y)dxdy$。 3. 注意：連續下的機率值為機率密度函數下的面積；而離散時則單個機率密度函數即為機率。(和單變量的定義一樣) ### (三) . 邊際機率分佈 1. 定義：在二變數的機率分布下，我們只固定觀察一個變量。 2. 解釋：簡述與圖 - 對一個離散型變數 $f(x,y)$ 而言。 - 設$g(x)$為x的邊際分佈，$h(y)$為y的邊際分佈。 - 可以知道 $g(x)=\sum f(x,y)$，$\sum$的x為定數。 - 可以知道 $h(y)=\sum f(x,y)$，$\sum$的y為定數。 ![](https://i.imgur.com/r0bqTjU.png) ![](https://i.imgur.com/zjYlGpX.png) 3. 公式 - 離散下：對雙變數分佈的$f(x,y)$。 - $x$ 的邊際分佈： $g(x)=\sum_{y} f(x,y)$。 - $y$ 的邊際分佈： $h(y)=\sum_{x} f(x,y)$。 - 例：對$f(x,y)=1/4$；且$0≦x≦1,0≦y≦1$。 - $g(1)=\sum_{y}f(1,y)=1/2$。 - $h(1)=\sum_{x}f(1,y)=1/2$。 4. 公式 - 連續下：對雙變數分佈的$f(x,y)$。 - $x$ 的邊際分佈： $g(x)=\int_{-∞}^{∞}f(x,y)dy$，此時積分的範圍為y的範圍。 - $y$ 的邊際分佈：$h(x)=\int_{-∞}^{∞}f(x,y)dx$，此時積分的範圍為x的範圍。