# 機率與統計 - Ch3 : Random Variables and Probability Distributions ###### tags: `statistics` <style> .red{color:red;} .blue{color:blue;} </style> ## 前言 : 本章要搞懂的 1. 隨機變數的定義 : mapping函數的概念。 2. 離散、連續之下的函數性質 : - 離散 : 機率函數。 - 連續 : 機率密度函數。 3. 多變數函數的性質 : - 邊際分佈。 ## 一 . 隨機變數 ### (一) . 隨機變數的基本概念 1. 定義 : **是一個相sample point 映射到一個數值set的函數**。 - sample point 是定義域;random variable 為值域 - - random variable常常視為事件。 2. 例 : 值一枚硬幣,設隨機變數的關係為此二次正面的次數。 - 多個sample point 可以指向同一個點 : 因為sample point是定義域。 - 依照函數的離散定義 : 一個sample point不可以有多個random variable。 3. 注意 : **是同一個隨機變數會可能代表多個樣本點,這個概念很重要。** ![](https://i.imgur.com/IWnlheV.png) ### (二) . 機率分布 1. 離散型機率分佈 : 代表sample point 的數量是**有限的**。 - 良率、不良率。 3. 連續型機率分佈 : 代表sample point 的數量是**無限的**。 - 身高、體重。 ## 二 . 離散型機率分佈 ### (一) . 機率函數(Probability function) 1. 定義 : 將隨機變數映射到機率值的函數。 - random variable是定義域。 - random variable代表的機率是值域。 2. 例 : 以上例,可以將隨機變數對應到機率。 - 投擲兩次硬幣,0次為正的機率為 : 1/4。 - 投擲兩次硬幣,1次為正的機率為 : 1/2。 - 投擲兩次硬幣,2次為正的機率為 : 1/4。 ![](https://i.imgur.com/3mYFKke.png) 4. 機率函數的性質 : - $f(x)>=0$ : 代表每個事件的機率必大於1。 - $\sum_{x=1}^{x}f(x)=1$ : 所有事件的總何必為1。 - $f(x)=P(x) : 將隨機變數帶入即可得到所對應的機率。$ 4. **將實際發生的情況進行數值化** : 經由多次的mapping。 - 原本樣本空間的每一個樣本點都是機率相等的。 - 將樣本點映射到隨機變數,由隨機變數整合形成『事件』 - 隨機變數的機率,可以視為一個『事件』的機率。 ![](https://i.imgur.com/3XdZzMB.png) ### (二) . 機率累積函數 1. 定義 : 我們定義$F(X)=f(X>=x)$ - 其中 : $F(x)$為機率累加函數。 - 其中 : $f(x)$為機率函數。 - 可以知道機率累加函數即為隨機變數到某指的總和。 2. 注意 : 因為分佈是離散的,所以,$F(x)$的值是到某個點才上升的。 ![](https://i.imgur.com/gIVmkwK.png) ![](https://i.imgur.com/wx0F5LV.png) ## 三 . 連續型機率分佈 ### (一) . 機率密度函數(PDF) 1. 定義 : 將隨機變數映射到**機率密度**的函數。 - 機率密度 : $隨機變數*機率密度=發生機率$。 - random variable是定義域。 - random variable代表的機率密度是值域。 2. 例子 : 若一群人的身高分佈為下。 - 連續下$f(x)$代表的意思 : 為機率密度,代表『相對』機率。 - 離散下$f(x)$代表的意思 : 為機率值,代表『絕對』機率。 ![](https://i.imgur.com/osL9Hep.png) 3. 機率密度函數的性質 : - $f(x)>=0 , x屬於R$ - $\int_{-∞}^{∞}f(x)dx = 1$ : 代表機率密度『相對』的概念。 - $P(a<x<b)=\int_{a}^{b}f(x)dx$。 - $P(a)=\int_{a}^{a}f(x)dx = 0$。 ### (二) . 累積分佈函數 1. 定義 : $F(x)=P(X<=x)=\int_{-∞}^{x}f(x)dx$。 - 其中 : $F(x)$為累積分佈函數。 - 其中 : $f(x)$為機率密度函數。 - 可以知道累加分佈函數即為隨機變數到某指的機率密度總和。 2. 和PDF的關係 : 由微積分基本定理可以知道 - $\dfrac{d}{dx}F(x)=f(x)$。 - $\int_{}^{}f(x)dx=F(x)$ ## 四 . 多變數機率分佈 ### (一) . 多變數時的函數 1. 隨機變數: 將**兩個自變數的有序對** $x,y$ (代表的是x,y事件內的樣本點),映射到同一個隨機變數 $g(x,y)$。 2. 機率函數、機率密度函數 : (基本上定義不變) - 機率函數 : 離散下,將隨機變數映射到機率的函數。 - 機率密度函數 : 連續下,將隨機變數映射到機率密度的函數。 3. 例 : 以離散型機率為例 - 隨機變數 : $g(x,y)$可以視為 $z$ 軸。 - 機率函數 : 可以視為在 $x-y$ 平面的向量。 ![](https://i.imgur.com/sd5BJxm.png) ### (二) . 離散型和連續的多機率分佈 1. 離散型機率分佈的機率函數 : - $1>=f(x,y)>=0,(x,y)$。 - $\sum_{x}^{}\sum_{y}^{}f(x,y)=1$。 - $P(X=x,Y=y)=f(x,y)$。 2. 連續型機率分佈的機率密度函數 : - $f(x,y)>=0,(x,y)$ : 注意,$f(x,y)$可能>1,因為$f(x,y)$不是機率。 - $\int_{-∞}^{∞}\int_{-∞}^{∞}f(x,y)dxdy=1$。 - $P[(x,y)∈A]=\int_{}^{}\int_{A}^{}f(x,y)dxdy$。 3. 注意 : 連續下的機率值為機率密度函數下的面積;而離散時則單個機率密度函數即為機率。(和單變量的定義一樣) ### (三) . 邊際機率分佈 1. 定義 : 在二變數的機率分布下,我們只固定觀察一個變量。 2. 解釋 : 簡述與圖 - 對一個離散型變數 $f(x,y)$ 而言。 - 設$g(x)$為x的邊際分佈,$h(y)$為y的邊際分佈。 - 可以知道 $g(x)=\sum f(x,y)$,$\sum$的x為定數。 - 可以知道 $h(y)=\sum f(x,y)$,$\sum$的y為定數。 ![](https://i.imgur.com/r0bqTjU.png) ![](https://i.imgur.com/zjYlGpX.png) 3. 公式 - 離散下 : 對雙變數分佈的$f(x,y)$。 - $x$ 的邊際分佈 : $g(x)=\sum_{y} f(x,y)$。 - $y$ 的邊際分佈 : $h(y)=\sum_{x} f(x,y)$。 - 例 : 對$f(x,y)=1/4$;且$0≦x≦1,0≦y≦1$。 - $g(1)=\sum_{y}f(1,y)=1/2$。 - $h(1)=\sum_{x}f(1,y)=1/2$。 4. 公式 - 連續下 : 對雙變數分佈的$f(x,y)$。 - $x$ 的邊際分佈 : $g(x)=\int_{-∞}^{∞}f(x,y)dy$,此時積分的範圍為y的範圍。 - $y$ 的邊際分佈 :$h(x)=\int_{-∞}^{∞}f(x,y)dx$,此時積分的範圍為x的範圍。