# 機率與統計 - Ch3 : Random Variables and Probability Distributions
###### tags: `statistics`
<style>
.red{color:red;}
.blue{color:blue;}
</style>
## 前言 : 本章要搞懂的
1. 隨機變數的定義 : mapping函數的概念。
2. 離散、連續之下的函數性質 :
- 離散 : 機率函數。
- 連續 : 機率密度函數。
3. 多變數函數的性質 :
- 邊際分佈。
## 一 . 隨機變數
### (一) . 隨機變數的基本概念
1. 定義 : **是一個相sample point 映射到一個數值set的函數**。
- sample point 是定義域;random variable 為值域 -
- random variable常常視為事件。
2. 例 : 值一枚硬幣,設隨機變數的關係為此二次正面的次數。
- 多個sample point 可以指向同一個點 : 因為sample point是定義域。
- 依照函數的離散定義 : 一個sample point不可以有多個random variable。
3. 注意 : **是同一個隨機變數會可能代表多個樣本點,這個概念很重要。**

### (二) . 機率分布
1. 離散型機率分佈 : 代表sample point 的數量是**有限的**。
- 良率、不良率。
3. 連續型機率分佈 : 代表sample point 的數量是**無限的**。
- 身高、體重。
## 二 . 離散型機率分佈
### (一) . 機率函數(Probability function)
1. 定義 : 將隨機變數映射到機率值的函數。
- random variable是定義域。
- random variable代表的機率是值域。
2. 例 : 以上例,可以將隨機變數對應到機率。
- 投擲兩次硬幣,0次為正的機率為 : 1/4。
- 投擲兩次硬幣,1次為正的機率為 : 1/2。
- 投擲兩次硬幣,2次為正的機率為 : 1/4。

4. 機率函數的性質 :
- $f(x)>=0$ : 代表每個事件的機率必大於1。
- $\sum_{x=1}^{x}f(x)=1$ : 所有事件的總何必為1。
- $f(x)=P(x) : 將隨機變數帶入即可得到所對應的機率。$
4. **將實際發生的情況進行數值化** : 經由多次的mapping。
- 原本樣本空間的每一個樣本點都是機率相等的。
- 將樣本點映射到隨機變數,由隨機變數整合形成『事件』
- 隨機變數的機率,可以視為一個『事件』的機率。

### (二) . 機率累積函數
1. 定義 : 我們定義$F(X)=f(X>=x)$
- 其中 : $F(x)$為機率累加函數。
- 其中 : $f(x)$為機率函數。
- 可以知道機率累加函數即為隨機變數到某指的總和。
2. 注意 : 因為分佈是離散的,所以,$F(x)$的值是到某個點才上升的。


## 三 . 連續型機率分佈
### (一) . 機率密度函數(PDF)
1. 定義 : 將隨機變數映射到**機率密度**的函數。
- 機率密度 : $隨機變數*機率密度=發生機率$。
- random variable是定義域。
- random variable代表的機率密度是值域。
2. 例子 : 若一群人的身高分佈為下。
- 連續下$f(x)$代表的意思 : 為機率密度,代表『相對』機率。
- 離散下$f(x)$代表的意思 : 為機率值,代表『絕對』機率。

3. 機率密度函數的性質 :
- $f(x)>=0 , x屬於R$
- $\int_{-∞}^{∞}f(x)dx = 1$ : 代表機率密度『相對』的概念。
- $P(a<x<b)=\int_{a}^{b}f(x)dx$。
- $P(a)=\int_{a}^{a}f(x)dx = 0$。
### (二) . 累積分佈函數
1. 定義 : $F(x)=P(X<=x)=\int_{-∞}^{x}f(x)dx$。
- 其中 : $F(x)$為累積分佈函數。
- 其中 : $f(x)$為機率密度函數。
- 可以知道累加分佈函數即為隨機變數到某指的機率密度總和。
2. 和PDF的關係 : 由微積分基本定理可以知道
- $\dfrac{d}{dx}F(x)=f(x)$。
- $\int_{}^{}f(x)dx=F(x)$
## 四 . 多變數機率分佈
### (一) . 多變數時的函數
1. 隨機變數: 將**兩個自變數的有序對** $x,y$ (代表的是x,y事件內的樣本點),映射到同一個隨機變數 $g(x,y)$。
2. 機率函數、機率密度函數 : (基本上定義不變)
- 機率函數 : 離散下,將隨機變數映射到機率的函數。
- 機率密度函數 : 連續下,將隨機變數映射到機率密度的函數。
3. 例 : 以離散型機率為例
- 隨機變數 : $g(x,y)$可以視為 $z$ 軸。
- 機率函數 : 可以視為在 $x-y$ 平面的向量。

### (二) . 離散型和連續的多機率分佈
1. 離散型機率分佈的機率函數 :
- $1>=f(x,y)>=0,(x,y)$。
- $\sum_{x}^{}\sum_{y}^{}f(x,y)=1$。
- $P(X=x,Y=y)=f(x,y)$。
2. 連續型機率分佈的機率密度函數 :
- $f(x,y)>=0,(x,y)$ : 注意,$f(x,y)$可能>1,因為$f(x,y)$不是機率。
- $\int_{-∞}^{∞}\int_{-∞}^{∞}f(x,y)dxdy=1$。
- $P[(x,y)∈A]=\int_{}^{}\int_{A}^{}f(x,y)dxdy$。
3. 注意 : 連續下的機率值為機率密度函數下的面積;而離散時則單個機率密度函數即為機率。(和單變量的定義一樣)
### (三) . 邊際機率分佈
1. 定義 : 在二變數的機率分布下,我們只固定觀察一個變量。
2. 解釋 : 簡述與圖
- 對一個離散型變數 $f(x,y)$ 而言。
- 設$g(x)$為x的邊際分佈,$h(y)$為y的邊際分佈。
- 可以知道 $g(x)=\sum f(x,y)$,$\sum$的x為定數。
- 可以知道 $h(y)=\sum f(x,y)$,$\sum$的y為定數。


3. 公式 - 離散下 : 對雙變數分佈的$f(x,y)$。
- $x$ 的邊際分佈 : $g(x)=\sum_{y} f(x,y)$。
- $y$ 的邊際分佈 : $h(y)=\sum_{x} f(x,y)$。
- 例 : 對$f(x,y)=1/4$;且$0≦x≦1,0≦y≦1$。
- $g(1)=\sum_{y}f(1,y)=1/2$。
- $h(1)=\sum_{x}f(1,y)=1/2$。
4. 公式 - 連續下 : 對雙變數分佈的$f(x,y)$。
- $x$ 的邊際分佈 : $g(x)=\int_{-∞}^{∞}f(x,y)dy$,此時積分的範圍為y的範圍。
- $y$ 的邊際分佈 :$h(x)=\int_{-∞}^{∞}f(x,y)dx$,此時積分的範圍為x的範圍。