---
tags: 應用統計
---
# 應用統計 R 101-3
### **隨機變數**
隨機變數, X, 是一種將樣本空間中的每個元素映射到實線的函數, X:S→R.
$$
\forall s \in S,X(s) \in R
$$
假設 X 表一隨機變數,則此函數的定義域為 S 或 Ω (樣本空間),對應域是實數 R,值域則為 R 的一個子集合。 i.e., 即對一個隨機變數 X,觀測到 s,再轉換至 X(s)。

#### 離散型隨機變數(discrete)
若取值為有限或可數無限
i.e.一個航空載具能完美運作需有一電腦系統運行. 為飛行安全起見, 此航空載具搭載一個電腦系統與兩個備用系統以備萬一. 假設此三系統皆為獨立運作. 假設 X 表示電腦系統可運行個數
#### 連續型隨機變數(continuous)
若取值在某一區間
i.e.手機更換一新原廠電池. 觀察此電池壽命. 假設 X 表示電池壽命.
### **事件**
給於一隨機變數 X,假設 A⊆R,定義事件
$$
{s∈S:X(s)∈A}={X∈A}
$$

或更一般, 假設 A⊆R,事件 {X∈A} 表示 {X∈A}={s∈S:X(s)∈A}. 此事件機率為
$$
P(X\in A)=P({s\in S\mid X(s)\in A})
$$
#### 例子
1.在某一便利商店排隊領取5倍券
$$
S={s≥0}, 若機率 P(⋅) 為已知.\\
X 代表等待時間. 今 A 代表等待時間超過 45 分鐘的事件\\
A 事件發生的機率\\
P(X\in A)=P({s\in S\mid X(s)> 45})
$$
2.系統嘗試接收對方傳遞的訊號, 直到確認接收為止
$$
S={1,2,3,…}, 若機率 P(⋅) 為已知.\\
X 代表直到接收成功需要的傳遞次數. 今 A 代表前100次都沒成功的事件.\\
A 事件發生的機率\\
P(X\in A)=P({s\in S\mid X(s)\ >100})
$$
### **密度函數:離散型隨機變數(discrete)**
#### **機率質量函數**
離散隨機變數 X 在 X=x 的機率, P(X=x) 或 f(x) 表示. 我們稱此函數 P(X=x) 為機率質量函數 (probability mass function, PMF 或 pmf). 滿足:
$$
P(X=x)=f(x)>0\\
\sum_{x\in s} f(x)=1\\
P(X\in A)=\sum_{x\in A}f(x)\\
$$
因為 P(X=x) 是函數型態, 所以可以用表格、圖形或公式來表示. 例如

#### **累積分布函數**
定義隨機變數 X 的累積分布函數 (Cumulative Distribution Function, CDF or cdf):
$$
F_{Xt}(t)=P(X\leq t)=P({s\mid X(s)\leq t})
$$
X 的累積密度函數有如下性質:
$$
\begin{multline}
\shoveleft 1.F(t),−∞<t<∞<是 t 的非遞減函數\\
\shoveleft \lim_{x\to -\infty}F(x)=0\quad\lim_{x\to \infty}F(x)=1\\
\shoveleft 2.單調性: F(x_1)≤F(x_2), if\ x_1<x_2\\
\shoveleft 3.右連續性: \lim_{x\to x_{0}^+}F(x)=F(x0)\\
\shoveleft 4.P(a<X≤b)=F(b)−F(a)\\
\end{multline}
$$

#### 例子
考慮丟2個公平的硬幣. X 代表出現正面的次數
\<ANS>
1.寫出 X 的機率密度函數並繪圖

2.寫出 X 的累積密度函數並繪圖
$$
F_x(x)=
\begin{cases}
0,\quad & \rm for\ x<0\\
\dfrac{1}{4},& \ \rm for\ 0≤x<1\\
\dfrac{3}{4},& \ \rm for\ 1≤x<2\\
1,& \ \rm for\ x>2\\
\end{cases}
$$

3.考慮丟兩個公平的硬幣. 如果第一個硬幣是正面, 則 X = 1; 否則 X = 0. 如果第二個硬幣是正面, Y = 1; 否則 Y = 5. 令 Z=XY.求X, Y, Z 機率質量函數?

$$
\begin{multline}
\shoveleft 4.若 X 的 PMF 為 P_X(k)=\dfrac{1}{2^k},k=1,2,3,...\\
\shoveleft (1)驗證 \sum_{k=1}^{\infty} P_X(k)=1
\end{multline}
$$
$$
\sum_{k=1}^{\infty} P_X(k)=\sum_{k=1}^{\infty}\dfrac{1}{2^k}=\dfrac{\dfrac{1}{2}}{1-\dfrac{1}{2}}=1\ QED.
$$
$$
\begin{multline}
\shoveleft (2)求 X 的 \rm CMF 與繪圖\\
\end{multline}
$$

### 隨機變數的期望值與變異數
#### 期望值
$$
μ_x=E(X)=\sum_{x\in S}xf(x)
$$
#### 變異數
$$
V(X)=σ^2_X=E[(X-μ)^2]=\sum_{x\in S}(x-μ)^2f(x)\ or\\
σ^2=Var(X)=\sum_{x\in S}(x-μ)^2f(x)=\sum_{x\in S}(x^2-2xμ+μ^2)f(x)\\
=\sum_{x\in S}x^2f(x)-\sum_{x\in S}2xμf(x)+\sum_{x\in S}μ^2f(x)\\
=\sum_{x\in S}x^2f(x)-2μ\sum_{x\in S}xf(x)+\sum_{x\in S}μ^2f(x)\ (\sum_{x\in S}f(x)=1)\\
=\sum_{x\in S}x^2f(x)-2μ^2-μ^2=\underline{E(X^2)-μ^2}
$$
* 標準差
$$
σ_X=\sqrt {Var(X)}=\sqrt {σ^2_X}
$$
如果隨機變數 Y=aX+b, 則 Y 與 X 期望值與變異數的關係:
$$
μ_Y=aμ_X+b\\
σ^2_Y=a^2σ^2_x\\
σ_Y=|a|σ_X
$$
#### 例子
1.假設 X, E(X)=μ, V(X)=σ^2. 若 Y=−1.1X+3, E(Y), V(Y)?
$$
E(Y)=-1.1μ+3\\
V(Y)=1.21σ^2
$$
$$
Z=\dfrac{X−μ}{σ}→E(Z)=?, V(Z)=\\
E(Z)=E(\dfrac{X−μ}{σ})=\dfrac{X−μ}{σ}\\
V(Z)=V(\dfrac{X−μ}{σ})=\\
$$
### **密度函數:連續隨機變數(continuous)**
#### **機率密度函數**
X 的機率密度函數 (probability density function, pdf) 是一個可積分函數滿足:
$$
f(x)>0\\
\int_{-\infty}^{\infty} {f(x)} \,{\rm d}x=1\\
如果 f(x) 是 X 的機率密度函數且 A 為某區間, 則 {X∈A} 的機率為:\\
P(X\in A)=\int_A {f(x)} \,{\rm d}x\\
P(X=x)=0, ∀x ← 單點的機率為零\\
P(a≤X≤b)=P(a<X≤b)=P(a≤X<b)=P(a<x<b)\\
$$
#### **累積密度函數**
累積密度函數 (Cumulative Distribution Function, CDF or cdf):
$$
F(x)=\int_{-\infty}^{x} {f(t)} \,{\rm d}x,−∞<x<∞.
$$
#### 例子
1.假設隨機變數 X 的 pdf:
$$
f_X(x)=
\begin{cases}
4x^3,\quad & \rm 0<x≤1\\\
0,& \ \rm otherwise\\
\end{cases}\\
求 \rm CDF?\ P(0.25≤X<0.75)\\
$$
$$
\begin{multline}
\shoveleft <\rm sol>\\
\end{multline}
$$
$$
F_X(x)=
\begin{cases}
0,\quad & \rm x<0\\
x^4,& 0≤x<1\\
1,& x\geq 1\\
\end{cases}\\
P(0.25≤X<0.75)=\int_{0.25}^{0.75}4x^3 \rm {dx}=x^4 |^{0.75}_{0.25}=0.3125
$$
2.假設隨機變數 X 的 CDF
$$
F_X(x)=
\begin{cases}
0,\quad & \rm 0<x\\
x,& 0≤x≤1\\
1,& x>1\\
\end{cases}\\
若 Y=\rm exp(X)=\rm e^X, 求 Y 的 CDF 與 PDF?
$$
$$
\begin{multline}
\shoveleft <\rm sol>\\
\shoveleft 由於 e^X 是 X 的遞增函數且 R(X)=[0,1], 知道 R_Y=[1,e].\\
\shoveleft 求 FY(y), y∈[1,e],\\
\end{multline}
$$
$$
F_Y(y)=P(Y≤y)=P(e^x≤y)=P(X≤ln(y))=F_X(lny)=lny\\
F_Y(y)=
\begin{cases}
0,\quad & \rm 1<y\\
lny,& 1≤y<e\\
1,& y\geq e\\
\end{cases}\\
f_Y(y)=
\begin{cases}
\dfrac{1}{y}, 1≤y≤e\\
0,\rm otherwise
\end{cases}\\
$$
## 基本隨機變數
### 伯努力試驗
只有兩種可能結果, 成功及失敗, 的隨機試驗. 若結果為X, X = 1 為成功, X = 0 為失敗, 此隨機變數稱為**伯努力隨機變數**, 記為 X∼Ber(p\).
$$
\begin{split}
X∼\rm Ber(p)\implies &P(X=1)=p,P(X=0)=1-p\\
\implies &f(x)=P(X=x)=p^x(1-p)^{1-x},x=0,1\\
&E(X)=p\\
&V(X)=p(1-p)
\end{split}
$$
### 二項試驗
**二項試驗**: 觀測 n 個獨立的伯努力試驗, 每次成功之機率皆固定設為 p, X 表 n 次中成功之次數 k, k=0,1,…,n. 顯然的,
$$
X=X_1+X_2+...+X_n,X_i\sim Ber(p)
$$
**二項試驗隨機變數**,X∼Bin(n,p)
$$
P(X=k)=\dfrac{n!}{k!(n-k)!}p^k(1-p)^{n-k}\\
\implies E(X)=np\quad V(X)=np(1-p)
$$
### 幾何隨機變數
實施獨立 Ber(p\) 試驗,直到**第一次成功**為止, X 代表試驗所需的次數 k=1,2,…
$$
P(X=k)=p(1−p)^{k−1}, k=1,2,…
$$
$$
\begin{split}
E(X)&=\sum^{\infty}_{x=1}xf(x)=\sum^{\infty}_{x=1}xp(1−p)^{x−1}\\
&=-p\dfrac{d}{dp}(\sum^{\infty}_{x=1}(1-p)^x)=-p\dfrac{d}{dp}(\dfrac{1-p}{p})=\dfrac{1}{p}\\
E(X^2)&=\sum^{\infty}_{x=1}x^2f(x)=\sum^{\infty}_{x=1}x^2p(1−p)^{x−1}\\
&=p\sum^{\infty}_{x=1}(x+1)x(1-p)^{x-1}-p\sum^{\infty}_{x=1}x(1-p)^{x-1}\\
&=p\dfrac{d^2}{dp^2}(\sum^{\infty}_{x=1}(1-p)^{x+1})-p\sum^{\infty}_{x=1}x(1-p)^{x-1}\\
&=p\dfrac{d^2}{dp^2}(\dfrac{(1-p)^2}{p})-\dfrac{1}{p}=\dfrac{2}{p^2}-\dfrac{1}{p}\\
Var(X)&=E(X^2)-(E(X))^2=\dfrac{1-p}{p^2}
\end{split}
$$