--- tags: 應用統計 --- # 應用統計 R 101-3 ### **隨機變數** 隨機變數, X, 是一種將樣本空間中的每個元素映射到實線的函數, X:S→R. $$ \forall s \in S,X(s) \in R $$ 假設 X 表一隨機變數,則此函數的定義域為 S 或 Ω (樣本空間),對應域是實數 R,值域則為 R 的一個子集合。 i.e., 即對一個隨機變數 X,觀測到 s,再轉換至 X(s)。 ![](https://i.imgur.com/BG9snhl.png) #### 離散型隨機變數(discrete) 若取值為有限或可數無限 i.e.一個航空載具能完美運作需有一電腦系統運行. 為飛行安全起見, 此航空載具搭載一個電腦系統與兩個備用系統以備萬一. 假設此三系統皆為獨立運作. 假設 X 表示電腦系統可運行個數 #### 連續型隨機變數(continuous) 若取值在某一區間 i.e.手機更換一新原廠電池. 觀察此電池壽命. 假設 X 表示電池壽命. ### **事件** 給於一隨機變數 X,假設 A⊆R,定義事件 $$ {s∈S:X(s)∈A}={X∈A} $$ ![](https://i.imgur.com/lnhkpnM.png) 或更一般, 假設 A⊆R,事件 {X∈A} 表示 {X∈A}={s∈S:X(s)∈A}. 此事件機率為 $$ P(X\in A)=P({s\in S\mid X(s)\in A}) $$ #### 例子 1.在某一便利商店排隊領取5倍券 $$ S={s≥0}, 若機率 P(⋅) 為已知.\\ X 代表等待時間. 今 A 代表等待時間超過 45 分鐘的事件\\ A 事件發生的機率\\ P(X\in A)=P({s\in S\mid X(s)> 45}) $$ 2.系統嘗試接收對方傳遞的訊號, 直到確認接收為止 $$ S={1,2,3,…}, 若機率 P(⋅) 為已知.\\ X 代表直到接收成功需要的傳遞次數. 今 A 代表前100次都沒成功的事件.\\ A 事件發生的機率\\ P(X\in A)=P({s\in S\mid X(s)\ >100}) $$ ### **密度函數:離散型隨機變數(discrete)** #### **機率質量函數** 離散隨機變數 X 在 X=x 的機率, P(X=x) 或 f(x) 表示. 我們稱此函數 P(X=x) 為機率質量函數 (probability mass function, PMF 或 pmf). 滿足: $$ P(X=x)=f(x)>0\\ \sum_{x\in s} f(x)=1\\ P(X\in A)=\sum_{x\in A}f(x)\\ $$ 因為 P(X=x) 是函數型態, 所以可以用表格、圖形或公式來表示. 例如 ![](https://i.imgur.com/eID77Su.png) #### **累積分布函數** 定義隨機變數 X 的累積分布函數 (Cumulative Distribution Function, CDF or cdf): $$ F_{Xt}(t)=P(X\leq t)=P({s\mid X(s)\leq t}) $$ X 的累積密度函數有如下性質: $$ \begin{multline} \shoveleft 1.F(t),−∞<t<∞<是 t 的非遞減函數\\ \shoveleft \lim_{x\to -\infty}F(x)=0\quad\lim_{x\to \infty}F(x)=1\\ \shoveleft 2.單調性: F(x_1)≤F(x_2), if\ x_1<x_2\\ \shoveleft 3.右連續性: \lim_{x\to x_{0}^+}F(x)=F(x0)\\ \shoveleft 4.P(a<X≤b)=F(b)−F(a)\\ \end{multline} $$ ![](https://i.imgur.com/rpT92jF.png) #### 例子 考慮丟2個公平的硬幣. X 代表出現正面的次數 \<ANS> 1.寫出 X 的機率密度函數並繪圖 ![](https://i.imgur.com/3niVLjf.png) 2.寫出 X 的累積密度函數並繪圖 $$ F_x(x)= \begin{cases} 0,\quad & \rm for\ x<0\\ \dfrac{1}{4},& \ \rm for\ 0≤x<1\\ \dfrac{3}{4},& \ \rm for\ 1≤x<2\\ 1,& \ \rm for\ x>2\\ \end{cases} $$ ![](https://i.imgur.com/4iLz74m.png) 3.考慮丟兩個公平的硬幣. 如果第一個硬幣是正面, 則 X = 1; 否則 X = 0. 如果第二個硬幣是正面, Y = 1; 否則 Y = 5. 令 Z=XY.求X, Y, Z 機率質量函數? ![](https://i.imgur.com/LcotCFk.jpg) $$ \begin{multline} \shoveleft 4.若 X 的 PMF 為 P_X(k)=\dfrac{1}{2^k},k=1,2,3,...\\ \shoveleft (1)驗證 \sum_{k=1}^{\infty} P_X(k)=1 \end{multline} $$ $$ \sum_{k=1}^{\infty} P_X(k)=\sum_{k=1}^{\infty}\dfrac{1}{2^k}=\dfrac{\dfrac{1}{2}}{1-\dfrac{1}{2}}=1\ QED. $$ $$ \begin{multline} \shoveleft (2)求 X 的 \rm CMF 與繪圖\\ \end{multline} $$ ![](https://i.imgur.com/6sKQGOa.jpg) ### 隨機變數的期望值與變異數 #### 期望值 $$ μ_x=E(X)=\sum_{x\in S}xf(x) $$ #### 變異數 $$ V(X)=σ^2_X=E[(X-μ)^2]=\sum_{x\in S}(x-μ)^2f(x)\ or\\ σ^2=Var(X)=\sum_{x\in S}(x-μ)^2f(x)=\sum_{x\in S}(x^2-2xμ+μ^2)f(x)\\ =\sum_{x\in S}x^2f(x)-\sum_{x\in S}2xμf(x)+\sum_{x\in S}μ^2f(x)\\ =\sum_{x\in S}x^2f(x)-2μ\sum_{x\in S}xf(x)+\sum_{x\in S}μ^2f(x)\ (\sum_{x\in S}f(x)=1)\\ =\sum_{x\in S}x^2f(x)-2μ^2-μ^2=\underline{E(X^2)-μ^2} $$ * 標準差 $$ σ_X=\sqrt {Var(X)}=\sqrt {σ^2_X} $$ 如果隨機變數 Y=aX+b, 則 Y 與 X 期望值與變異數的關係: $$ μ_Y=aμ_X+b\\ σ^2_Y=a^2σ^2_x\\ σ_Y=|a|σ_X $$ #### 例子 1.假設 X, E(X)=μ, V(X)=σ^2. 若 Y=−1.1X+3, E(Y), V(Y)? $$ E(Y)=-1.1μ+3\\ V(Y)=1.21σ^2 $$ $$ Z=\dfrac{X−μ}{σ}→E(Z)=?, V(Z)=\\ E(Z)=E(\dfrac{X−μ}{σ})=\dfrac{X−μ}{σ}\\ V(Z)=V(\dfrac{X−μ}{σ})=\\ $$ ### **密度函數:連續隨機變數(continuous)** #### **機率密度函數** X 的機率密度函數 (probability density function, pdf) 是一個可積分函數滿足: $$ f(x)>0\\ \int_{-\infty}^{\infty} {f(x)} \,{\rm d}x=1\\ 如果 f(x) 是 X 的機率密度函數且 A 為某區間, 則 {X∈A} 的機率為:\\ P(X\in A)=\int_A {f(x)} \,{\rm d}x\\ P(X=x)=0, ∀x ← 單點的機率為零\\ P(a≤X≤b)=P(a<X≤b)=P(a≤X<b)=P(a<x<b)\\ $$ #### **累積密度函數** 累積密度函數 (Cumulative Distribution Function, CDF or cdf): $$ F(x)=\int_{-\infty}^{x} {f(t)} \,{\rm d}x,−∞<x<∞. $$ #### 例子 1.假設隨機變數 X 的 pdf: $$ f_X(x)= \begin{cases} 4x^3,\quad & \rm 0<x≤1\\\ 0,& \ \rm otherwise\\ \end{cases}\\ 求 \rm CDF?\ P(0.25≤X<0.75)\\ $$ $$ \begin{multline} \shoveleft <\rm sol>\\ \end{multline} $$ $$ F_X(x)= \begin{cases} 0,\quad & \rm x<0\\ x^4,& 0≤x<1\\ 1,& x\geq 1\\ \end{cases}\\ P(0.25≤X<0.75)=\int_{0.25}^{0.75}4x^3 \rm {dx}=x^4 |^{0.75}_{0.25}=0.3125 $$ 2.假設隨機變數 X 的 CDF $$ F_X(x)= \begin{cases} 0,\quad & \rm 0<x\\ x,& 0≤x≤1\\ 1,& x>1\\ \end{cases}\\ 若 Y=\rm exp(X)=\rm e^X, 求 Y 的 CDF 與 PDF? $$ $$ \begin{multline} \shoveleft <\rm sol>\\ \shoveleft 由於 e^X 是 X 的遞增函數且 R(X)=[0,1], 知道 R_Y=[1,e].\\ \shoveleft 求 FY(y), y∈[1,e],\\ \end{multline} $$ $$ F_Y(y)=P(Y≤y)=P(e^x≤y)=P(X≤ln(y))=F_X(lny)=lny\\ F_Y(y)= \begin{cases} 0,\quad & \rm 1<y\\ lny,& 1≤y<e\\ 1,& y\geq e\\ \end{cases}\\ f_Y(y)= \begin{cases} \dfrac{1}{y}, 1≤y≤e\\ 0,\rm otherwise \end{cases}\\ $$ ## 基本隨機變數 ### 伯努力試驗 只有兩種可能結果, 成功及失敗, 的隨機試驗. 若結果為X, X = 1 為成功, X = 0 為失敗, 此隨機變數稱為**伯努力隨機變數**, 記為 X∼Ber(p\). $$ \begin{split} X∼\rm Ber(p)\implies &P(X=1)=p,P(X=0)=1-p\\ \implies &f(x)=P(X=x)=p^x(1-p)^{1-x},x=0,1\\ &E(X)=p\\ &V(X)=p(1-p) \end{split} $$ ### 二項試驗 **二項試驗**: 觀測 n 個獨立的伯努力試驗, 每次成功之機率皆固定設為 p, X 表 n 次中成功之次數 k, k=0,1,…,n. 顯然的, $$ X=X_1+X_2+...+X_n,X_i\sim Ber(p) $$ **二項試驗隨機變數**,X∼Bin(n,p) $$ P(X=k)=\dfrac{n!}{k!(n-k)!}p^k(1-p)^{n-k}\\ \implies E(X)=np\quad V(X)=np(1-p) $$ ### 幾何隨機變數 實施獨立 Ber(p\) 試驗,直到**第一次成功**為止, X 代表試驗所需的次數 k=1,2,… $$ P(X=k)=p(1−p)^{k−1}, k=1,2,… $$ $$ \begin{split} E(X)&=\sum^{\infty}_{x=1}xf(x)=\sum^{\infty}_{x=1}xp(1−p)^{x−1}\\ &=-p\dfrac{d}{dp}(\sum^{\infty}_{x=1}(1-p)^x)=-p\dfrac{d}{dp}(\dfrac{1-p}{p})=\dfrac{1}{p}\\ E(X^2)&=\sum^{\infty}_{x=1}x^2f(x)=\sum^{\infty}_{x=1}x^2p(1−p)^{x−1}\\ &=p\sum^{\infty}_{x=1}(x+1)x(1-p)^{x-1}-p\sum^{\infty}_{x=1}x(1-p)^{x-1}\\ &=p\dfrac{d^2}{dp^2}(\sum^{\infty}_{x=1}(1-p)^{x+1})-p\sum^{\infty}_{x=1}x(1-p)^{x-1}\\ &=p\dfrac{d^2}{dp^2}(\dfrac{(1-p)^2}{p})-\dfrac{1}{p}=\dfrac{2}{p^2}-\dfrac{1}{p}\\ Var(X)&=E(X^2)-(E(X))^2=\dfrac{1-p}{p^2} \end{split} $$