###### tags: `school class`
# 機率與統計
## 機率
### 實驗experiment
機率實驗包含:
步驟procedures 模型model 觀察observations
結果outcome
實驗中可能的實驗結果
樣本空間sample space
所有可能的結果的集合 以S表示
事件event
對實驗結果的某種敘述
可以看成outcome的集合以及sample space的子集
例如:出現正面
事件空間event space
包含所有可能事件的集合
probability是一個集合的函數,自變數為事件
P(事件)
## 公理axioms
以數條公理作為理論的基石
無法被證明 只能被檢驗特定的條件是否滿足
機率三公理
1. P(A)>=0 任何事件的機率大約等於零
2. P(S)=1 樣本空間發生的機率等於一
3. A1’A2.... 互斥
=》P(A1UA2....)=P(A1)+P(A2)...
## 條件機率conditional probability
有一個機率分布,因某件事情發生後機率分布改變,此機率稱為條件機率
P(X|Y)=P(X)/P(Y)
X為事件(所關心的事件)
Y為條件(觀察到的事件)
若outcome與Y不相交,則P(O|Y)=0
若事件中有不在條件內之元素,則事件只需計算在條件內之元素
P(X|Y)=P(X∩Y)/P(Y)
條件事件關鍵字 後面通常會接條件
- condition on
- suppose
- if
- assuming
- given that
1. P(X|Y)=P(X∩Y)>=0/P(Y)>=0 >=0
2. P(Y|Y)=P(Y∩Y)/P(Y)=P(Y)/P(Y)=1
3. P(X1|Y)(X1=A∪B,A∩B=∅)=P(A)/P(Y)+P(B)/P(Y)
total probability定理
貝氏定理!!!!
獨立事件
P(A|B)=P(A)
A,B為獨立事件
## 隨機變數
把outcome數字化 outcome的函數
離散隨機變數
連續隨機變數
## 累積分布函數cumulative distribution function
## probability mass function
機率分布 將總合為1的機率分布在點上
離散的隨機變數等於某數的機率
## 白努力分布 bernoulli distribution
一個實驗 兩種結果 一種機率 某結果發生否
pmf=Px(x)
P,x=1
1-p,x=0
0,otherwise
cdf=Fx(x)
0,x<0
1-p,0<=x<1
p,x>=1
## binomial distribution
n次實驗 一種機率 n次中出現k次結果的機率
Px(x)=P(X=x)
(n x)P^x(1-p)^n-x,x=0,1,2,....
0,otherwise
## uniform distrubution
一次實驗 n種結果 機率相等 某結果發生否
Px(x)
1/b-a+1,x=a,a+1,...b
0,otherwise
## geometric distribution
實驗某結果出現機率已知 重複實驗至某結果首次出現 某結果在第幾次實驗首次出現
Px(x)=P(X=x)
(1-p)^x-1.p,x=1,2,3...
0,otherwise
## pascal distribution
某結果出現機率已知 重複實驗至某結果出現k次 第幾次實驗看到某結果出現k次
Px(x)
(x-1 k-1)p^k.(1-p)^x-k,x=k,k+1....
0,otherwise
## poisson distrubution
某結果出現之平均速率已知 持續觀察某時間長度後 該結果出現k次機率
λ=發生速率
T=觀察時間
Px(x)
e^-λT.((λT)/x!)^x
## 機率密度函數probability density function
連續用的 關鍵是密度
PDF=fx(x)
lim(Δx->0) P(x<=X<=x+Δx)/Δx
lim(Δx->0) Fx(x+Δx)-Fx(x) /Δx
Fx'(x)
CDF微分->/<-積分PDF
fx(x)=Fx'(x)
Fx(x)=∫(x -∞)fx(u)du
∫(∞ -∞)fx(x)dx=1
P(x1<=X<=x2)=∫(x1 x2)fx(x)dx
fx(x)>=0
## uniform distribution
fx(x)=1/b-a,a<=x<=b
Fx(x)=∫(x -∞)fx(u)du
0,x<=a
(x-a)/(b-a),a<=x<=-b
1,x>b
## exponential distribution
fx(x)=λe^-λx,x>=0
Fx(x)=1-e^-λx,x>=0
0,x<0
## erlang distribution
fx(x)=1/(n-1)! λ^n x^(n-1)e^-λx,x>=0
Fx(x)=1-lim(n-1 k=0)(λx)^k/k! e^-λx.x>=0
## normal/gaussian distrubution
fx(x)=1/√pi.a e^-(x-u)^2/2a^2
## standard normal/unit guassian distribution
fx(z)=1/√2pi e^-u^2/2
## 期望值expectation aka mean
做很多次實驗後平均值會收斂的極限值
## 變異數 variance
變異數開根號就是標準差
## 條件分布 condition distribution
PX|B(x)=P(X=x|B)=P(X=x,B)/P(B)
P(X=x)/P(B),x屬於B