Try   HackMD

Introduction

這篇主要講述用大致估計的方式找出期望值 (類似數學中的測度論)

Probability Inequalities

基礎公式

以下會介紹這幾個定理 :

  • Markov's inequality
  • Chebyshev's inequality (
    \colorred
    )
  • Hoeffding's inequality
  • Bernoulli 的情況

Markov's inequality

X 是 non-negative random variable
E(X)
exist
這時
\colorblueP(X>t)E(X)t

證明過程如下 :

EX=0xf(x) dx=[ 0txf(x) dx+txf(x) dx ]txf(x) dxttf(x) dx=tP(x>t)
P(x>t)EXt


小舉例 :
全班平均

50 分,求
90
分以上的比例 :
P(X>90)5090=59


Chebyshev's inequality

先令

μ=E(X), σ2=V(X)
這時
\colorblueP(|Xμ|t)σ2t2, and P(|Zk|)1k2, for Z=(Xμ)σ

證明過程如下 :

P(|Xμ|t)=P(|Xμ|2t2)\colororangeP(x>t)EXtE(Xmu)2t2=σ2t2

P(|(Xμ)σK|)=P(|Xμ|σK)σ2(σk)2=1k2


小舉例-1 :
全班平均

50 分,標準差
10
分,求
90
分以上的比例 :
P(X>90)12P(|X50|>40)12×1001600=132

小舉例-2 :
全班平均

50 分,標準差
30
分,求
90
分以上的比例 :
P(X>90)12P(|X50|>40)12×9001600=932

可以從小舉例當中看到當
σ2
很大,或是
t
很小的時候,估計出來的值就會失去意義


Hoeffding's inequality

先令

Y1, ..., Yn 為 random variables,並且
E(Yi)=0, aiYibi

這時令
ϵ>0, for any t>0

\colorblueP(Σi=1n Yiϵ)etϵΠi=1n et2(biai)2/8


Bernoulli 的情況

先令

X1, ..., XnBernoulli(p)
這時對於所有
ϵ>0

P(|Xnp|>ϵ)2e2nϵ2, for Xn=n1Σi=1nXi

Examples

Question 1 (estimating a proportion估計母體的
p
)

question :

Yi 是第
i
個樣本的狀態(
1, 0
),
i=1, ..., n
,且
YiiidBernoulli(p)
,求出母體的
p

(給定
ϵ=0.1, n=100
)

solution :
我們可以先從題目得知 :

{E(Yi)=pV(Yi)=p(1p)
並且可以知道題目想要用
1nΣi=1nYip
,也就是在樣本
n
人中狀態為
1
的比例
簡化成數學式 :
P(|1nΣi=1nYip|>ϵ)

然後可以知道這個式子的平均跟變異數 :
{E(1nΣi=1nYi)=pV(1nΣi=1nYi)=1n2Σi=1nV(Yi)=p(1p)n

(i) Chebyshev's inequality :
P(|1nΣi=1nYip|>ϵ)p(1p)ϵ2nσ2t2σ2=Vt=ϵ0.5×(10.5)0.1×0.1×100

(ii) Hoeffding's inequality :
P(|1nΣi=1nYip|>ϵ)2e2×100×1100=e2

(iii) CLT(central limit theorem)
(ϵ=0.2)
:
P(|1nΣi=1nYip|>ϵ)3.17×105

Inequalities for Expectations

基礎公式

以下會介紹這幾個定理 :

  • Cauchy-Schwartz inequality
  • Jensen's inequality

Cauchy-Schwartz inequality

X
Y
的變異數都是有限的時候
|(E|XY)|E(X2)E(Y2)

E(XμX)(YμY)E(XμX)2(YμY)2=(VX)(VY)
|cov(X, Y)(VX)(VY)|=|P(X, Y)|1

這條公式是從
|xy||x||y|
推導而來

證明如下 :

xy=1n(xy)
x2=1n|x|2

y2=1n|y|2

所以藉由原始公式 :
|xy|=xy|x||y|=x2y2

也就是說
XY的 sample meanX2的 sample meanY2的 sample mean


Jensen's inequality

主要使用在函數不是線性的時候
簡單來說就是用微積分的概念來看,觀察函數是 convex 還是 concave

convex :

E(g(X))g(E(X))
代表從中間隨便畫出一條線,線上的中點(A點)會比投影到這個函數的值(B點)還要大
Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

concave :

E(g(X))g(E(X))
跟 convex 相反