Introduction

這篇主要講述用大致估計的方式找出期望值 (類似數學中的測度論)

Probability Inequalities

基礎公式

以下會介紹這幾個定理 :

Markov's inequality
Chebyshev's inequality (
$\color r e d 超重要$ )
Hoeffding's inequality
Bernoulli 的情況

Markov's inequality

X

是 non-negative random variable
且

E (X)

exist
這時

\color b l u e \underset{此 分 布 的 右 尾 有 多 厚}{\underset{⏟}{P (X > t)}} \leq \frac{E (X)}{t}

證明過程如下 :

\begin{array}{r} E X = \int_{0}^{\infty} x f (x) d x = [\int_{0}^{t} x f (x) d x + \int_{t}^{\infty} x f (x) d x] \geq \int_{t}^{\infty} x f (x) d x \geq \int_{t}^{\infty} t f (x) d x = t P (x > t) \end{array}

\Rightarrow P (x > t) \leq \frac{E X}{t}

小舉例 :
全班平均

50

分，求

90

分以上的比例 :

P (X > 90) \leq \frac{50}{90} = \frac{5}{9}

Chebyshev's inequality

先令

μ = E (X), σ^{2} = V (X)

這時

\color b l u e P (| X - μ | \geq t) \leq \frac{σ^{2}}{t^{2}}, and P (| Z \geq k |) \leq \frac{1}{k^{2}}, for Z = \frac{(X - μ)}{σ}

證明過程如下 :

P (| X - μ | \geq t) = \underset{\color o r a n g e P (x > t) \leq \frac{E X}{t}}{\underset{⏟}{P (| X - μ |^{2} \geq t^{2})}} \leq \frac{E (X - m u)^{2}}{t^{2}} = \frac{σ^{2}}{t^{2}}

P (| \frac{(X - μ)}{σ} \geq K |) = P (| X - μ | \geq σ K) \leq \frac{σ^{2}}{(σ k)^{2}} = \frac{1}{k^{2}}

小舉例-1 :
全班平均

50

分，標準差

10

分，求

90

分以上的比例 :

P (X > 90) \approx \frac{1}{2} P (| X - 50 | > 40) \leq \frac{1}{2} \times \frac{100}{1600} = \frac{1}{32}

小舉例-2 :
全班平均

50

分，標準差

30

分，求

90

分以上的比例 :

P (X > 90) \approx \frac{1}{2} P (| X - 50 | > 40) \leq \frac{1}{2} \times \frac{900}{1600} = \frac{9}{32}

\Rightarrow

可以從小舉例當中看到當

σ^{2}

很大，或是

t

很小的時候，估計出來的值就會失去意義

Hoeffding's inequality

先令

Y_{1}, . . ., Y_{n}

為 random variables，並且

E (Y_{i}) = 0, a_{i} \leq Y_{i} \leq b_{i}

這時令

ϵ > 0, for any t > 0

\color b l u e P (Σ_{i = 1}^{n} Y_{i} \geq ϵ) \leq e^{- t ϵ} \cdot Π_{i = 1}^{n} e^{t^{2} (b_{i} - a_{i})^{2} / 8}

Bernoulli 的情況

先令

X_{1}, . . ., X_{n} \sim B e r n o u l l i (p)

這時對於所有

ϵ > 0

P (| \overset{―}{X_{n}} - p | > ϵ) \leq 2 e^{- 2 n ϵ^{2}}, for \overset{―}{X_{n}} = n^{- 1} Σ_{i = 1}^{n} X_{i}

Examples

Question 1 (estimating a proportion–估計母體的
$p$ )

question :

Y_{i}

是第

i

個樣本的狀態(

1, 0

)，

i = 1, . . ., n

，且

Y_{i} \overset{i i d}{\sim} B e r n o u l l i (p)

，求出母體的

p

(給定

ϵ = 0.1, n = 100

)

solution :
我們可以先從題目得知 :

{\begin{cases} E (Y_{i}) = p \\ V (Y_{i}) = p (1 - p) \end{cases}

並且可以知道題目想要用

\frac{1}{n} Σ_{i = 1}^{n} Y_{i} \overset{估 計}{⟶} p

，也就是在樣本

n

人中狀態為

1

的比例
簡化成數學式 :

P (| \frac{1}{n} Σ_{i = 1}^{n} Y_{i} - p | > ϵ)

然後可以知道這個式子的平均跟變異數 :

{\begin{cases} E (\frac{1}{n} Σ_{i = 1}^{n} Y_{i}) = p \\ V (\frac{1}{n} Σ_{i = 1}^{n} Y_{i}) = \frac{1}{n^{2}} Σ_{i = 1}^{n} V (Y_{i}) = \frac{p (1 - p)}{n} \end{cases}

(i)

Chebyshev's inequality :

P (| \frac{1}{n} Σ_{i = 1}^{n} Y_{i} - p | > ϵ) \leq \underset{就 是 \frac{σ^{2}}{t^{2}} ， σ^{2} = 上 述 的 V ， t = 上 述 的 ϵ}{\underset{⏟}{\frac{p (1 - p)}{ϵ^{2} n}}} \leq \frac{0.5 \times (1 - 0.5)}{0.1 \times 0.1 \times 100}

(i i)

Hoeffding's inequality :

P (| \frac{1}{n} Σ_{i = 1}^{n} Y_{i} - p | > ϵ) \leq 2 e^{- 2 \times 100 \times \frac{1}{100}} = e^{- 2}

(i i i)

CLT(central limit theorem)

(ϵ = 0.2)

P (| \frac{1}{n} Σ_{i = 1}^{n} Y_{i} - p | > ϵ) \approx 3.17 \times 10^{- 5}

Inequalities for Expectations

基礎公式

以下會介紹這幾個定理 :

Cauchy-Schwartz inequality
Jensen's inequality

Cauchy-Schwartz inequality

當

X

跟

Y

的變異數都是有限的時候

| (E | X Y) | \leq \sqrt{E (X^{2}) E (Y^{2})}

\Rightarrow E (X - μ_{X}) (Y - μ_{Y}) \leq \sqrt{E (X - μ_{X})^{2} (Y - μ_{Y})^{2}} = \sqrt{(V X) (V Y)}

\Rightarrow | \frac{c o v (X, Y)}{\sqrt{(V X) (V Y)}} | = | P (X, Y) | \leq 1

這條公式是從

| \vec{x} \cdot \vec{y} | \leq | \vec{x} | \cdot | \vec{y} |

推導而來

證明如下 :

\overset{―}{x y} = \frac{1}{n} (\vec{x} \cdot \vec{y})

\overset{―}{x^{2}} = \frac{1}{n} | \vec{x} |^{2}

\overset{―}{y^{2}} = \frac{1}{n} | \vec{y} |^{2}

所以藉由原始公式 :

| \vec{x} \cdot \vec{y} | = \overset{―}{x y} \leq | \vec{x} | \cdot | \vec{y} | = \sqrt{\overset{―}{x^{2}}} \cdot \sqrt{\overset{―}{y^{2}}}

也就是說

X Y 的 sample mean \leq \sqrt{X^{2} 的 sample mean} \sqrt{Y^{2} 的 sample mean}

Jensen's inequality

主要使用在函數不是線性的時候
簡單來說就是用微積分的概念來看，觀察函數是 convex 還是 concave

convex :

E (g (X)) \geq g (E (X))

代表從中間隨便畫出一條線，線上的中點(A點)會比投影到這個函數的值(B點)還要大

Image Not Showing Possible Reasons

The image was uploaded to a note which you don't have access to
The note which the image was originally uploaded to has been deleted

Learn More →

concave :

E (g (X)) \leq g (E (X))

跟 convex 相反

Introduction

Probability Inequalities

基礎公式

Markov's inequality

Chebyshev's inequality

Hoeffding's inequality

Bernoulli 的情況

Examples

Question 1 (estimating a proportion–估計母體的 p)

Inequalities for Expectations

基礎公式

Cauchy-Schwartz inequality

Jensen's inequality

Read more

高公局比賽問題

cryptography 圖文解析

常用的 latex

mathstat_midterm_review2

Question 1 (estimating a proportion–估計母體的
$p$ )