Try   HackMD

期待値に関する不等式

tags: probability-theory

準備

凸関数

下に凸な関数

凸関数とは一般には、下に凸な関数を指していう。図の緑色の曲線が関数

y=g(x)の軌跡とする。

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

この関数は任意の2点

x1,x2を取ると、
0t1
を満たす実数
t
に対して
g(tx1+(1t)x2)tg(x1)+(1t)g(x2)

が成り立つ。内点の関数の値は、関数の値の等分より大きくなる。この性質を下に凸という。

下に凸な関数の、任意の点

x0での接線を考える。

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

この接線を

h(x)=ax+b と置く。するとすべての点において
x,h(x)g(x)

が成り立つ。等号は
x=x0
の点のみで成り立つ。

下に凸な関数は局所最小となる点を一つしか持たない。その点は大域的な最小値を与える。

上に凸な関数

関数

g(x)が上に凸の場合はすべての不等号の向きが反対になるだけで、同様の性質を持つ。

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

内積と外積

p次元ユークリッド空間の中のベクトル同士の内積は、ベクトルを直交座標系で表現すると
\boldsymbola,\boldsymbolb=i=1paibi

と計算できる

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

赤いベクトル

aと青いベクトル
b
の内積は、
b
から
a
に向けておろした垂線の足
OD
の長さと
a
の長さの積になる。
a,b=abcosθ

赤いベクトル

aと青いベクトル
b
の外積の長さは、
b
から
a
に向けておろした垂線
BD
の長さと
a
の長さの積になり、これは
a
b
が作る平行四辺形の面積に一致する。またこれは、
b
を原点の周りに
π/2
だけ回転したベクトル
b
と、
a
を原点の周りに
π
だけ回転したベクトル
a
との内積に等しい。

Jensenの不等式

下に凸な関数

g(x)について
g(E[X])E[g(X)]

が成り立つ。

Xを確率変数、
g(x)
X
の標本空間上で下に凸な関数とする。
g(x)
に対して、
x=E[X]
において接する直線
h(x)
を考える。
g
が下に凸なので、この直線の切片
a
と傾き
b

h(E[X])=aE[X]+b=g(E[X])

および
xX,g(x)ax+b

を満たすように定めることができる。

Xの期待値が有限なとき、
g(X)h(X)
より
E[g(X)]E[h(X)]

が成り立つ。さらに右辺は
E[h(X)]=E[aX+b]=aE[X]+b=h(E[X])=g(E[X])

なので、最初の不等式が示される。この不等式が成り立つための十分条件は
E[X]
が有限なことである。

なお、上に凸な関数

g(x)については
g(E[X])E[g(X)]

が成り立つ。

例1

Jensenの不等式において、

h(x)=|x|と置くと、
|E[X]|E[|X|]

を得る。また、
h(x)=x2
と置くと
{E[X]}2E[X2]

さらに両辺の平方根を求めて、
|E[X]|E[X2]

を得る。以上から
|E[X]|min{E[|X|],E[X2]}

となる。

ところで、Jensenの不等式からではないが

E[|X|]E[X2]+1
が示せる。これも合わせると、
|E[X]|E[|X|]E[X2]+1

となる。

絶対値の期待値についての不等式は、

1x1の範囲で
|x|
1
より小さいことと、それ以外の範囲では
|x|x2
となることを用いて、次のように示される。
E[|X|]=|x|f(x)dx=1|x|f(x)dx+11|x|f(x)dx+1|x|f(x)dx1|x|2f(x)dx+11|x|f(x)dx+1|x|2f(x)dx=1x2f(x)dx+11|x|f(x)dx+1x2f(x)dx1x2f(x)dx+11f(x)dx+1x2f(x)dxx2f(x)dx+11f(x)dxx2f(x)dx+f(x)dx=E[X2]+1

不等式に等号が含まれてはいるが、左辺に対して右辺で
1(x2|x|+1)f(x)dx+11(1|x|+x2)f(x)dx+1(x2|x|+1)f(x)dx

だけ加えているので、これら3項のすべてが
0
でなければ等号は成立しない。

例2 算術平均と幾何平均と調和平均の大小関係 (その1)

三つの期待値を

mS=E[X]mM=expE[logX]mI=1E[1X]
と定める。これらの大小関係を考える。
E[logX]logE[X]

より、
mM=expE[logX]E[X]=mS

を得る。また
E[log(1X)]logE[1X]

より、
1mM=exp{E[logX]}=exp{E[log(1X)]}E[1X]=1mI

すなわち
mImM

を得る。

以上から

mImMmS
を得る。

例3 算術平均と幾何平均と調和平均の大小関係 (その2)

Xを確率
1/n
n
個の点
x1,,xn
のいずれかを取る確率変数とする。すると上の3つの量はそれぞれ
mS=1n(x1+x2++xn)mM=(x1×x2××xn)1/nmI=11n(1x1+1x2++1xn)

のように標本平均、幾何平均、調和平均となる。これらの大小関係は例2と同じく
mImMmS

となる。

Cauchy-Schwarzの不等式

内積空間の中の任意の2点について

|a,b|ab
が成り立つ。ただしノルム
は、内積から導かれる
a=a,a
とする。

これがCauchy-Shwartzの不等式である。これは一般の内積空間で成り立つ。

  • R2
    \boldsymbola,\boldsymbolb=a1b1+a2b2
    の場合、
    |a1b1+a2b2|a12+a22b12+b22
  • L2
    f,g=xf(x)g(x)dx
    の場合、
    |xf(x)g(x)dx|xf(x)2dxxg(x)2dx
  • 確率変数の空間の内積を
    E[(XE[X])(YE[Y])]
    の場合、
    Cov(X,Y)=V(X)V(Y)

2つの互いに直交しない要素

a,bを考える。
b
から
a
に向けて降ろした垂線の足は

a,baa

となる。垂線を

cと置くと、

c=ba,ba2a

であり、点のノルムは

0以上となる。この関係から

c2=ba,ba2a,ba,ba2a=b,b2a,ba2a,b+a,b2a4a,a=b2a,b2a20

を得る。よって

a,b2a2b2

すなわち

a,ba2b2

を得る。等式は

a
b
b=ka
と平行な関係にある場合に成り立つ。

例3 相関係数

任意の2つの確率変数の相関係数は

1
1
の間の値を取る。

1ρ(X,Y)1

これは上の不等式と、相関係数の定義

ρ(X,Y)=Cov(X,Y)V(X)V(Y)

から明らか。

別の証明として、

X+aYの分散を考える方法もある。

V(X+aY)=E[(X+aYE[X+aY])2]=E[(XE[X]+a(YE[Y]))2]=V(X)+a2V(Y)2aE[(XE[X])(YE[Y])]
最後の式を平方完成させると更に
V(X+aY)=V(Y)(a22aCov(X,Y)V(Y))+V(X)=V(Y)(aCov(X,Y)V(Y))2+V(X)Cov(X,Y)2V(Y)

となる。もともと分散
V(X+aY)
は非負であり、初項は必ず非負なので、この第2項と第3項から
V(X)Cov(X,Y)2V(Y)0

が導かれる。これを整理して
Cov(X,Y)2V(X)V(Y)1

を得る。

例4 標本相関係数

Cauchy-Schwarzの不等式

|i=1n(xixn)(yiyn)|i=1n(xixn)2i=1n(yiyn)
より、
|1ni=1n(xixn)(yiyn)|1ni=1n(xixn)21ni=1n(yiyn)1

参考