Try   HackMD

多変量の連続分布

tags: probability-theory

二変量

標本空間

標本空間は2次元ユークリッド空間の部分集合である。

XR2

標本空間の加法族

標本空間に含まれる4つの点

(a1,b1),(a1,b2),(a2,b1),(a2,b2)が長方形の領域を囲むように
a1<a2
b1<b2
を満たすとする。このような2組の任意の実数による
(a1,a2]×(b1,b2]
全体の集合から、この標本空間の加法族
A
が作られる。滑らかな曲線で囲まれた領域を和集合の極限として表現できるためには、この加法族は加算加法族である必要がある。

同時確率密度関数と同時累積分布関数

2つの確率変数の組

(X1,X2)が従う確率分布は、2次元平面上に定義される。その確率分布の同時確率密度関数とは、
X1x1
かつ
X2x2
という事象の確率を次のような積分で表現できる関数
f(x1,x2)
のことをいう。

Pr[X1x1,X2x2]=x1x2f(u1,u2)du1du2

例えば正方形の領域

[0,1]×[0,1]の上で
f(x1,x2)1
という関数を考える。

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

この関数はこの領域の上で非負であり、この領域上の定積分は

1となる。正方形の面積が
1
で、関数による曲面の高さが
1
で一定なので、平面と関数で囲まれる領域の体積が
1
となることは、積分するまでもない。

上の確率を計算してみる。

Pr[X1x1,X2x2]=x1x2du1du2=[u2[u1]0x1]0x2=x1x2
となる。これが同時累積分布関数である。

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

同時累積分布関数は

lim(x1,x2)(,)F(x1,x2)=1
および
lim(x1,x2)(,)F(x1,x2)=0

を満たす、単調非減少な関数である。

周辺確率密度関数と条件付き確率密度関数

2つの添え字

a,bを考える。
a
b
は片方が
1
ならもう一方は
2
となる。

Xaの周辺確率密度関数は、
X1
および
X2
の同時密度関数から次のように導かれる。

f(xa)=(x1,x2)dxb

また

Xbを所与としたときの、
Xa
の条件付き確率密度は、
X1
および
X2
の同時密度から次のように導かれる。
f(xa|xb)=f(x1,x2)f(xb)

これも同じ正方形上の連続一様分布で考えてみる。

f(x1)=01dx2=1

f(x1|x2)=11=1

どちらも

1になる。

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

このこと

f(x1|x2)=f(x1)
は、正方形上の一様分布は、確率変数同士が互いに独立なことを意味する。

周辺累積分布関数と条件付き累積分布関数

周辺確率密度関数から導かれる累積分布関数を周辺累積分布関数と呼び、条件付き確率密度関数から導かれる累積分布関数を条件付き確率密度関数と呼ぶことがある。周辺分布の累積分布関数、条件付き分布の累積分布関数と少し短く呼ばれることもある。

また同時累積分布関数と周辺累積分布関数の間には

limx1F(x1,x2)=F(x2)
および
limx2F(x1,x2)=F(x1)

という関係がある。

多変量

2変量の場合の単純な拡張で、多変量の場合も説明しておく。

同時確率密度関数

Pr[X1x1,X2x2,,Xpxp]=x1x2xpf(u1,u2,,up)du1du2dup

同時累積分布関数

F(x1,x2,,xp)=Pr[X1x1,X2x2,,Xpxp]

周辺確率密度関数

2つの添え字集合

A,B
AB={1,2,,p}
AB=
を満たすように定める。
A
B
は添え字集合全体の被覆ともいう。集合
A
の大きさを
q
、集合
B
の大きさを
r
とする。
A={a1,a2,,aq},B={b1,b2,,br}

q+r=p
である。

Aに含まれる変数の周辺同時確率密度関数は、全体の同時密度関数から次のように導かれる。

f(xa1,xa2,,xaq)=f(x1,x2,,xp)dxb1dxb2dxbr

条件付き確率密度関数

Bに含まれる変数を所与としたときの、
A
に含まれる変数の条件付き確率密度は、全体の同時密度から次のように導かれる。
f(xa1,xa2,,xaq|xb1,xb2,,xbr)=f(x1,x2,,xp)f(xb1,xb2,,xbr)

周辺累積分布関数

F(xa1,xa2,,xaq)=xa1xa2xaqf(ua1,ua2,,uaq)dua1dua2duaq

条件付き累積分布関数

F(xa1,xa2,,xaq|xb1,xb2,,xbr)=xa1xa2xaqf(ua1,ua2,,uaq|xb1,xb2,,xbr)dua1dua2dxuaq