Try   HackMD

多変量の離散分布

tags: probability-theory

離散分布は、標本空間が離散集合の場合に、要素に座標を与えて、座標の確率を返す関数を定義する。事象の考え方はそのまま適用される。

二変量

同時確率密度関数と同時累積分布関数

2つの確率変数の組

(X1,X2)が従う確率分布は、2次元平面上に定義される。その確率分布の同時確率関数とは、
X1x1
かつ
X2x2
という事象の確率を次のような積分で表現できる関数
p(x1,x2)
のことをいう。

Pr[X1x1,X2x2]=x1x2p(u1,u2)du1du2

例えば正方形の領域

[1,m]×[1,m]の整数の組で作られる点の上で
p(x1,x2)1/m2
という関数を考える。下図は
m=3
の場合を示している。

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

この関数はこの領域の上で非負であり、この領域上のすべての整数の組の点での総和は

1となる。正方形内に点が
m2
個あり、すべての点で関数の値が
1/m2
なので、総和が
1
となることは、計算するまでもない。

上の確率を計算してみる。

Pr[X1x1,X2x2]=1x11x21m2=x1x2m2
となる。これが同時累積分布関数である。

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

周辺確率密度関数と条件付き確率密度関数

2つの添え字

a,bを考える。
a
b
は片方が
1
ならもう一方は
2
となる。

Xaの周辺確率密度関数は、
X1
および
X2
の同時密度関数から次のように導かれる。

p(xa)=xb(x1,x2)

また

Xbを所与としたときの、
Xa
の条件付き確率密度は、
X1
および
X2
の同時密度から次のように導かれる。
p(xa|xb)=p(x1,x2)p(xb)

これも同じ正方形上の連続一様分布で考えてみる。

p(x1)=1m1m2=1m

f(x1|x2)=1/m21/m=1m

どちらも

1/mになる。

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

このこと

f(x1|x2)=f(x1)
は、正方形上の一様分布は、確率変数同士が互いに独立なことを意味する。

周辺累積分布関数と条件付き累積分布関数

周辺確率密度関数から導かれる累積分布関数を周辺累積分布関数と呼び、条件付き確率密度関数から導かれる累積分布関数を条件付き確率密度関数と呼ぶことがある。周辺分布の累積分布関数、条件付き分布の累積分布関数と少し短く呼ばれることもある。

多変量

2変量の場合の単純な拡張で、多変量の場合も説明しておく。

同時確率密度関数

Pr[X1x1,X2x2,,Xpxp]=u1=x1u2=x2up=xpp(u1,u2,,up)

同時累積分布関数

F(x1,x2,,xp)=Pr[X1x1,X2x2,,Xpxp]

周辺確率密度関数

2つの添え字集合

A,B
AB={1,2,,p}
AB=
を満たすように定める。
A
B
は添え字集合全体の被覆ともいう。集合
A
の大きさを
q
、集合
B
の大きさを
r
とする。
A={a1,a2,,aq},B={b1,b2,,br}

q+r=p
である。

Aに含まれる変数の周辺同時確率密度関数は、全体の同時密度関数から次のように導かれる。

p(xa1,xa2,,xaq)=xb1xb2xbrf(x1,x2,,xp)

条件付き確率密度関数

Bに含まれる変数を所与としたときの、
A
に含まれる変数の条件付き確率密度は、全体の同時密度から次のように導かれる。
f(xa1,xa2,,xaq|xb1,xb2,,xbr)=f(x1,x2,,xp)f(xb1,xb2,,xbr)

周辺累積分布関数

F(xa1,xa2,,xaq)=ua1=xa1ua2=xa2uaq=xaqf(ua1,ua2,,uaq)

条件付き累積分布関数

F(xa1,xa2,,xaq|xb1,xb2,,xbr)=ua1=xa1ua2=xa2uaq=xaqf(ua1,ua2,,uaq|xb1,xb2,,xbr)