多変量の連続分布

# 多変量の連続分布 ###### tags: `probability-theory` ## 二変量 ### 標本空間標本空間は2次元ユークリッド空間の部分集合である。$\mathcal{X}\subseteq\mathscr{R}^2$。 ### 標本空間の加法族標本空間に含まれる4つの点$\left(a_1, b_1\right), \left(a_1, b_2\right), \left(a_2, b_1\right), \left(a_2, b_2\right)$が長方形の領域を囲むように$a_1<a_2$、$b_1<b_2$を満たすとする。このような2組の任意の実数による$\left(a_1, a_2\right]\times\left(b_1, b_2\right]$全体の集合から、この標本空間の加法族$\mathcal{A}$が作られる。滑らかな曲線で囲まれた領域を和集合の極限として表現できるためには、この加法族は加算加法族である必要がある。 ### 同時確率密度関数と同時累積分布関数 2つの確率変数の組$\left(X_1, X_2\right)$が従う確率分布は、2次元平面上に定義される。その確率分布の同時確率密度関数とは、$X_1\leq x_1$かつ$X_2\leq x_2$という事象の確率を次のような積分で表現できる関数$f\left(x_1, x_2\right)$のことをいう。 $$ \mathrm{Pr}\left[X_1\leq x_1, X_2\leq x_2\right] = \int_{-\infty}^{x_1}\int_{-\infty}^{x_2}f\left(u_1, u_2\right)du_1 du_2 $$ 例えば正方形の領域$\left[0,1\right]\times\left[0,1\right]$の上で$f\left(x_1,x_2\right)\equiv 1$という関数を考える。 ![](https://hackmd.io/_uploads/SkftSw4Vn.png) この関数はこの領域の上で非負であり、この領域上の定積分は$1$となる。正方形の面積が$1$で、関数による曲面の高さが$1$で一定なので、平面と関数で囲まれる領域の体積が$1$となることは、積分するまでもない。上の確率を計算してみる。 $$ \begin{align} \mathrm{Pr}\left[X_1\leq x_1, X_2\leq x_2\right] & = \int_{-\infty}^{x_1}\int_{-\infty}^{x_2}du_1 du_2 \notag \\ & = \left[u_2\left[u_1\right]_{0}^{x_1}\right]_{0}^{x_2} \notag \\ & = x_1 x_2 \end{align} $$ となる。これが同時累積分布関数である。 ![](https://hackmd.io/_uploads/BJzRUD4N3.png) 同時累積分布関数は $$ \lim_{\left(x_1, x_2\right)\rightarrow\left(\infty, \infty\right)} F\left(x_1, x_2\right) = 1 $$ および $$ \lim_{\left(x_1, x_2\right)\rightarrow\left(-\infty, -\infty\right)}F\left(x_1, x_2\right) = 0 $$ を満たす、単調非減少な関数である。 ### 周辺確率密度関数と条件付き確率密度関数 2つの添え字$a, b$を考える。$a$と$b$は片方が$1$ならもう一方は$2$となる。 $X_a$の周辺確率密度関数は、$X_1$および$X_2$の同時密度関数から次のように導かれる。 $$ f\left(x_{a}\right) = \int\left(x_1, x_2\right)dx_{b} $$ また$X_b$を所与としたときの、$X_a$の条件付き確率密度は、$X_1$および$X_2$の同時密度から次のように導かれる。 $$ f\left(x_{a}\left|x_{b}\right.\right) = \frac{f\left(x_1, x_2\right)}{f\left(x_{b}\right)} $$ これも同じ正方形上の連続一様分布で考えてみる。 $$ f\left(x_1\right) = \int_{0}^{1} dx_2 = 1 $$ $$ f\left(x_1\left|x_2\right.\right) = \frac{1}{1} = 1 $$ どちらも$1$になる。 ![](https://hackmd.io/_uploads/BJsBOvNEh.png) このこと $$ f\left(x_1\left|x_2\right.\right) = f\left(x_1\right) $$ は、正方形上の一様分布は、確率変数同士が互いに独立なことを意味する。 ### 周辺累積分布関数と条件付き累積分布関数周辺確率密度関数から導かれる累積分布関数を周辺累積分布関数と呼び、条件付き確率密度関数から導かれる累積分布関数を条件付き確率密度関数と呼ぶことがある。周辺分布の累積分布関数、条件付き分布の累積分布関数と少し短く呼ばれることもある。また同時累積分布関数と周辺累積分布関数の間には $$ \lim_{x_1\rightarrow\infty}F\left(x_1, x_2\right) = F\left(x_2\right) $$ および $$ \lim_{x_2\rightarrow\infty}F\left(x_1, x_2\right) = F\left(x_1\right) $$ という関係がある。 ## 多変量 2変量の場合の単純な拡張で、多変量の場合も説明しておく。 ### 同時確率密度関数 $$ \mathrm{Pr}\left[X_1\leq x_1, X_2\leq x_2, \ldots, X_p\leq x_p\right] = \int_{-\infty}^{x_1}\int_{-\infty}^{x_2}\cdots\int_{-\infty}^{x_p} f\left(u_1, u_2, \ldots, u_p\right)du_1 du_2 \cdots du_p $$ ### 同時累積分布関数 $$ F\left(x_1, x_2, \ldots, x_p\right) = \mathrm{Pr}\left[X_1\leq x_1, X_2\leq x_2, \ldots, X_p\leq x_p\right] $$ ### 周辺確率密度関数 2つの添え字集合$A, B$を$A\cup B=\left\{1,2,\ldots,p\right\}$、$A\cap B=\emptyset$を満たすように定める。$A$と$B$は添え字集合全体の被覆ともいう。集合$A$の大きさを$q$、集合$B$の大きさを$r$とする。 $$ A = \left\{a_1, a_2, \ldots, a_q\right\}, \,\, B = \left\{b_1, b_2, \ldots, b_r\right\} $$ $q+r=p$である。 $A$に含まれる変数の周辺同時確率密度関数は、全体の同時密度関数から次のように導かれる。 $$ f\left(x_{a_1}, x_{a_2}, \ldots, x_{a_q}\right) = \int\int\cdots\int f\left(x_1, x_2, \ldots, x_p\right)dx_{b_1} dx_{b_2} \cdots dx_{b_r} $$ ### 条件付き確率密度関数 $B$に含まれる変数を所与としたときの、$A$に含まれる変数の条件付き確率密度は、全体の同時密度から次のように導かれる。 $$ f\left(x_{a_1}, x_{a_2}, \ldots, x_{a_q}\left|x_{b_1}, x_{b_2}, \ldots, x_{b_r}\right.\right) = \frac{f\left(x_1, x_2, \ldots, x_p\right)}{f\left(x_{b_1}, x_{b_2}, \ldots, x_{b_r}\right)} $$ ### 周辺累積分布関数 $$ F\left(x_{a_1}, x_{a_2}, \ldots, x_{a_q}\right) = \int_{-\infty}^{x_{a_1}}\int_{-\infty}^{x_{a_2}}\cdots\int_{-\infty}^{x_{a_q}} f\left(u_{a_1}, u_{a_2}, \ldots, u_{a_q}\right) du_{a_1}du_{a_2}\cdots du_{a_q} $$ ### 条件付き累積分布関数 $$ F\left(x_{a_1}, x_{a_2}, \ldots, x_{a_q}\left|x_{b_1}, x_{b_2}, \ldots, x_{b_r}\right.\right) = \int_{-\infty}^{x_{a_1}}\int_{-\infty}^{x_{a_2}}\cdots\int_{-\infty}^{x_{a_q}} f\left(u_{a_1}, u_{a_2}, \ldots, u_{a_q}\left|x_{b_1}, x_{b_2}, \ldots, x_{b_r}\right.\right) du_{a_1}du_{a_2}\cdots dxu_{a_q} $$