# 確率変数の変換 (1次元) ###### tags: `probability-theory` ## 確率変数の変換 確率変数$X$が確率分布$F$に従っているとき、$X$を関数$g\left(x\right)$で変換する。このとき、新たな確率変数 $$ Y=g\left(X\right) $$ が従う確率分布を考える。 まずは変換の種類を整理する。 ### 単調変換 写像$g$が単調とは、次のいずれかが成り立つことをいう。 $$ \begin{align} \forall x_1, x_2\in\mathscr{X} s.t. x_1\prec x_2 \Rightarrow g\left(x_1\right) \prec g\left(x_2\right) \notag \end{align} $$ または $$ \begin{align} \forall x_1, x_2\in\mathscr{X} s.t. x_1\prec x_2 \Rightarrow g\left(x_1\right) \succ g\left(x_2\right) \notag \end{align} $$ 文字で書くと$x_1\prec x_2$を満たす$x_1, x_2\in\mathscr{X}$に対して、常に$g\left(x_1\right)\prec g\left(x_2\right)$が成り立つか、または常に$g\left(x_1\right)\succ g\left(x_2\right)$が成り立つことをいう。どちらか一方のみが常に成り立つのであり、いずれかが成り立つとは異なることを追記しておく。 写像$g$が単調ならば、$X$の標本空間$\mathscr{X}$の$g$による写像$g\left(\mathscr{X}\right)$のすべての要素は、$\mathscr{X}$の要素と1対1の対応を持つ。$g$の逆写像 $$ X = g^{-1}\left(Y\right) $$ も存在して、$Y$の標本空間$\mathscr{Y}$の$g^{-1}$による写像$g^{-1}\left(\mathscr{Y}\right)$は、元の標本空間$\mathscr{X}$と一致する。 ### 位置変換 確率変数 $X$ が確率分布 $F$ に従って分布するとする。しかしこれを観測する際に、$b$だけずれて観測してしまうとき、観測されるのは下記のように定められた$Y$の値となる。 $$ Y = X + b $$ これを位置変換という。$X$の分布から$Y$の分布を導くには、 $$ X = Y - b $$ を元の分布の表現に代入する。 $$ \begin{align} f_Y\left(y\right) &= f_X\left(y-b\right) \notag \\ p_Y\left(y\right) &= p_X\left(y-b\right) \notag \\ F_Y\left(y\right) &= F_X\left(y-b\right) \notag \\ \end{align} $$ ![](https://hackmd.io/_uploads/H1IqAHlNn.png) ![](https://hackmd.io/_uploads/S1dtAHlVn.png) 標本空間が有界ならば、その境界も位置変換によって移動する。 ![](https://hackmd.io/_uploads/HkzPCSlNn.png) ### 尺度変換 確率変数 $X$ が確率分布 $F$ に従って分布するとする。しかしこれを観測する際に、正の定数$a$による$a$倍の値を観測するとき、観測されるのは下記のように定められた$Y$の値となる。 $$ Y = a X $$ これを尺度変換という。$X$の分布から$Y$の分布を導くには、 $$ X = Y/a $$ を元の分布の表現に代入する。 $$ \begin{align} f_Y\left(y\right) &= f_X\left(y/a\right)/a \notag \\ p_Y\left(y\right) &= p_X\left(y/a\right) \notag \\ F_Y\left(y\right) &= F_X\left(y/a\right) \notag \\ \end{align} $$ ![](https://hackmd.io/_uploads/SJqsRBeE3.png) ![](https://hackmd.io/_uploads/HyLPCHe43.png) 分布の平均が原点でない場合は、尺度変換は平均も動かす。 ![](https://hackmd.io/_uploads/By6PCBeVn.png) ### 位置・尺度変換 確率変数 $X$ が確率分布 $F$ に従って分布するとする。しかしこれを観測する際に、正の定数$a$による$a$倍してから$b$を加えた値を観測するとき、観測されるのは下記のように定められた$Y$の値となる。 $$ Y = a X + b $$ これを位置・尺度変換という。$X$の分布から$Y$の分布を導くには、 $$ X = (Y-b)/a $$ を元の分布の表現に代入する。 $$ \begin{align} f_Y\left(y\right) &= f_X\left((y-b)/a\right)/a \notag \\ p_Y\left(y\right) &= p_X\left((y-b)/a\right) \notag \\ F_Y\left(y\right) &= F_X\left((y-b)/a\right) \notag \\ \end{align} $$ ### もう一つの位置・尺度変換 確率変数 $X$ が確率分布 $F$ に従って分布するとする。しかしこれを観測する際に、正の定数$a$による$a$倍してから$b$を加えた値を観測するとき、観測されるのは下記のように定められた$Y$の値となる。 $$ Y = a (X + b) $$ $X$の分布から$Y$の分布を導くには、逆変換 $$ X = Y/a - b $$ を元の分布の表現に代入する。位置変換してから尺度変換なので、こちらの方が位置・尺度変換と呼ばれそうだが、実際にはあまり見られない順序である。 ### 原点以外からの尺度変換 原点以外の点$x=b$の周りの尺度変換は、一度、原点への位置変換$X-b$を施してから、尺度変換$a$を施し、最後に位置を$b$に戻す。 $$ Y = a (X - b) + b $$ この逆変換は $$ X = (Y-b)/a + b $$ となる。これはほとんど用いられない。 ## 確率分布が確率関数で与えられている場合 確率分布$F$が確率関数$p_X\left(x\right)$で与えられている場合、$F$に従う確率変数$X$を$g\left(x\right)$で変換する。このとき、新たな確率変数 $$ Y=g\left(X\right) $$ が従う確率分布を考える。 ### $g$が単調関数 $g$が単調関数ならば、$X$の標本空間$\mathscr{X}$の$g$による写像$g\left(\mathscr{X}\right)$のすべての要素は、$\mathscr{X}$の要素と1対1の対応を持つ。$g$の逆変換 $$ X = g^{-1}\left(Y\right) $$ も存在して、$Y$の標本空間$\mathscr{Y}$の$g^{-1}$による写像$g^{-1}\left(\mathscr{Y}\right)$は、元の標本空間$\mathscr{X}$と一致する。 このとき $Y$ の確率関数は $$ p_Y\left(y\right) = p_X\left(g^{-1}\left(y\right)\right) $$ となる。 ## 確率分布が確率密度関数で与えられている場合 確率分布$F$が確率密度関数$f_X\left(x\right)$で与えられている場合、$F$に従う確率変数$X$を$g\left(x\right)$で変換する。このとき、新たな確率変数 $$ Y=g\left(X\right) $$ が従う確率分布を考える。 ### $g$が単調関数 $g$が単調関数ならば、$X$の標本空間$\mathscr{X}$の$g$による写像$g\left(\mathscr{X}\right)$のすべての要素は、$\mathscr{X}$の要素と1対1の対応を持つ。$g$の逆変換 $$ X = g^{-1}\left(Y\right) $$ も存在して、$Y$の標本空間$\mathscr{Y}$の$g^{-1}$による写像$g^{-1}\left(\mathscr{Y}\right)$は、元の標本空間$\mathscr{X}$と一致する。 このとき $Y$ の確率密度関数は $$ f_Y\left(y\right) = f_X\left(g^{-1}\left(y\right)\right) \frac{d}{dy}g^{-1}\left(y\right) $$ となる。 ## 確率分布が累積分布関数で与えられている場合 確率分布$F$が確率関数$p\left(x\right)$で与えられている場合、$F$に従う確率変数$X$を$g\left(x\right)$で変換する。このとき、新たな確率変数 $$ Y=g\left(X\right) $$ が従う確率分布を考える。 ### $g$が単調関数 このとき $Y$ の累積分布関数は $$ F_Y\left(y\right) =F_X\left(g^{-1}\left(y\right)\right) $$ となる。 ## 変換が単調でない場合 ### 非単調変換 $g$が非単調とは、$g$が単調でないことを言う。$g$が単調でなければ、$X$の標本空間$\mathscr{X}$の$g$による写像$g\left(\mathscr{X}\right)$の要素の中に、元の標本空間$\mathscr{X}$の複数の要素の変換に対応するものが存在する。 非単調変換の分布を導くには、変換が単調となる区間に標本空間を分割する。 1. $A_1, \ldots, A_m s.t. A_i \cup A_j = \emptyset$ 2. $g:A_i \rightarrow g\left(A_i\right), \,\,\exists g^{-1} \, s.t. \, g^{-1}_{A_i}: g^{-1}_{A_i}\left(g\left(A_i\right)\right) \rightarrow A_i$ そして、変換の密度関数は $$ \sum_{i:y \in g\left(A_i\right)}f_X\left(g^{-1}_{A_i} \left(y\right)\right)\frac{d}{dy}g^{-1}_{A_i}\left(y\right) $$ となる。確率関数は $$ \sum_{i:y \in g\left(A_i\right)}p_X\left(g^{-1}_{A_i} \left(y\right)\right) $$ 累積分布関数も $$ \sum_{i:y \in g\left(A_i\right)}F_X\left(g^{-1}_{A_i} \left(y\right)\right) $$ となる。 例えば、確率変数の絶対値の分布が必要なとき、 $$ Y = \left|X\right| $$ という変換を考える。この変換は$X>0$および$X<0$それぞれの範囲で単調となる。 $$ A_1 = \left\{x; x\geq 0\right\}, \,\, A_2 = \left\{x; x<0\right\} $$ それぞれの範囲での$Y$の確率分布は $$ f_{Y|X\in A_1} = f_X\left(y\right), \,\, f_{Y|X\in A_2} = f_X\left(-y\right) $$ なので、$Y$が従う確率分布は $$ f_X\left(y\right) + f_X\left(-y\right) $$ と導かれる。 ### 例:半正規分布 確率変数$X$が平均$0$で分散が$\sigma^2$の正規分布に従っているとする。 $$ X \sim N\left(0, \sigma^2\right) $$ この$X$の絶対値の分布を考える。 $$ Y = \left|X\right| $$ この変換は$X<0$の範囲で単調減少、$X\geq 0$の範囲で単調増加となる。そのため標本空間を、この二つに分ける。 $$ A_1 = \left\{x; x<0\right\}, \,\, A_2 = \left\{x; x\geq 0\right\} $$ さて$X\in A_1$のとき $$ y = -x $$ であり、 $$ \frac{dx}{dy} = -1 $$ となる。この範囲での密度関数は $$ f_{Y|A_1}\left(y\right) = f_x\left(-y\right) = \frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{y^2}{2\sigma^2}\right\}\times\left|-1\right| $$ である。 次に$X\in A_2$のとき $$ y = x $$ であり、 $$ \frac{dx}{dy} = 1 $$ となる。この範囲での密度関数は $$ f_{Y|A_2}\left(y\right) = f_x\left(-y\right) = \frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{y^2}{2\sigma^2}\right\}\times\left|1\right| $$ である。 よって$Y$の従う確率分布は、$y\geq 0$の範囲で $$ f_Y\left(y\right) = f_{Y|A_1}\left(y\right)+f_{Y|A_2}\left(y\right) = \frac{2}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{y^2}{2\sigma^2}\right\} $$ という確率密度関数を持つ。