# 確率変数の変換 (1次元)
###### tags: `probability-theory`
## 確率変数の変換
確率変数$X$が確率分布$F$に従っているとき、$X$を関数$g\left(x\right)$で変換する。このとき、新たな確率変数
$$
Y=g\left(X\right)
$$
が従う確率分布を考える。
まずは変換の種類を整理する。
### 単調変換
写像$g$が単調とは、次のいずれかが成り立つことをいう。
$$
\begin{align}
\forall x_1, x_2\in\mathscr{X} s.t. x_1\prec x_2 \Rightarrow g\left(x_1\right) \prec g\left(x_2\right) \notag
\end{align}
$$
または
$$
\begin{align}
\forall x_1, x_2\in\mathscr{X} s.t. x_1\prec x_2 \Rightarrow g\left(x_1\right) \succ g\left(x_2\right) \notag
\end{align}
$$
文字で書くと$x_1\prec x_2$を満たす$x_1, x_2\in\mathscr{X}$に対して、常に$g\left(x_1\right)\prec g\left(x_2\right)$が成り立つか、または常に$g\left(x_1\right)\succ g\left(x_2\right)$が成り立つことをいう。どちらか一方のみが常に成り立つのであり、いずれかが成り立つとは異なることを追記しておく。
写像$g$が単調ならば、$X$の標本空間$\mathscr{X}$の$g$による写像$g\left(\mathscr{X}\right)$のすべての要素は、$\mathscr{X}$の要素と1対1の対応を持つ。$g$の逆写像
$$
X = g^{-1}\left(Y\right)
$$
も存在して、$Y$の標本空間$\mathscr{Y}$の$g^{-1}$による写像$g^{-1}\left(\mathscr{Y}\right)$は、元の標本空間$\mathscr{X}$と一致する。
### 位置変換
確率変数 $X$ が確率分布 $F$ に従って分布するとする。しかしこれを観測する際に、$b$だけずれて観測してしまうとき、観測されるのは下記のように定められた$Y$の値となる。
$$
Y = X + b
$$
これを位置変換という。$X$の分布から$Y$の分布を導くには、
$$
X = Y - b
$$
を元の分布の表現に代入する。
$$
\begin{align}
f_Y\left(y\right) &= f_X\left(y-b\right) \notag \\
p_Y\left(y\right) &= p_X\left(y-b\right) \notag \\
F_Y\left(y\right) &= F_X\left(y-b\right) \notag \\
\end{align}
$$


標本空間が有界ならば、その境界も位置変換によって移動する。

### 尺度変換
確率変数 $X$ が確率分布 $F$ に従って分布するとする。しかしこれを観測する際に、正の定数$a$による$a$倍の値を観測するとき、観測されるのは下記のように定められた$Y$の値となる。
$$
Y = a X
$$
これを尺度変換という。$X$の分布から$Y$の分布を導くには、
$$
X = Y/a
$$
を元の分布の表現に代入する。
$$
\begin{align}
f_Y\left(y\right) &= f_X\left(y/a\right)/a \notag \\
p_Y\left(y\right) &= p_X\left(y/a\right) \notag \\
F_Y\left(y\right) &= F_X\left(y/a\right) \notag \\
\end{align}
$$


分布の平均が原点でない場合は、尺度変換は平均も動かす。

### 位置・尺度変換
確率変数 $X$ が確率分布 $F$ に従って分布するとする。しかしこれを観測する際に、正の定数$a$による$a$倍してから$b$を加えた値を観測するとき、観測されるのは下記のように定められた$Y$の値となる。
$$
Y = a X + b
$$
これを位置・尺度変換という。$X$の分布から$Y$の分布を導くには、
$$
X = (Y-b)/a
$$
を元の分布の表現に代入する。
$$
\begin{align}
f_Y\left(y\right) &= f_X\left((y-b)/a\right)/a \notag \\
p_Y\left(y\right) &= p_X\left((y-b)/a\right) \notag \\
F_Y\left(y\right) &= F_X\left((y-b)/a\right) \notag \\
\end{align}
$$
### もう一つの位置・尺度変換
確率変数 $X$ が確率分布 $F$ に従って分布するとする。しかしこれを観測する際に、正の定数$a$による$a$倍してから$b$を加えた値を観測するとき、観測されるのは下記のように定められた$Y$の値となる。
$$
Y = a (X + b)
$$
$X$の分布から$Y$の分布を導くには、逆変換
$$
X = Y/a - b
$$
を元の分布の表現に代入する。位置変換してから尺度変換なので、こちらの方が位置・尺度変換と呼ばれそうだが、実際にはあまり見られない順序である。
### 原点以外からの尺度変換
原点以外の点$x=b$の周りの尺度変換は、一度、原点への位置変換$X-b$を施してから、尺度変換$a$を施し、最後に位置を$b$に戻す。
$$
Y = a (X - b) + b
$$
この逆変換は
$$
X = (Y-b)/a + b
$$
となる。これはほとんど用いられない。
## 確率分布が確率関数で与えられている場合
確率分布$F$が確率関数$p_X\left(x\right)$で与えられている場合、$F$に従う確率変数$X$を$g\left(x\right)$で変換する。このとき、新たな確率変数
$$
Y=g\left(X\right)
$$
が従う確率分布を考える。
### $g$が単調関数
$g$が単調関数ならば、$X$の標本空間$\mathscr{X}$の$g$による写像$g\left(\mathscr{X}\right)$のすべての要素は、$\mathscr{X}$の要素と1対1の対応を持つ。$g$の逆変換
$$
X = g^{-1}\left(Y\right)
$$
も存在して、$Y$の標本空間$\mathscr{Y}$の$g^{-1}$による写像$g^{-1}\left(\mathscr{Y}\right)$は、元の標本空間$\mathscr{X}$と一致する。
このとき $Y$ の確率関数は
$$
p_Y\left(y\right) = p_X\left(g^{-1}\left(y\right)\right)
$$
となる。
## 確率分布が確率密度関数で与えられている場合
確率分布$F$が確率密度関数$f_X\left(x\right)$で与えられている場合、$F$に従う確率変数$X$を$g\left(x\right)$で変換する。このとき、新たな確率変数
$$
Y=g\left(X\right)
$$
が従う確率分布を考える。
### $g$が単調関数
$g$が単調関数ならば、$X$の標本空間$\mathscr{X}$の$g$による写像$g\left(\mathscr{X}\right)$のすべての要素は、$\mathscr{X}$の要素と1対1の対応を持つ。$g$の逆変換
$$
X = g^{-1}\left(Y\right)
$$
も存在して、$Y$の標本空間$\mathscr{Y}$の$g^{-1}$による写像$g^{-1}\left(\mathscr{Y}\right)$は、元の標本空間$\mathscr{X}$と一致する。
このとき $Y$ の確率密度関数は
$$
f_Y\left(y\right) = f_X\left(g^{-1}\left(y\right)\right) \frac{d}{dy}g^{-1}\left(y\right)
$$
となる。
## 確率分布が累積分布関数で与えられている場合
確率分布$F$が確率関数$p\left(x\right)$で与えられている場合、$F$に従う確率変数$X$を$g\left(x\right)$で変換する。このとき、新たな確率変数
$$
Y=g\left(X\right)
$$
が従う確率分布を考える。
### $g$が単調関数
このとき $Y$ の累積分布関数は
$$
F_Y\left(y\right) =F_X\left(g^{-1}\left(y\right)\right)
$$
となる。
## 変換が単調でない場合
### 非単調変換
$g$が非単調とは、$g$が単調でないことを言う。$g$が単調でなければ、$X$の標本空間$\mathscr{X}$の$g$による写像$g\left(\mathscr{X}\right)$の要素の中に、元の標本空間$\mathscr{X}$の複数の要素の変換に対応するものが存在する。
非単調変換の分布を導くには、変換が単調となる区間に標本空間を分割する。
1. $A_1, \ldots, A_m s.t. A_i \cup A_j = \emptyset$
2. $g:A_i \rightarrow g\left(A_i\right), \,\,\exists g^{-1} \, s.t. \, g^{-1}_{A_i}: g^{-1}_{A_i}\left(g\left(A_i\right)\right) \rightarrow A_i$
そして、変換の密度関数は
$$
\sum_{i:y \in g\left(A_i\right)}f_X\left(g^{-1}_{A_i} \left(y\right)\right)\frac{d}{dy}g^{-1}_{A_i}\left(y\right)
$$
となる。確率関数は
$$
\sum_{i:y \in g\left(A_i\right)}p_X\left(g^{-1}_{A_i} \left(y\right)\right)
$$
累積分布関数も
$$
\sum_{i:y \in g\left(A_i\right)}F_X\left(g^{-1}_{A_i} \left(y\right)\right)
$$
となる。
例えば、確率変数の絶対値の分布が必要なとき、
$$
Y = \left|X\right|
$$
という変換を考える。この変換は$X>0$および$X<0$それぞれの範囲で単調となる。
$$
A_1 = \left\{x; x\geq 0\right\}, \,\, A_2 = \left\{x; x<0\right\}
$$
それぞれの範囲での$Y$の確率分布は
$$
f_{Y|X\in A_1} = f_X\left(y\right), \,\, f_{Y|X\in A_2} = f_X\left(-y\right)
$$
なので、$Y$が従う確率分布は
$$
f_X\left(y\right) + f_X\left(-y\right)
$$
と導かれる。
### 例:半正規分布
確率変数$X$が平均$0$で分散が$\sigma^2$の正規分布に従っているとする。
$$
X \sim N\left(0, \sigma^2\right)
$$
この$X$の絶対値の分布を考える。
$$
Y = \left|X\right|
$$
この変換は$X<0$の範囲で単調減少、$X\geq 0$の範囲で単調増加となる。そのため標本空間を、この二つに分ける。
$$
A_1 = \left\{x; x<0\right\}, \,\, A_2 = \left\{x; x\geq 0\right\}
$$
さて$X\in A_1$のとき
$$
y = -x
$$
であり、
$$
\frac{dx}{dy} = -1
$$
となる。この範囲での密度関数は
$$
f_{Y|A_1}\left(y\right) = f_x\left(-y\right) = \frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{y^2}{2\sigma^2}\right\}\times\left|-1\right|
$$
である。
次に$X\in A_2$のとき
$$
y = x
$$
であり、
$$
\frac{dx}{dy} = 1
$$
となる。この範囲での密度関数は
$$
f_{Y|A_2}\left(y\right) = f_x\left(-y\right) = \frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{y^2}{2\sigma^2}\right\}\times\left|1\right|
$$
である。
よって$Y$の従う確率分布は、$y\geq 0$の範囲で
$$
f_Y\left(y\right) = f_{Y|A_1}\left(y\right)+f_{Y|A_2}\left(y\right) = \frac{2}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{y^2}{2\sigma^2}\right\}
$$
という確率密度関数を持つ。