# 二項分布
###### tags: `probability-theory`
## 紹介
成功回数$p$のベルヌーイ試行を、予め定めた回数$n$だけ、互いに独立に繰り返すときに、成功回数が従う確率分布が二項分布である。
## 標本空間
$$
\mathcal{X} = \left\{0, 1, 2, \ldots, n\right\}
$$
## 確率関数
$$
p\left(x\right) = {}_{n}C_{x} p^{x}\left(1-p\right)^{n-x} = \frac{n!}{x!\left(n-x\right)!} p^{x} \left(1-p\right)^{n-x}
$$
## 平均
$$
\begin{align}
E\left[X\right]
&= \sum_{x=0}^{n} x \frac{n!}{x!\left(n-x\right)!} p^{x} \left(1-p\right)^{n-x} \notag \\
&= \sum_{x=1}^{n} x \frac{n!}{x!\left(n-x\right)!} p^{x} \left(1-p\right)^{n-x} \,\,\, \mbox{$x=0$を除外しないと、次の行に進めない} \notag \\
&= \sum_{x=1}^{n} \frac{n!}{\left(x-1\right)!\left(n-x\right)!} p^{x} \left(1-p\right)^{n-x} \,\,\, \mbox{$x$を通分} \notag \\
&= \sum_{y=0}^{n-1} \frac{n!}{y!\left(n-\left(y+1\right)\right)!} p^{y+1} \left(1-p\right)^{n-\left(y+1\right)} \,\,\, \mbox{$x$を$y=x-1$に変換}\notag \\
&= \sum_{y=0}^{n-1} np \frac{\left(n-1\right)!}{y!\left(\left(n-1\right)-y\right)!} p^{y} \left(1-p\right)^{\left(n-1\right)-y} \,\,\, \mbox{$n-1$回の試行の二項分布に変形}\notag \\
&= np \sum_{y=0}^{n-1} \frac{\left(n-1\right)!}{y!\left(\left(n-1\right)-y\right)!} p^{y} \left(1-p\right)^{\left(n-1\right)-y} \,\,\, \mbox{総和が全確率}\notag \\
&= np \times 1 \notag \\
&= np
\end{align}
$$
## 分散
確率関数の分母に階乗があり、$E\left[X^2\right]$よりも、$E\left[X\left(X-1\right)\right]$の方が計算しやすいため
$$
V\left[X\right] = E\left[X^2\right] - \left\{E\left[X\right]\right\}^2
$$
ではなく、少し変形した
$$
V\left[X\right] = E\left[X\left(X-1\right)\right] + E\left[X\right] - \left\{E\left[X\right]\right\}^2
$$
を用いて計算する。
$$
\begin{align}
E\left[X\left(X-1\right)\right]
&= \sum_{x=0}^{n} x\left(x-1\right) \frac{n!}{x!\left(n-x\right)!} p^{x} \left(1-p\right)^{n-x} \notag \\
&= \sum_{x=2}^{n} x \left(x-1\right) \frac{n!}{x!\left(n-x\right)!} p^{x} \left(1-p\right)^{n-x} \,\,\, \mbox{$x=0, 1$を除外しないと次に進めない} \notag \\
&= \sum_{x=2}^{n} \frac{n!}{\left(x-2\right)!\left(n-x\right)!} p^{x} \left(1-p\right)^{n-x} \,\,\, \mbox{$x\left(x-1\right)$を通分} \notag \\
&= \sum_{y=0}^{n-2} \frac{n!}{y!\left(n-\left(y+2\right)\right)!} p^{y+2} \left(1-p\right)^{n-\left(y+2\right)} \,\,\, \mbox{$x$を$y=x-2$に変換}\notag \\
&= \sum_{y=0}^{n-2} n\left(n-1\right)p^2 \frac{\left(n-2\right)!}{y!\left(\left(n-2\right)-y\right)!} p^{y} \left(1-p\right)^{\left(n-2\right)-y} \,\,\, \mbox{$n-2$回の試行の二項分布に変形}\notag \\
&= n\left(n-1\right)p^2 \sum_{y=0}^{n-1} \frac{\left(n-1\right)!}{y!\left(\left(n-1\right)-y\right)!} p^{y} \left(1-p\right)^{\left(n-1\right)-y} \,\,\, \mbox{総和が全確率}\notag \\
&= n\left(n-1\right)p^2
\end{align}
$$
一つ前の式に代入して
$$
V\left[X\right] = n\left(n-1\right)p^2 + np - n^2p^2 = np-np^2 = np\left(1-p\right)
$$
を得る。
## モーメント母関数
$$
\begin{align}
M\left(t\right)
&= E\left[e^{tX}\right] \notag \\
&= \sum_{x=0}^n e^{tx} \frac{n!}{x!\left(n-x\right)!} p^{x} \left(1-p\right)^{n-x} \,\,\, \mbox{$e^{tx}$は$\left(e^t\right)^x$と思い出す}\notag \\
&= \sum_{x=0}^n \frac{n!}{x!\left(n-x\right)!} \left(p e^t\right)^{x} \left(1-p\right)^{n-x} \,\,\, \mbox{二項定理を思い出す} \notag \\
&= \sum_{x=0}^n {}_nC_x \left(p e^t\right)^{x} \left(1-p\right)^{n-x} \notag \\
&= \left(1-p+pe^t\right)^n
\end{align}
$$
ベルヌーイ試行のモーメント母関数を思い出すと、二項分布のモーメント母関数が、ベルヌーイ試行のモーメント母関数の$n$乗に等しいことが確認できる。
## 確率関数の形状
確率関数の形状を調べるために、差分
$$
p\left(x+1\right) - p\left(x\right)
$$
を調べる。
$$
\begin{align}
p\left(x+1\right) - p\left(x\right)
&= \frac{n!}{\left(x+1\right)!\left(n-x-1\right)!} p^{x+1} \left(1-p\right)^{n-x-1} - \frac{n!}{x!\left(n-x\right)!} p^{x} \left(1-p\right)^{n-x} \notag \\
&= \frac{n!}{x!\left(n-x-1\right)}p^x\left(1-p\right)^{n-x-1}\left\{\frac{p}{x+1}-\frac{1-p}{n-x}\right\}
\end{align}
$$
この差の符号の変化が高々1回となることは、
$$
y=\frac{p}{x+1}-\frac{1-p}{n-x}
$$
が、$y=0$と交わる点が1箇所のみであることと、その点の片側で常に符号がひとつであることを示せばいい。実際に、中括弧の中身が非負の範囲を調べると
$$
\begin{align}
\frac{p}{x+1}-\frac{1-p}{n-x}
&\geq 0 \\
\frac{1-p}{n-x} & \leq \frac{p}{x+1} \\
\left(x+1\right)\left(1-p\right) &\leq \left(n-x\right)p \\
x\left(1-p\right) + \left(1-p\right) &\leq np - xp \\
x + \left(1-p\right) &\leq np \\
x &\leq np - \left(1-p\right) \\
\end{align}
$$
となる。$y=0$との交点は$x=np - \left(1-p\right)$であり、その点より下では差は正となる。そして、この不等式の右辺が整数でなければ等号が成立せず、$x+1$が頂点となる。右辺が整数ならば等号が成立して、$x$および$x+1$が頂点となる。ただし等号が成立するのは、$p=1/2$のときのみ。
## 最頻値
確率関数が最も大きな点を最頻値という。二項分布の最頻値は
$$
x > np + p - 1
$$
を満たす最小の$x$である。ただし$p=0.5$のときのみ、
$$
x = np + p - 1
$$
と
$$
x = np + p
$$
の2点が最頻値となる。