# 二項分布 ###### tags: `probability-theory` ## 紹介 成功回数$p$のベルヌーイ試行を、予め定めた回数$n$だけ、互いに独立に繰り返すときに、成功回数が従う確率分布が二項分布である。 ## 標本空間 $$ \mathcal{X} = \left\{0, 1, 2, \ldots, n\right\} $$ ## 確率関数 $$ p\left(x\right) = {}_{n}C_{x} p^{x}\left(1-p\right)^{n-x} = \frac{n!}{x!\left(n-x\right)!} p^{x} \left(1-p\right)^{n-x} $$ ## 平均 $$ \begin{align} E\left[X\right] &= \sum_{x=0}^{n} x \frac{n!}{x!\left(n-x\right)!} p^{x} \left(1-p\right)^{n-x} \notag \\ &= \sum_{x=1}^{n} x \frac{n!}{x!\left(n-x\right)!} p^{x} \left(1-p\right)^{n-x} \,\,\, \mbox{$x=0$を除外しないと、次の行に進めない} \notag \\ &= \sum_{x=1}^{n} \frac{n!}{\left(x-1\right)!\left(n-x\right)!} p^{x} \left(1-p\right)^{n-x} \,\,\, \mbox{$x$を通分} \notag \\ &= \sum_{y=0}^{n-1} \frac{n!}{y!\left(n-\left(y+1\right)\right)!} p^{y+1} \left(1-p\right)^{n-\left(y+1\right)} \,\,\, \mbox{$x$を$y=x-1$に変換}\notag \\ &= \sum_{y=0}^{n-1} np \frac{\left(n-1\right)!}{y!\left(\left(n-1\right)-y\right)!} p^{y} \left(1-p\right)^{\left(n-1\right)-y} \,\,\, \mbox{$n-1$回の試行の二項分布に変形}\notag \\ &= np \sum_{y=0}^{n-1} \frac{\left(n-1\right)!}{y!\left(\left(n-1\right)-y\right)!} p^{y} \left(1-p\right)^{\left(n-1\right)-y} \,\,\, \mbox{総和が全確率}\notag \\ &= np \times 1 \notag \\ &= np \end{align} $$ ## 分散 確率関数の分母に階乗があり、$E\left[X^2\right]$よりも、$E\left[X\left(X-1\right)\right]$の方が計算しやすいため $$ V\left[X\right] = E\left[X^2\right] - \left\{E\left[X\right]\right\}^2 $$ ではなく、少し変形した $$ V\left[X\right] = E\left[X\left(X-1\right)\right] + E\left[X\right] - \left\{E\left[X\right]\right\}^2 $$ を用いて計算する。 $$ \begin{align} E\left[X\left(X-1\right)\right] &= \sum_{x=0}^{n} x\left(x-1\right) \frac{n!}{x!\left(n-x\right)!} p^{x} \left(1-p\right)^{n-x} \notag \\ &= \sum_{x=2}^{n} x \left(x-1\right) \frac{n!}{x!\left(n-x\right)!} p^{x} \left(1-p\right)^{n-x} \,\,\, \mbox{$x=0, 1$を除外しないと次に進めない} \notag \\ &= \sum_{x=2}^{n} \frac{n!}{\left(x-2\right)!\left(n-x\right)!} p^{x} \left(1-p\right)^{n-x} \,\,\, \mbox{$x\left(x-1\right)$を通分} \notag \\ &= \sum_{y=0}^{n-2} \frac{n!}{y!\left(n-\left(y+2\right)\right)!} p^{y+2} \left(1-p\right)^{n-\left(y+2\right)} \,\,\, \mbox{$x$を$y=x-2$に変換}\notag \\ &= \sum_{y=0}^{n-2} n\left(n-1\right)p^2 \frac{\left(n-2\right)!}{y!\left(\left(n-2\right)-y\right)!} p^{y} \left(1-p\right)^{\left(n-2\right)-y} \,\,\, \mbox{$n-2$回の試行の二項分布に変形}\notag \\ &= n\left(n-1\right)p^2 \sum_{y=0}^{n-1} \frac{\left(n-1\right)!}{y!\left(\left(n-1\right)-y\right)!} p^{y} \left(1-p\right)^{\left(n-1\right)-y} \,\,\, \mbox{総和が全確率}\notag \\ &= n\left(n-1\right)p^2 \end{align} $$ 一つ前の式に代入して $$ V\left[X\right] = n\left(n-1\right)p^2 + np - n^2p^2 = np-np^2 = np\left(1-p\right) $$ を得る。 ## モーメント母関数 $$ \begin{align} M\left(t\right) &= E\left[e^{tX}\right] \notag \\ &= \sum_{x=0}^n e^{tx} \frac{n!}{x!\left(n-x\right)!} p^{x} \left(1-p\right)^{n-x} \,\,\, \mbox{$e^{tx}$は$\left(e^t\right)^x$と思い出す}\notag \\ &= \sum_{x=0}^n \frac{n!}{x!\left(n-x\right)!} \left(p e^t\right)^{x} \left(1-p\right)^{n-x} \,\,\, \mbox{二項定理を思い出す} \notag \\ &= \sum_{x=0}^n {}_nC_x \left(p e^t\right)^{x} \left(1-p\right)^{n-x} \notag \\ &= \left(1-p+pe^t\right)^n \end{align} $$ ベルヌーイ試行のモーメント母関数を思い出すと、二項分布のモーメント母関数が、ベルヌーイ試行のモーメント母関数の$n$乗に等しいことが確認できる。 ## 確率関数の形状 確率関数の形状を調べるために、差分 $$ p\left(x+1\right) - p\left(x\right) $$ を調べる。 $$ \begin{align} p\left(x+1\right) - p\left(x\right) &= \frac{n!}{\left(x+1\right)!\left(n-x-1\right)!} p^{x+1} \left(1-p\right)^{n-x-1} - \frac{n!}{x!\left(n-x\right)!} p^{x} \left(1-p\right)^{n-x} \notag \\ &= \frac{n!}{x!\left(n-x-1\right)}p^x\left(1-p\right)^{n-x-1}\left\{\frac{p}{x+1}-\frac{1-p}{n-x}\right\} \end{align} $$ この差の符号の変化が高々1回となることは、 $$ y=\frac{p}{x+1}-\frac{1-p}{n-x} $$ が、$y=0$と交わる点が1箇所のみであることと、その点の片側で常に符号がひとつであることを示せばいい。実際に、中括弧の中身が非負の範囲を調べると $$ \begin{align} \frac{p}{x+1}-\frac{1-p}{n-x} &\geq 0 \\ \frac{1-p}{n-x} & \leq \frac{p}{x+1} \\ \left(x+1\right)\left(1-p\right) &\leq \left(n-x\right)p \\ x\left(1-p\right) + \left(1-p\right) &\leq np - xp \\ x + \left(1-p\right) &\leq np \\ x &\leq np - \left(1-p\right) \\ \end{align} $$ となる。$y=0$との交点は$x=np - \left(1-p\right)$であり、その点より下では差は正となる。そして、この不等式の右辺が整数でなければ等号が成立せず、$x+1$が頂点となる。右辺が整数ならば等号が成立して、$x$および$x+1$が頂点となる。ただし等号が成立するのは、$p=1/2$のときのみ。 ## 最頻値 確率関数が最も大きな点を最頻値という。二項分布の最頻値は $$ x > np + p - 1 $$ を満たす最小の$x$である。ただし$p=0.5$のときのみ、 $$ x = np + p - 1 $$ と $$ x = np + p $$ の2点が最頻値となる。