# 多項分布
###### tags: `probability-theory`
3種類以上の互いに素な事象が、それぞれの事象ごとに定められた確率によって生じる場合の、確率モデル。ベルヌーイ試行の互いに独立な$n$回の繰り返しの中の、片方の事象の発生回数が二項分布に従うのと同様に、多項試行の互いに独立な$n$回の繰り返しの中の、それぞれの発生回数の組が従う確率分布である。
## 多項試行
ベルヌーイ試行が2種類の互いに素な事象の観測モデルであったのに対して、多項試行は3種類以上の互いに素な事象の観測モデルである。
$$
X \sim p\left(x\right) = p^x\left(1-p\right)^{1-x}
$$
ベルヌーイ試行を次のように表現する。
$$
\left(X_1, X_2\right) \sim p\left(x\right) = {p_1}^{x_1}{p_2}^{x_2}
$$
ただし確率はそれぞれ非負で和が$1$
$$
p_1+p_2=1, p_1, p_2\geq 0
$$
また確率変数はいずれか一つが$1$、もう一方が$0$
$$
X_1+X_2=1, X_1, X_2 \in \left\{0, 1\right\}
$$
である。これを$m$状態に拡張すると
$$
\left(X_1, X_2, \ldots, X_m\right) \sim p\left(x_1, x_2, \ldots, x_m\right) = {p_1}^{x_1}{p_2}^{x_2}\cdots{p_m}^{x_m}
$$
となる。ただし確率は総和が$1$
$$
\sum_{j=1}^{m} p_j = 1, p_1, \ldots, p_m \geq 0
$$
であり、確率変数もいずれか一つが$1$、残りはすべて$0$
$$
\sum_{j=1}^{m} X_j = 1, X_1, \ldots, X_m \in \left\{0, 1\right\}
$$
である。
## 確率ベクトル
$$
\left(X_1, X_2, \ldots, X_m\right) \sim Multinomial\left(p_1, p_2, \ldots, p_m; n\right)
$$
## 確率関数
$$
p\left(x_1, x_2, \ldots, x_m\right) =
\left(\begin{array}{ccccc}
& & n & & \\
x_1 & x_2 & \cdots & x_{m-1} & x_m \\
\end{array}\right)
{p_1}^{x_1}{p_2}^{x_2}\cdots{p_{m-1}}^{x_{m-1}}{p_m}^{x_m}
$$
## 多項係数
$$
\begin{align}
\left(\begin{array}{ccccc}
& & n & & \\
x_1 & x_2 & \cdots & x_{m-1} & x_m \\
\end{array}\right)
& = {}_n C_{x_1}\times{}_{n-x_1}C_{x_2}\times\cdots\times{}_{n-\sum_{j=1}^{m-2}x_j}C_{x_{m-1}}\times{}_{n-\sum_{j=1}^{m-1}x_j}C_{x_{m}} \notag \\
& = \frac{n!}{x_1!x_2!\cdots x_m!} \notag
\end{align}
$$
## 平均ベクトル
$$
E\left[\left(X_1, X_2, \ldots, X_m\right)\right] = \left(np_1, np_2, \ldots, np_m\right)
$$
## 分散共分散行列
$$
V\left[\left(X_1, X_2, \ldots, X_m\right)\right] =
\left(
\begin{array}{cccc}
np_1\left(1-p_1\right) & -np_1p_2 & \cdots & -np_1p_m \\
-np_2p_1 & np_2\left(1-p_2\right) & \cdots & -np_2p_m \\
\vdots & \vdots & \ddots & \vdots \\
-np_mp_1 & -np_mp_2 & \cdots & np_m\left(1-p_m\right)
\end{array}
\right)
$$