probability-theory
これらのように、結果が2種類あり、それらが互いに二律背反であるような試行をベルヌーイ試行という。ベルヌーイ試行は、試行回数が1回のことが多い。
結果が現れる前の試行を、大文字の変数で表す。これを確率変数と呼ぶ。結果を表す変数は小文字の変数で表す。これらはただの変数と呼ぶ。
2種類の結果をそのまま文字で表さず、試行の結果を片方が現れた回数で表す。
例えばコインを投げて表か裏が出る試行の結果を、「表」や「裏」といった文字ではなく、表が出た回数で表す。
ある結果が起こる確率確率を求める際には、実際には思考が行われていないと考えて、大文字の変数を用いる。
は、確率を求める関数です。引数は事象である。
これらは全て、コインを投げて表が出る確率を表します。事象の書き方は様々ある。事象は標本空間の部分集合なので、のように中括弧で囲むことに違和感がない。でも、事象の記述をそのまま記すことも多いです。他にもバリエーションがありますが、とても網羅しにくく、キリがないので他は省略します。各自、類推で判断してほしい。
また確率を求める関数もやなど様々な括弧が用いられる。この関数をで表す書籍もある。この場合にも、やもある。
試行の結果が得られていたら、その確率はである。だから、既に表が出ていたら、その確率はになる。
もし、裏が出ていたら、表が出る確率はである。
尚、大文字と小文字で引っ掛けるような問いを、試験に出すことはない。試験問題で試行実施前の変数を小文字で表していたら、その人は大文字と小文字を区別しない、と考えてほしい。
確率変数が標本空間上の確率分布に従う、という形式でのベルヌーイ試行の説明を試みる。
ベルヌーイ試行の標本空間は
である。確率分布は、次の4つの場合(事象)の確率を定める。
このようにすべての事象の確率を列挙するのは、確率を論じる上で効率がよくない。確率の公理を理解し、確率の加法法則と乗法法則が活用できるなら、ベルヌーイ試行の確率分布の表現は、次の関数に集約できる。
このことを、次に説明する。
標本空間が実数全体の集合の部分集合のときに、確率変数が標本空間の各点を取る確率 を、関数で表す。
確率変数を明示したい時には
と書き、確率分布を明示したい時には
と書く。
の場合のベルヌーイ分布の確率関数は次のグラフで表した通り、の2点のみに値を持つ。
確率関数の定義域は標本空間である。そもそも、では確率が定義されていない。しかし便宜上はがの中の値でなければ、確率はとする。
ベルヌーイ試行を論じる際には、二律背反な試行の片方を成功、もう一方を失敗とする。そして成功する確率を、失敗する確率をと置く。
まずコルモノロフの公理から、
でなければならない。そのため、成功する確率だけで、ベルヌーイ試行のすべての事象の確率が表せる。
ベルヌーイ試行の確率関数は、
である。場合分けを用いて
と記しても良いが、定義域がなので、上のような関数表現が使える。
と変えて、ベルヌーイ分布の確率関数を重ねて描いたグラフを掲げておく。
ベルヌーイ試行を表現する確率分布をベルヌーイ分布と言う。ベルヌーイ分布の確率関数は
また累積分布関数は
と表せる。
以下、ベルヌーイ分布の平均、分散、標準偏差を順に計算していく。そしてモーメントについて論じた後に、歪度、尖度も計算する。
確率変数の期待値を、確率変数が従う分布の平均と呼ぶことを思い出して欲しい。ベルヌーイ試行の確率変数の期待値は、ベルヌーイ分布の平均である。
これを求める計算はそれほど複雑ではない。期待値を式に表す勇気さえ持てば、そのすぐ先に計算の結果がある。
一行目が理解できなければ、がとのいずれかしか取らないので、それぞれの値にそれらを取る確率を掛けて足すと、の期待値が得られると理解すると良い。これが期待値の定義である。
確率変数の分散は、確率変数の自身の期待値からの偏差
の2乗の期待値
である。確率変数が自身の期待値から、平均して、2乗距離でどれぐらい離れているかを、分散は表す。期待値という計算が
であることを思い出すと、分散は
と書き換えることができる。
ただ、の期待値、の平均はすでに計算してあるので、
となる。これは
と計算を進めて、ベルヌーイ分布の分散 を得る。
分散の単位は、確率変数や確率変数の期待値とは異なる。なにしろ2乗されているのだから、が正方形の一辺の長さを表すならは面積であり、が移動速度を表すならは運動エネルギーに比例する量となる。
通常は、分散の単位に別の単位を用いず、確率変数の単位の2乗の単位を用いる。そこで混乱が生じる。例えば分散がとは一体、どれほど大きいのだろうか。あるいは小さいのだろうか。
後に統計学では確率論で設定する平均や分散を推定する考え方を学ぶ。その中の、信頼区間という考え方では、分散の平方根に比例する幅を用いて、平均の推定精度を評価する。
その類推で、分布のばらつきを表すのに、分散の代わりに分散の平方根を用いる。
確率分布の確率を関数表現することで、確率分布の特徴を関数の特徴で表すことができる。モーメントには2種類ある。
平均や分散など、確率分布の特徴量としてのモーメントは中心モーメントと呼ばれる。平均が
分散が
であり、この類推から次の中心モーメントは次のように定まる。
ここでは正の整数である。小数は取らない。
確率論を用いた解析を行う際には、中心モーメントは使いにくい。平均は
だが、分散が
と表せることを思い出すと、確率変数のべき乗の期待値
にも名前を付けたくなる。これが原点モーメントと呼ばれる、もう一つのモーメントである。
中心モーメントと原点モーメントの間には、多項式関係がある。
これらはすべて、期待値で表現すると、導出できる。では
この関係をに関して整理すると
を得る。の場合も同様に
と、これを整理して
を得る。
確率分布の歪度の定義は、それに従う確率変数を標準化した後の3次のモーメントである。
これは、期待値の計算の整理を進めると、
となる。
ベルヌーイ分布の3次の中心モーメントは
であり、分散がであることと合わせて、ベルヌーイ分布の歪度が
と得られる。
歪度がならば、確率分布は期待値を軸として左右対称の確率関数を持つ。
ベルヌーイ分布では、方程式
を解くと、の場合に対称となることが分かる。
確率分布の歪度の定義は、それに従う確率変数を標準化した後の4次のモーメントである。
これは、期待値の計算の整理を進めると、
となる。
ベルヌーイ分布の3次の中心モーメントは
であり、分散がであることと合わせて、ベルヌーイ分布の尖度が
と得られる。
平均、分散、歪度、尖度をそれぞれ次のように導いた。
平均は分布の中心、分散は分布の散らばり、歪度は分布の対称性、尖度は分布の裾の重さを表す。すべてがベルヌーイ試行の成功確率に依存して変化する。
グラフを描いてみると、ベルヌー分布はによって形状が変わることが見て取れる。
モーメント母関数の定義は次の通りである。
確率変数に変数を掛け、指数変換した上で期待値を求める。これはラプラス変換と深い関係がある。
ここまで表現を変えると、関数をラプラス変換してを得ていることに相当することが分かる。ただし、ラプラス変換との関係を論じても、逆変換は整備されていないので、ラプラス変換に不慣れでも気にすることはない。
この関数がモーメント母関数と呼ばれるのは、
という関係を持つためである。この関係は
の両辺の期待値を求めると、導かれる。
ベルヌーイ分布のモーメント母関数は
と簡単に計算できる。このモーメント母関数から平均を求める。
2次のモーメントを求めると
となり、分散は
と求まる。