probability-theory
標本空間が集合で与えられていて、その加法族もと与えられているとき、
事象が起こる確率は、上で定義された集合関数を用いてと求まる。
確率の一般論はこのように構築される。このためととの三つ組を、確率空間と呼ぶ。
ところで、標本空間の要素の間に順序が定まっているとする。標本空間が加算集合の場合は、次のようにユークリッド空間に埋め込むことができる。
このとき、標本空間のすべての要素に順序が定まるので、その順序の番号を要素に付すことで、標本空間をユークリッド空間に埋め込むことができる。
これは小さい順に並べた場合である。大きい順に並べると
となる。
こうして得た標本空間を、元の標本空間の(1次元)ユークリッド空間への埋め込みと呼ぶ。
埋め込みの作成方法は他にもある。
例えばコインを1枚投げると、その結果は表と裏のいずれかが上になって観測される、という確率的な試行を考える。この試行の標本空間は
だが、この試行によって表が出る回数、という数え方を用いると
のように事象の表現を回数にできる。これを略記して
というユークリッド空間への埋め込みを得る。
ユークリッド空間に埋め込まれた標本空間は、正の整数集合と同一視できる。ここで、ある一つの整数が生じる確率
を関数で表す。ならばなので、要素に確率を与える関数
を定めると、コルモゴロフの公理から、すべての事象に確率を与えることができる。このような関数を確率関数という。確率関数を用いると、たとえば以下の値を取る確率は
と求まる。
確率関数は確率分布のひとつの関数表現である。
これ以降は、実現していない試行を等の大文字のアルファベットで表す。事象が起こる確率を、試行がに含まれる確率という意味で
と記す。試行は結果が定まっていないものなので、確率変数と呼んで、解析学で現れるような他の変数と区別する。
試行の結果を等の小文字のアルファベットで表す。ある試行を実施した結果がである場合を
と記す。また関数の引数も等の小文字のアルファベットで表すが、試行の結果とは特に区別しない。
事象や集合は、等、大文字のアルファベットの先頭の方の文字で表して区別する。
以上の確率変数や試行の結果を表す変数、その他の変数、また事象や集合には、添字を加えることもある。
実数全体の集合は稠密である。任意の2つの実数の間には、必ず他の実数が存在する。
この稠密性のため、実数は数え上げることができず、上のような順位づけができない。
そのため、個々の実数に確率を付与すると、その総和が発散してしまう。
加算無限個の点に正の値を付与すると、総和が有限になる場合もあるが、
非加算無限個の点に正の値を付与すると、それらの総和は必ず有限の値にはならない。つまり確率を点に付与すると、コルモゴロフの公理と矛盾してしまう。
この場合には、
を満たす関数と、半開区間を用いて確率を表現すると、標本空間と加法族と集合関数がコルモゴロフの公理を満たすように定義できる。
このような関数を、確率密度関数という。確率密度関数も確率分布のひとつの関数表現である。
互いに素な区間として、が最も簡単である。との間にある任意の を用いて となる。
しかし確率分布が確率密度関数を持つ場合の加法族は、1点からなる事象は無視しても良い。なぜなら
が成り立つ。端点を含まないように区間を定めても、その区間上の定積分は端点を含む区間と変わらない。例えば定積分を上で定めても、関数の連続性から
が成り立ち、の上の定積分と変わらない。
よって、確率を定めるために限っては
として扱っても良い。なぜなら
となる。ただ、これは数学としては
と記さないと混乱する。
そのため、加法族をから構成するのが、確率の計算と相性がいい。
標本空間の点の間に、順序が定まり、さらに任意の二点の差や比に意味がある場合に、次のような計算を定める。
標本空間が正の整数の場合、確率関数による全ての点の重み付き和
を、確率関数で表された確率分布の平均という。
標本空間が実数空間の場合、確率密度関数による全ての点の重み付き和
を同様に、確率密度関数で表された確率分布の平均という。
いずれの場合も、確率分布による標本空間の重み付き平均であり、これらの計算を
と記す。これを確率変数の期待値という。
サイコロは6つの面それぞれに数字が彫られている。サイコロを投げると、いずれか一つの面が上になる。その面に彫られた数字が、サイコロの出目である。サイコロ投げは、6つの場合をランダムに選択するために用いられるが、出る目を数字として扱うことも少なくない。
サイコロを投げる試行において、1から6までの目それぞれが出る確率が表1で与えられている。
表1 サイコロ
事象 | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
確率 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 |
このとき、サイコロを投げる試行を繰り返すと、それらの値の平均は
の周りに近づいていく。この値は、標本空間の重心であり、試行の期待値、確率変数の期待値、あるいは確率分布の平均などと呼ばれる。
計測誤差がある確率分布に従っているとする。計測値は連続値であり、その確率分布は確率密度関数で表される。
このとき計測を表す確率変数の確率分布は、確率密度関数が定められる。そして
は標本空間の重心であり、確率変数の期待値、あるいは確率分布の平均などと呼ばれる。計測値の確率分布の平均が、真値と異なるとき、その計測には偏りがあるという。