probability-theory
自国の通貨とある他国の通貨の間の為替レートが明日、今日よりも高めに動くか、低めに動くか、を考える。高低の基準は自国の通貨で、実際の高低は他国の通貨に発生するものとする。例えば円安ドル高は、単にドル高という。連続する2日間で為替レートが、小数点以下の小さな桁まで同じとなることはないので、高低の2つの場合のみを考えれば良い。そして
こういう行動の検討のために、確率を評価したい。本来は今日よりもいくら以上高めに動くなら、今日よりもいくら以下低めに動くなら、と検討すべきだが、そこは単純化している。
以下では、これを例に、確率の様々な表現を紹介する。
明日の為替レートが今日よりも高くなる確率が0.60、変わらない確率が0.05、低くなる確率は0.35と分かっているとする。これを
と
そして
と記す。記号は、確率を調べたい対象の記述を引き数に持ち、記述の確率を返す関数である。
対象の記述の表現方法は様々ある。上のように文で表現する以外に、範囲で表現したり、数式で表現することもある。今日の為替レートを、明日の為替レートをと置くと、上の確率は次のようにも表せる。
残りの確率も同様に
および
と表せる。
確率を調べたい対象を事象と呼び、事象を集合で表す。上の表現のうち、
が集合である。これらの集合はすべて、実数空間の部分集合でもある。
実際に起こることは、今日の為替レートと明日の為替レートの組であり、二次元平面上の点である。だが、調べたいのはその一組の数字の間の大小関係である。平面を直線を境に3つの領域
に分けて、どちらがどれぐらいの確率で生じるかを調べたい。これらを集合で表せば、
となる。こう記した事象とについて、確率を調べたい。
同じ事象をとの組ではなく、との差で表現すると、
のように、他の表現にも至る。
このように確率を調べたい事象は、集合で表現できる。またコルモゴロフの公理自体が、事象が集合であり、相異なる複数の事象の間の和集合や差集合、積集合の計算を前提に記述されているので、事象は集合で表現できなければならない。
事象が起こる確率を、事象を表現する集合を与えると確率を返す関数 を用いて表す。
は集合を引き数に取って確率を返す関数なので、集合関数と呼ばれることがある。何がその集合に含まれるか、を明記するとき、変数と二項演算子を用いて
と記す。
誤解を与えない限り、最初の文による事象の表現の略記として、上の確率の表現を
と記しても構わない。
また教科書によっては、
と記すこともある。しかし二項演算子を含む式ならば、事象の表現として
のようにを用いて、集合関数と区別したい。
私にはこれぐらいの拘りしかない。
確率を調べたいすべての事象を含む集合を標本空間という。, , など、アルファベットの後ろの方の大文字をスクリプト体にして、標本空間を表すことが多い。も用いられる。
上の例の場合には、起こり得る事象は
の3つのいずれかである。では標本空間を
と定めればいいかというと、それは誤りである。確率の公理を思い出して欲しい。事象の和集合の確率も、確率の公理から求まるので、複数の事象同士の和集合(和事象)も標本空間に含まれなければならない。それらを列挙すると
である。これらも標本空間に含まれなければならない。また、この集合の補集合としての空集合
も、標本空間に含まれなければならない。
以上から、この標本空間は
と定める。
標本空間には、確率がの事象が以外にも含まれていても構わない。しかし確率がの事象は、和集合の確率もなので、複雑に記述してもあまり甲斐がない。そのため特に記さない限り、標本空間に記述する確率がの事象はのみとする。
また、起こり得るすべての事象を含む集合を標本空間という、と宣言することも少なくない。この定義でも構わないが、全事象と空事象の確率を評価したくなるのが、事象の加法性の導入の後なので、ここでは確率を調べたいすべての事象を含む集合として定義する。
少し惑わせるかもしれないが、標本空間は
と定義してもよい。標本空間をこのように定めたとき、確率を評価する興味のある部分集合は、当初は
の3つであった。これら3つは、2次元ユークリッド空間の部分集合で、互いに素である。
上の3つの事象それぞれを、, , と名付ける。これらの事象同士の和集合
も事象として標本空間に含まれる。またこれらの和集合の補集合
も、標本空間に含まれる。ここまでに現れた事象の、事象どうしの和集合、そして事象のすべての和集合の補集合はすべて尽くされている。こうして事象同士が互いに、加法性で表せる関係を持つような集合が完成する。
これを事象の加法族といい、で表す。
確率の公理に現れる事象は、標本空間の部分集合であり、また必ず事象の加法族の要素でなければならない。そうでなければ、その事象が関わる確率は、確率の公理を満たさず、確率と呼べない数字となる。
確率現象を観測することを試行という。試行をアルファベットの後ろの方の大文字, , , , , などで表す。また試行は確率変数とも呼ばれる。
上の例では、今日の為替レートと明日の為替レートが確率変数である。
試行を行なった結果、観測された値を実現値という。実現値に用いる変数は、同じアルファベットの小文字で表す。, , , , , などである。
確率変数が従う確率法則のことを、確率分布という。確率分布にはアルファベットの大文字の、、などが用いられる。
もし今日の為替レートは観測済みで、明日の為替レートのみがこれから観測されるなら、これまでに記した式はすべて、次のように書き換えていく必要がある。
標本空間が有限集合または可算集合の場合、確率変数が標本空間の任意の点を取る確率を返す関数を定めることができる。
これを確率関数という。実際には、確率を返す関数を定義して嬉しいのは、標本空間が整数集合など、要素同士の差や比が意味を持つ集合である。
為替レートの差の分布が、がとり得る0.01円刻みの値で定義された関数で表現されているとする。このとき翌日の為替レートの平均は
のように、取り得る値とその値を取る確率の重み付き和で求められる。これはから、重み付き平均ともいう。
標本空間が連続集合の場合、標本空間の点の数は非可算であり、各点に対してその値を取る確率を定めることはできない。数え上げられない無限個の点に正の値を付与すると、必ず総和は無限大に発散する。そこで確率の表現を点に確率を与える関数ではなく、部分集合に対する確率を表現する関数を用いる。
確率変数が標本空間の任意の範囲を取る確率を定積分
で定める関数が存在するとき、これを確率密度関数という。確率密度関数を定義して嬉しいのは、標本空間上で積分が定義できる場合である。
為替レートの差の分布が、がとり得る連続の値の上で定義された関数で表現されているとする。このとき翌日の為替レートの平均は
のように、取り得る値とその値を取る確率の重み付きの定積分で求められる。これはから、重み付き平均ともいう。
標本空間が順序集合の場合、任意の点に対して、およびそれ以下の値を取る確率を定めることができる。
これを累積分布関数という。累積分布関数は、ユークリッド空間上のすべての確率分布に定義できるためか、また確率分布を表すに引数をつけて関数とするためか、単に分布関数ということも多い。
もしが標本空間の上で連続かつ微分可能なとき、を微分すると、確率密度関数を得る。
もしが可算個の点でのみ不連続であり、すべての隣接する2つの不連続点の間で傾きがのとき、の差分から、確率関数を得る。
各不連続点において、右極限と左極限の差が、その点を取る確率に等しい。
為替レートの差の分布が、がとり得る0.01円刻みの値で定義された関数で表現されているとする。このとき翌日の為替レートの中央値は
を解いた値で求めることができる。
為替レートの差の分布が、がとり得る連続の値の上で定義された関数で表現されているとする。このときも、翌日の為替レートの中央値は
を解いた値で求めることができる。
確率分布のすべての原点モーメント
が発散せずに有限の値を取るとする。もし
がの周りで有限の値を取るなら、
はの周りで、に収束する。この関数をモーメント母関数という。この名称は、この関数を回微分してと置くと、次の原点モーメントを得ることによる。
確率分布に対して
を特性関数という。
確率分布の次の原点モーメント
が発散せずに有限の値を取るとする。このとき、特性関数は階微分可能で、回微分してを掛けてと置くと、次の原点モーメントを得る。
モーメント母関数はすべての確率分布に対して存在するとは限らないが、特性関数はすべての確率分布に対して存在する。
特性関数が与えられたとき、それが積分可能なら、累積分布関数は絶対連続であり、確率密度関数が
で与えられる。
確率関数、確率密度関数および累積分布関数は、確率をユークリッド空間の上の関数として扱うことを可能にする。またこのように関数で表された確率分布には、分布の中心やばらつきの大きさなど、分布の特徴を定量的に表現できるようになる。
当初は集合と部分集合から始まり、加法族によってコルモゴロフの公理に基づいて部分集合に確率を定める方法を整備した。そこまでは集合と位相、あるいは離散数学に近かった。それが関数による表現が整備されて、微積分学、あるいは解析学に近くなってきた。確率論はこの成り立ちから、少し広い範囲の数学を横断的に援用する理論となっている。