probability-theory
標本空間を、実数集合の部分集合とする。
いずれも、集合のすべての要素に番号付けすると、要素の個数が数えられない無限個になる、非加算集合と呼ばれる特徴を共通に持つ。
標本空間が連続集合の場合、任意の要素に対して、確率変数がその値を取る確率を与える関数を定めることができない。要素数が非可算無限個あるため、総和が必ずに発散してしまうためである。
よって任意の点を取るという事象に確率が与えられない。その代わりに、確率変数がに含まれるという事象を考える。この事象の確率を
と与えるような関数を、確率密度関数と言う。
大小が定められた標本空間の任意の要素に対して、確率変数がその値またはその値より小さい値を取る確率を与える関数を累積分布関数と言う。ここでは
と定める。
確率関数と累積分布関数の定義域は共に、標本空間上である。ただし、累積分布関数は整数の数直線上ではなく、実数の数直線上に描かれて、定義域も実数に拡張されて扱われることが少なくない。
(図を挿入)
確率関数が与えられると、確率関数から累積分布関数が求まる。
逆に累積分布関数が与えられると、累積分布関数から確率密度関数が求まる。
期待値が重心の意味を持つためには、標本空間は比例尺度または間隔尺度でなければならない。距離が定義されている順序集合でなければならない、と言い換えてもいい。
期待値という演算は、確率変数の期待値を用いる際に使える。これは確率変数以外の、より広い量の期待値の計算にも使える。
定数の期待値は
となり、自身となる。
定数およびを用いた線形変換の期待値は
となり、の期待値の倍にを加えた値となる。
このように期待値という計算は、線形性を有する。
確率変数が従う確率分布の確率関数をと置く。今、として定めた新たな確率変数の期待値を求めたい、とする。
期待値の定義に従えば、確率変数が従う確率分布の確率関数 を導いて、
を計算するのが正しい。この方針に従うと、元の確率変数が非負の値を取るなら、
であるから、
を導き、
を計算する。
しかし、という関係は確定的なので、
を計算しても良い。一つ目の計算式と二つ目の計算式が、値として同じになるのは、より明らかである。
期待値の計算を、期待値の中の量が従う確率分布の確率関数を導いてから、取り得る値と確率の積和を計算する、とは憶えるのではなく、中の量の値と変数の確との積和であり、計算が簡単な表現を得てから計算するのがよい、と憶えると良い。
以上の議論はという線形変換でも同様である。の分布を求めてから、の期待値を計算しようとはせず、の期待値を求めるのがいい。
確率変数の期待値のこと。しばしばと記す。
計算は上の通り。
確率変数の期待値からの偏差の2乗(平方)の期待値のこと。
平均からの2乗距離の期待値であり、確率変数が平均してどれぐらい自身の期待値かを離れているかを表す。単位は距離の2乗である。
計算は何通りかある。
を求めるのは平均と同じ。しかし分散の計算には、これをと置いて、次に
を計算するか、
と展開してから
を計算するか、または
と展開してから
を計算するか、の3通りがある。