Try   HackMD

期待値とモーメント (積率)

tags: probability-theory

確率変数の期待値

ある確率分布

Fに従う確率変数
X
の期待値

E[X]

を分布

Fの平均といい、
μ
で表す。

確率変数が

x=aからどれぐらいずれることが期待されるかを、
E[Xa]

を計算すると評価できる。例えば
X
がゴルフのあるクラブを用いてスイングした時のゴルフボールの飛距離として、
E[X180]=3.5

である場合は、飛距離と180mとの差の期待値は-3.5m、言い換えると、飛距離は平均して180mに3.5mだけ足りない、となる。

確率変数に基づくモデル化と評価

モデル1 籤

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

ある籤は、確率

pで当たり、確率
1p
で外れが出るとする。また1回の抽籤に
c
円が必要で、当たると
w
円をもらえるが、外れると何も貰えない。







A


cluster_2

抽籤の結果


cluster_3

得失差









当たり

当たり



籤->当たり


p



外れ

外れ



籤->外れ


1-p



-c + w

-c + w



当たり->-c + w





-c

-c



外れ->-c





籤の結果を表す確率変数を

Xとし、この確率変数は当たりの時に
X=1
となり、外れの時に
X=0
となる。







A


cluster_2

抽籤の結果


cluster_3

得失差


cluster_1





X

X



1

1



X->1


p



0

0



X->0


1-p



-c + w * 1

-c + w * 1



1->-c + w * 1





-c + w * 0

-c + w * 0



0->-c + w * 0





このような状況を確率変数

X を用いて表すと、籤を1回引く人の得失差は
c+wX

と表現できる。この籤の期待損失は、得失差の期待値を求めて
E[c+wX]=c+wE[X]=pwc

となる。

モデル2 計測誤差

長さを計測する機器がある。真値が

μ0のものを計測すると、平均は
μ
になるが、誤差を伴う。計測を確率変数
X
、誤差を確率変数
E
で表すと、
X=μ+E

の関係にある。

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

この誤差

Eの従う確率分布は、
μ0
の影響を受けないものと仮定する。長いものを測ろうが、短いものを測ろうが、誤差の中心は
0
で、
E
が従う確率分布は真値
μ
に依存せず共通とする。

このとき、計測値と真値の差は

E[Xμ]=E[E]=0
また計測値と真値の差の2乗は
E[(Xμ)2]=E[E2]=σ2

という期待値を持つ。

モデル3 嵌合

嵌合は私たちの身の回りにとても多い、複数のパーツをはめ合わせることである。

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

たとえばこのような持ち帰り食品の容器は、蓋の部分と器の部分は別々の製造工程で作られて、最後にはめ合わせる。もし蓋の部分の外径の内側の直径

Xの平均が
μX
、容器の部分の外径の外側の直径
Y
の平均が
μY
であったとすると、
Pr[Y<X]

は蓋が嵌まらない確率を表わし、
E[YX]

は蓋と器の間の隙間の平均値を表し、
E[(YX)2]

は隙間の大きさの二乗の期待値を表す。

点と点の間の距離

1次元ユークリッド空間(=数直線)上の2点の間の距離を考える。すぐに思いつく距離は次の3種類。

d1(x,a)=xadA(x,a)=|xa|d2(x,a)=(xa)2

d1(x,a)=xa
は符号付き距離という。これは、多めと少なめが相殺される。

どれぐらい離れているかを調べる場合には、絶対距離

da(x,a)=|xa|
もしくは二乗距離
da(x,a)=(xa)2

など、方向を持たない距離が用いられる。

xと点
a=2
との距離を、グラフに描いてみた。横軸は
x
、縦軸は
d

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

距離には符号のない距離と、符号のある距離がある。符号がないとは、向きがないことと同じである。赤色青色の向きのない距離を用いると、

x=0
x=4
は、
a=2
に対して同じ距離を持つ。緑色の向きのある距離を用いると、この2点は
a=2
を堺に、互いに逆方向にあることが分かる。

確率変数と点の間の距離

確率変数

Xは、一つの値に留まることはなく、試行の都度、移ろう。そのため確率変数と
x=a
との距離を考えるには、それらの間の距離の期待値を考えるしかない。

絶対距離の期待値

E[|Xa|]
は、場合分けと条件付けの2つを用いて計算する。
E[|Xa|]=E[Xa|X>a]Pr[X>a]+E[aX|Xa]Pr[Xa]

二乗距離の期待値

E[(Xa)2]
はそのまま計算できることが多い。このために、確率論では後者を確率変数
X
と点
x=a
の間の離れ具合の評価に用いることが多い。

他に4乗距離の期待値

E[(Xa)2]
や6乗距離の期待値
E[(Xa)2]

も、離れ具合の評価に用い得るが、これらは2乗距離に加えて必要ならば用いる程度である。

6次までの距離関数のグラフ。

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

被積分関数のグラフ。

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

赤の点線は、確率変数

Xが従う確率分布の密度関数。

ところで、例えば確率変数

Xと点
x=a
の間の2乗距離は次のように計算する。

E[(Xa)2]=E[X22X+a2]=E[X2]2aE[X]+a2

この計算で必要になるのは、

E[(Xa)2]の計算、または
E[X]
E[X2]
の計算である。この後者をモーメント、または原点モーメントという。

モーメント

確率変数のべき乗の期待値をモーメントという。確率変数そのもののべき乗、確率変数の期待値が

0になるように変換してからのべき乗、確率変数を標準化してからのべき乗、それぞれで名前が異なる。

  • 原点モーメント → 期待値の計算の基本量、確率分布の特徴の比較
  • 中心モーメント → 平均を揃えた後の確率分布の特徴の比較
  • 標準化モーメント → 平均と分散を揃えた後の確率分布の特徴の比較

原点モーメント

ある確率分布

Fに従う確率変数
X
の正の整数によるべき変換
Xk
の期待値

E[Xk]

を、確率分布

F
k
次の原点モーメントという。最もよく用いられる原点モーメントは
k=1
とした平均

μ=E[X]

である。

(

y=x,x2,x3,x4
y=f(x)
を重ね描いたグラフと、
y=xf(x),x2f(x),x3f(x),x4f(x)
を重ね描いたグラフの2枚を挿入)

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

中心モーメント

ある確率分布

Fに従う確率変数
X
の、平均
μ
からの偏差
Xμ
の正の整数によるべき変換
(Xμ)k
の期待値

E[(Xμ)k]=μ

を、確率分布

F
k
次の中心モーメントという。
k=1
のときは
0
となるため、中心モーメントは
k2
の場合のみを考える。

最もよく用いられる中心モーメントは

k=2とした分散

E[(Xμ)2]=V[X]=σ2

である。分散を

σ2と置くことが多い。

(

y=xμ,(xμ)2,(xμ)3,(xμ)4
y=f(x)
を重ね描いたグラフと、
y=(xμ)f(x),(xμ)2f(x),(xμ)3f(x),(xμ)4f(x)
を重ね描いたグラフの2枚を挿入)

標準化モーメント

ある確率分布

Fに従う確率変数
X
を、平均
μ
と標準偏差
σ
を用いた標準化
(Xμ)/σ
の正の整数によるべき変換
{(Xμ)/σ}k
の期待値

E[(Xμσ)k]

を、確率分布

F
k
次の中心モーメントという。
k=1
のときは
0
k=2
のときは
1
になるので、標準化モーメントは
k3
の場合のみを考える。

k=3の標準化モーメント

E[(Xμσ)3]=β11/2

を歪度、

k=4の標準化モーメント

E[(Xμσ)4]=β2

を尖度という。それぞれ

β11/2 および
β2
で表す。

(

y=(xμ)2/σ2,(xμ)4/σ4,(xμ)6/σ6を重ね描いたグラフを挿入)

原点モーメントと中心モーメント

確率変数の期待値

E[X]
μ
と置く。

原点モーメントを

mk=E[Xk],k=1,2,
と置く。
μ=m1
である。また中心モーメントを
μk=E[(Xμ)k],k=1,2,

と置く。
μ1=0
である。

二項定理から

(Xμ)k=j=0kkCjXj(μ)kj
であり、中心モーメントは
E[(Xμ)k]=E[j=0kkCjXj(μ)kj]=j=0kkCjE[Xj](μ)kj=j=0kkCjmj(μ)kj

のように原点モーメントで表せる。ただし
j=k1
および
j=k
の項のみ、まとめることができて
kCk1m1(μ)k1+kCk(μ)k=kμ(μ)k1μ(μ)k1=(k1)(μ)k

となる。

例えば

μ2=m2μ2
μ3=m33m2μ+2μ3

また
μ4=m44m3μ+6m223μ4

などである。

中心モーメントから原点モーメントを求めるには、中心モーメントの定義から導く関係式を、原点モーメントについて順に解いていく。

m2=μ2+μ2
m3=μ3+3(μ2+μ2)μ2μ3=μ3+3μ2μ+μ3

m4=μ4+4(μ3+3μ2μ+μ3)μ6(μ2+μ2)2+3μ4=μ4+4μ3μ+12μ2μ2+4μ46μ2212μ2μ26μ4+3μ4=μ4+4μ3μ6μ22+μ4

などである。