# 統計勉強会:平均値の比較 最近パフォーマンステストを走らせているのだが、よく分からずにとりあえずTTEST()とかFTEST()を叩いて計算しているので、ちゃんと確認しておく。 ※当方基礎統計未履修です ## 仮説検定 仮説検定は「帰無仮説を棄却し対立仮説を支持するか、又は帰無仮説を棄却しないかを観測値に基づいて決めるための統計的手続き」。 まず仮説を設定するところから始める。 帰無仮説:棄却したい仮説 対立仮説:成り立つか知りたい仮説 例えばAグループの平均はBグループの平均より有意に高いことを示したい場合 帰無仮説:Aの平均とBの平均に差はない 対立仮説:Aの平均とBの平均は有意に違う となる。 棄却できた場合、帰無仮説は正しくない(確率が統計的に高い)ことがわかり対立仮説を採用できる。 一方棄却できない場合は帰無仮説が成り立つというわけではなく、ただ対立仮説の正しさが証明できなかったというだけ。 ここからは統計量を決めてそれに基づいた解析を行う。 流れは、統計量の確率分布を仮定し、その中から帰無仮説を否定できる極端な結果になる範囲を選び、標本から算出した統計量がその範囲にあるかどうかを判定する。 帰無仮説を否定できる極端な範囲のことを「危険域」あるいは「棄却域」と呼ぶ。 棄却の検定には大きく分けて2つ。 両側検定:分布関数の裾の両側を使う。等しいことを仮説に据えてる場合に使いたいやつ。「検定統計量が1次元であり、棄却域がある有限区間の両側となる検定」 片側検定:分布関数の裾の片側だけを使う。どちらかのほうが大きい、といった主張を据えている場合に使いたいやつ。「検定統計量が1次元であり、棄却域がある棄却限界値より小さい領域(又は大きい領域)となる検定」 最後に判定を行うが、ここではあくまで確率で求まることをいうだけ。 極端な値になる確率を求め、これをp値と呼ぶ。 p値がα以下ならα*100なら棄却するというように最初にαを決めておく。この値は0.05が多いらしい。 αが0.05の場合、棄却するか5%以下でしか発生しない事象が起こったということになる。 これを「α水準で統計学的に有意である」という。 ## t検定 for 平均 上記の検定で、分布をt分布と仮定したもの。 t検定の使用例の大乗に平均の比較がある。 2つの母集団がいずれも正規分布に従うと仮定した上での平均が等しいかどうかの検定 今回はこれを確認する。 平均の比較には3種類ある。 - 標本が対になっているケース(各メンバーの1回目・2回目計測の比較など) - 独立な標本2つが分散が等しいと仮定できるケース - 独立で分散もばらばらの標本のケース 分散が等しいことは等分散性という。等分散性が家庭で着るときはスチューデントのt検定、等分散性が仮定できない場合はウェルチのt検定を使う。 数式を追うつもりだったが夜も遅いのでまた今度… ## SpreadSheetの場合 まず2つの標本に対しf検定を行う。f検定は等分散を検定するやつ。 FTEST(A, B)の関数を使いP値を出して有意水準と比較する。 - 等分散性が仮定できるなら TTEST(A, B, 2, 2) - 等分散性が仮定できないなら TTEST(A, B, 2, 3) 3つ目の引数は片側・両側検定を指定しており、1は片側で2は両側。 4つ目の引数は上記で示した3種類の比較方法にそれぞれ合致しており、1は対になっているやつで2は独立だが等分散なやつで3は独立だし等分散性がないやつ。