# 量的調査法:これまでのまとめ # 目次 - ### 相関分析 - ### χ^2^分析 - ### 重回帰分析 # 相関分析 相関係数とは==連続変数==(量的データ)同士の関係の強さの尺度である。 相関係数(r)は==目的変数==(y)と==説明変数==(x)の間の線型関係(y=b0+b1x という直線関係)の強さを表す尺度で,-1 から 1 の間の値をとる。 ### 連続変数  身長や体重のように,精度の高い測定法によればいくらでも正確な値が得られるデータ。 ###### 実際は離散量であるが連続量として取り扱ってもかまわないようなものもある<br>(例えば,試験の点数など) ### 説明変数と目的変数 説明変数は「何かの原因となっている変数」のことで、目的変数は「その原因を受けて発生した結果となっている変数」のことです。 説明変数と目的変数には下記のようないくつかの表現があります。 説明変数 explanatory variable 予測変数 predictor variable 独立変数 independent variable 目的変数、応答変数、反応変数 response variable 結果変数 outcome variable 従属変数 dependent variable 基準変数 criterion variable # χ^2^分析 離散変数(質的データ)同士の関係を調べるための尺度である。χ2 検定の前提を満たす条件としては期待度数が 5 未満の割合は「20%以下」であること。 # 重回帰分析 説明変数(独立変数)と被説明変数(従属変数)の両方とも連続変数である場合に適用。なお,例外として,説明変数が性別などのような離散変数(質的データ)の場合,男性を「1」,女性を「2」とするダミー変数を用いる場合もある。 | | 離散 | 連続 | | -------- | -------- | -------- | | 離散 | 分割表 | 一元配置分散分析 | | 連続|ロジスティック回帰|相関分析/重回帰分析| # 統計処理 調査結果の統計処理では判断の根拠を提供するために「==推定==」と「==検定==」の二つのアプローチがある. ## 統計的==推定== 標本調査によって母集団の代表値(≒平均値)を得ることができる. (ただし,標本平均は母集団の真の平均の推定値に過ぎない) 推定値は真の値(母数)の近傍では高い確率で,離れた水準では低い確率で観測される(参考:中心極限定理). =>推定値は最も高い確率で母数であると思われる点の値である(点推定). より穏健にはある確率以上で母数が存在すると思われる範囲を示す(区間推定)という立場もあり,その立場では母集団の分散(ばらつきの尺度)が重要である. ## 統計的==検定== AはBと違うか,というような二つの状態の++差異の有無++を検証する.非常にまれなことが起きたときは,偶然起きたとは考えない.まれかどうかの分かれ目を==有意水準==と呼ぶ. ### ==有意水準== 有意水準は、検定において==帰無仮説==を設定したときにその帰無仮説を棄却する基準となる確率。αで表される。 5%(0.05)や1%(0.01)を用いる(検定を行う前に設定する) 有意水準を0.05に設定するということは、「5%以下の確率で起こる事象は、100回に5回以下しか起こらない事象だ。したがってこのようなまれな事象が起こった場合、偶然起こったものではないとしてしまおう」ということ。 したがって、P値が0.05(5%)を++下回った場合++、そのP値は偶然取る値ではないという結論になる。 言い換えると、P値が0.05(5%)を++下回った場合++、「極めて珍しいことが起こった」あるいは「++何かしら意味があることである++(=”有意である”)」ということを表します。 しかし、P値が5%以下となったとしてもその値を取る可能性は0ではないので、有意水準\alphaは「本当は帰無仮説H_{0}が正しいのに、誤ってH_{0}を棄却してしまう確率」とも言えます。この「本当は帰無仮説H_{0}が正しいのに、誤ってH_{0}を棄却してしまうこと」を「第1種の過誤」といい、\alphaは「第1種の過誤を犯す確率」とも呼ばれます。 図1