回帰分析って何?
凡例
観測される変数を四角で囲む。
観測されない変数を丸く囲む。
2変数の間の関係を矢印なしの線で表し、その関係の強さを線の上に記す。
2変数の間の因果関係を矢印のある線で表し、その関係の強さを線の上に記す。
矢印は原因から結果に向かう方向を表す。
単回帰分析:条件がアウトカムに及ぼす影響を分析する手法
関連性の分析
因果関係の分析
重回帰分析:様々な条件がアウトカムに及ぼす影響を分析する手法
関連性の分析
因果関係の分析
データの種類
介入データ(実験データ)
- 説明変数の分布は、条件設定の度数分布。
- 説明変数は設定したり、変更したりできる。
観察データ
- 説明変数の分布は、標本の分布。
- 説明変数は設定したり、変更したりできるとは限らない。
分析の目的
因果推論の入り口:目的変数の変化に関する因果の構造を明らかにする。(介入データ)
調査:目的変数に影響を与える変数(要因)とその影響の大きさを明らかにする。(観察データ)
この違いを、ボストンの住宅価格のデータを分析しながら、見ていきます。
回帰分析の結果
JMPでは、様々な数値やグラフが、分析をしていく順序で上から下に並んで出力されます。
パラメータ推定値、まで問題なく到達すると、その推定値を検討し始めてよくなります。
- 行ごとの診断統計量
a. 予測値の実測値のプロット:正の相関が強く見えるといい
b. てこ比プロット
c. 予測値と残差のプロット
d. スチューデント化残差
- 効果の要約レポート
- 回帰レポート
a. あてはめの要約
b. 分散分析
c. パラメータ推定値
d. 効果の検定
- 残差の正規分位点プロット
- 要因のスクリーニング
- パラメータの母集団
- 推定値の相関
- 無相関にするための変換
- 正規プロット
- 予測プロファイル
でも、回帰分析の前にやることがあります。
途中までの流れをチェックシートにまとめてみました。
回帰分析の流れ
- データを分析する目的を設定する
- 目的の対象についての目的の変数とその他の変数を含むデータを入手する
- 変数の概念図を描く
- 特性要因図を描く
- すべての変数を含めた回帰分析を行う (JMP:〔モデルのあてはめ〕→〔標準最小2乗〕)
- 当てはまりの良さを確認する (JMP:〔モデルのあてはめ〕→〔標準最小2乗〕)
- モデルの有意性と各変数の有意性を検討する (JMP:〔モデルのあてはめ〕→〔標準最小2乗〕)
- 変数の変換、組み合わせ、選択などを試したくなったら試す (JMP:〔モデルのあてはめ〕→〔ステップワイズ法〕)
- 途中から得られた重回帰式の解釈を検討し始めておく
- 最終的に問題のないモデルを得たらそれを用いて結論を得る