Try   HackMD

回帰分析って何?

tags: quality-management

凡例

観測される変数を四角で囲む。







%0



Y

Y



X

X



観測されない変数を丸く囲む。







%0



Y

Y



X

X



2変数の間の関係を矢印なしの線で表し、その関係の強さを線の上に記す。







%0



Y

Y



X

X



Y--X

ρ



2変数の間の因果関係を矢印のある線で表し、その関係の強さを線の上に記す。
矢印は原因から結果に向かう方向を表す。







%0



Y

Y



X

X



Y->X


β



単回帰分析:条件がアウトカムに及ぼす影響を分析する手法

関連性の分析







%0



誤差

誤差



身長

身長



体重

体重



身長--体重

β



体重--誤差

σ



因果関係の分析







%0



e

e



Y

Y



e->Y


σ



X

X



X->Y


β



重回帰分析:様々な条件がアウトカムに及ぼす影響を分析する手法

関連性の分析







A



X1

X1



Y

Y



X1--Y

β1



X2

X2



X2--Y

β2



X3

X3



X3--Y

β3



Xp

Xp



Xp--Y

βp



e

e



e--Y

σ



因果関係の分析







A



X1

X1



Y

Y



X1->Y


β1



X2

X2



X2->Y


β2



X3

X3



X3->Y


β3



Xp

Xp



Xp->Y


βp



e

e



e->Y


σ



データの種類

介入データ(実験データ)

  • 説明変数の分布は、条件設定の度数分布。
  • 説明変数は設定したり、変更したりできる。

観察データ

  • 説明変数の分布は、標本の分布。
  • 説明変数は設定したり、変更したりできるとは限らない。

分析の目的

因果推論の入り口:目的変数の変化に関する因果の構造を明らかにする。(介入データ)

調査:目的変数に影響を与える変数(要因)とその影響の大きさを明らかにする。(観察データ)

この違いを、ボストンの住宅価格のデータを分析しながら、見ていきます。

回帰分析の結果

JMPでは、様々な数値やグラフが、分析をしていく順序で上から下に並んで出力されます。

パラメータ推定値、まで問題なく到達すると、その推定値を検討し始めてよくなります。

  1. 行ごとの診断統計量
    a. 予測値の実測値のプロット:正の相関が強く見えるといい
    b. てこ比プロット
    c. 予測値と残差のプロット
    d. スチューデント化残差
  2. 効果の要約レポート
  3. 回帰レポート
    a. あてはめの要約
    b. 分散分析
    c. パラメータ推定値
    d. 効果の検定
  4. 残差の正規分位点プロット
  5. 要因のスクリーニング
  6. パラメータの母集団
  7. 推定値の相関
  8. 無相関にするための変換
  9. 正規プロット
  10. 予測プロファイル

でも、回帰分析の前にやることがあります。

  • 概念図を描く
  • 特性要因図を描く

途中までの流れをチェックシートにまとめてみました。

回帰分析の流れ

  1. データを分析する目的を設定する
  2. 目的の対象についての目的の変数とその他の変数を含むデータを入手する
  3. 変数の概念図を描く
  4. 特性要因図を描く
  5. すべての変数を含めた回帰分析を行う (JMP:〔モデルのあてはめ〕→〔標準最小2乗〕)
  6. 当てはまりの良さを確認する (JMP:〔モデルのあてはめ〕→〔標準最小2乗〕)
  7. モデルの有意性と各変数の有意性を検討する (JMP:〔モデルのあてはめ〕→〔標準最小2乗〕)
  8. 変数の変換、組み合わせ、選択などを試したくなったら試す (JMP:〔モデルのあてはめ〕→〔ステップワイズ法〕)
  9. 途中から得られた重回帰式の解釈を検討し始めておく
  10. 最終的に問題のないモデルを得たらそれを用いて結論を得る