Try   HackMD

回帰分析チェックシート (正直版)

tags: quality-management-2023
  • 概念図を描いた
  • 特性要因図を描いた
  • データをJMPに読み込めた
  • 各変数の属性を正しく設定した(連続尺度, 順序尺度, 名義尺度)
  • 〔1変量の分析〕を用いて、各変数の分布を確認し、気付いたことを書き留めた
  • 散布図行列を描き、しばらく眺め、気付いたことを書き留めた
  • 相関係数行列を求めて、相関が高そうな変数同士の組み合わせに目を留めた
  • 〔2変量の関係〕を実行して、単回帰分析のようなことを試してみた
  • 予測値と実測値のプロットを眺めた (散布図に変な隙間がないことの確認。)
  • 〔モデルのあてはめ〕を実行した
  • 効果てこ比のプロットを全て眺めて、てこ比が飛び抜けて大きな点がないことを確認した (てこ比が中心から大きく外れている点は、それを除くと、回帰係数が大きく動く可能性があり、外れ値であることが示唆される。)
  • 効果てこ比のプロットを全て眺めて、多重共線性がないことを確認した(あると、点が水平方向で中央に集まる。点が中央に集まっている状態は、回帰直線の傾きの推定値が不安定であることを示している。)
  • VIFを確認した (VIFが大きい変数は取り除いた方がよいかもしれない。)
  • 予測値と残差のプロットを眺めて、残差がYの予測値に依らず、0を中心にしてランダムに散らばっていることを確認した
  • スチューデント化残差を眺めて、およそ正規分布に近しいことを(目視で)確認した (正規分布に従っているなら、3シグマを超える確率は0.3%、など)
  • 効果の要約グラフを眺めて、有意な変数(棒グラフが青線の右まで伸びている変数)を確認し、概念図や特性要因図と照らして検討した
  • あてはめの要約を眺めて、R2乗の値を心に留め、誤差の標準偏差(RMSE)が目的変数のばらつきに比べてどれぐらいかを感じ取った
  • 分散分析を眺めて、モデルが有意(p値が5%以下)であることを確認した
  • パラメータの推定値を眺めて、各回帰係数の符号と大きさを考察した
  • 効果の検定を眺めて、各係数が0でないかの検定の結果を確認した (有意か否かは別にして)

ここまでクリアしてやっと、パラメータの推定値を用いた考察、そして予測精度が十分か不十分かの検討ができるようになります。この後は、大海原に漕ぎ出します。

  • ステップワイズ法を用いたり、t検定の結果やVIFなどを参考に、共変量を絞ってみる
  • てこ比を見ながら、外れ値を解析から除くことを検討する
  • 共変量を変換してみる
  • 共変量を追加してみる
  • 共変量を追加してみる
  • 離散化を検討する
  • 交互作用を検討する

回帰分析のインプットは次の通り。

  • 概念図
  • 特性要因図
  • データ

回帰分析のアウトプットは次の通り。

  • モデル図、有意か否かも星印で表す (p値は不要)
  • あてはまりの良さを表す統計量 (決定係数
    R2
    など。AICやBICは提示する意味がない。)
  • パラメータの推定値などの表 (必要なら。こちらには標準誤差、t値、p値などを記載してもいい)
  • 他 (参考文献に照らして必要なものを追加する)