# 回帰分析チェックシート (正直版) ###### tags: `quality-management-2023` - [ ] 概念図を描いた - [ ] 特性要因図を描いた - [ ] データをJMPに読み込めた - [ ] 各変数の属性を正しく設定した(連続尺度, 順序尺度, 名義尺度) - [ ] 〔1変量の分析〕を用いて、各変数の分布を確認し、気付いたことを書き留めた - [ ] 散布図行列を描き、しばらく眺め、気付いたことを書き留めた - [ ] 相関係数行列を求めて、相関が高そうな変数同士の組み合わせに目を留めた - [ ] 〔2変量の関係〕を実行して、単回帰分析のようなことを試してみた - [ ] 予測値と実測値のプロットを眺めた (散布図に変な隙間がないことの確認。) - [ ] 〔モデルのあてはめ〕を実行した - [ ] 効果てこ比のプロットを全て眺めて、てこ比が飛び抜けて大きな点がないことを確認した (てこ比が中心から大きく外れている点は、それを除くと、回帰係数が大きく動く可能性があり、外れ値であることが示唆される。) - [ ] 効果てこ比のプロットを全て眺めて、多重共線性がないことを確認した(あると、点が水平方向で中央に集まる。点が中央に集まっている状態は、回帰直線の傾きの推定値が不安定であることを示している。) - [ ] VIFを確認した (VIFが大きい変数は取り除いた方がよいかもしれない。) - [ ] 予測値と残差のプロットを眺めて、残差がYの予測値に依らず、0を中心にしてランダムに散らばっていることを確認した - [ ] スチューデント化残差を眺めて、およそ正規分布に近しいことを(目視で)確認した (正規分布に従っているなら、3シグマを超える確率は0.3%、など) - [ ] 効果の要約グラフを眺めて、有意な変数(棒グラフが青線の右まで伸びている変数)を確認し、概念図や特性要因図と照らして検討した - [ ] あてはめの要約を眺めて、R2乗の値を心に留め、誤差の標準偏差(RMSE)が目的変数のばらつきに比べてどれぐらいかを感じ取った - [ ] 分散分析を眺めて、モデルが有意(p値が5%以下)であることを確認した - [ ] パラメータの推定値を眺めて、各回帰係数の符号と大きさを考察した - [ ] 効果の検定を眺めて、各係数が0でないかの検定の結果を確認した (有意か否かは別にして) ここまでクリアしてやっと、パラメータの推定値を用いた考察、そして予測精度が十分か不十分かの検討ができるようになります。この後は、大海原に漕ぎ出します。 - [ ] ステップワイズ法を用いたり、t検定の結果やVIFなどを参考に、共変量を絞ってみる - [ ] てこ比を見ながら、外れ値を解析から除くことを検討する - [ ] 共変量を変換してみる - [ ] 共変量を追加してみる - [ ] 共変量を追加してみる - [ ] 離散化を検討する - [ ] 交互作用を検討する 回帰分析のインプットは次の通り。 - [ ] 概念図 - [ ] 特性要因図 - [ ] データ 回帰分析のアウトプットは次の通り。 - [ ] モデル図、有意か否かも星印で表す (p値は不要) - [ ] あてはまりの良さを表す統計量 (決定係数$R^2$など。AICやBICは提示する意味がない。) - [ ] パラメータの推定値などの表 (必要なら。こちらには標準誤差、t値、p値などを記載してもいい) - [ ] 他 (参考文献に照らして必要なものを追加する)