--- title: revenue forecast 多変量分析 tags: TIS, AI基礎研修, 3rd, training --- # 多変量解析レポート :::info - 多変量分析のモチベーション - モデリングにおいて重要な変数を確認したい - 重要変数から、さらに有用な変数が生成できないか検討したい - ノイズになるような変数を確認したい - 予測するにあたって重要でない変数を確認したい - 頻度が小さく傾向が同じ様な質的変数の値はまとめたい - 相関する変数同士を確認したい ::: ### 質的変数 #### ▮ workclass ![](https://i.imgur.com/hTh16tC.png) #### ▮ education ![](https://i.imgur.com/7gOSbGr.png) #### ▮ marital-state ![](https://i.imgur.com/dLmSOqp.png) #### ▮ occurpation ![](https://i.imgur.com/OQH3fw5.png) #### ▮ relationship ![](https://i.imgur.com/lxwOM2Y.png) #### ▮ race ![](https://i.imgur.com/GCUWzyA.png) #### ▮ sex ![](https://i.imgur.com/y3cUS9T.png) #### ▮ native-country ![](https://i.imgur.com/Aa609d2.png) ### 量的変数 #### raw ![](https://i.imgur.com/ihkXbES.png) #### zscore ![](https://i.imgur.com/pYCYJjG.png) #### log-zscore - $log(x+1) = x'$を計算し、$x'$を標準化 ![](https://i.imgur.com/W9NxGwX.png) #### 相関分析 ##### ピアソン相関 ![](https://i.imgur.com/fNY8i1C.png) ##### スピアマン相関 ![](https://i.imgur.com/xLdujOD.png)