--- title: revenue forecast 単変量分析 tags: TIS, AI基礎研修, 3rd, training --- # 単変量解析レポート :::info - 単変量分析のモチベーション - どのようなデータ加工を施すべきか確認したい - 欠損値は存在するか?存在する場合にどのくらいの割合か? - 外れ値は存在しないか? - 存在したらlog変換 or binning - 水準数が多すぎる質的変数は存在しないか? - 水準数が多いとonehot化した場合にカラム数が多くなる - 精度に悪影響する場合が多い - データ量が増え、機械工数が増す - 出来上がったモデルの解釈がし難くなる - 変数を追加する際に仮説を立て難くなる ::: ## 質的変数 ### ▮ workclass - 水準数: 9 - 欠損値割合: 0.0  ### ▮ education - 水準数: 16 - 欠損値割合: 0.0  ### ▮ marital-status - 水準数: 7 - 欠損値割合: 0.0  ### ▮ occupation - 水準数: 15 - 欠損値割合: 0.0  ### ▮ relationship - 水準数: 6 - 欠損値割合: 0.0  ### ▮ race - 水準数: 5 - 欠損値割合: 0.0  ### ▮ sex - 水準数: 2 - 欠損値割合: 0.0  ### ▮ native-country - 水準数: 41 - 欠損値割合: 0.0  ### ▮ Y - 水準数: 2 - 欠損値割合: 0.0  ## 量的変数 ### ▮ age - Zero割合 0.0 - describe count 16280.000000 mean 38.603808 std 13.672102 min 17.000000 25% 28.000000 50% 37.000000 75% 48.000000 max 90.000000 Name: age, dtype: float64  ### ▮ fnlwgt - Zero割合 0.0 - describe count 1.628000e+04 mean 1.899753e+05 std 1.048903e+05 min 1.228500e+04 25% 1.186912e+05 50% 1.789955e+05 75% 2.376340e+05 max 1.226583e+06 Name: fnlwgt, dtype: float64  ### ▮ education-num - Zero割合 0.0 - describe count 16280.000000 mean 10.089558 std 2.570911 min 1.000000 25% 9.000000 50% 10.000000 75% 12.000000 max 16.000000 Name: education-num, dtype: float64  ### ▮ capital-gain - Zero割合 0.9135749385749385 - describe count 16280.000000 mean 1131.057617 std 7672.406043 min 0.000000 25% 0.000000 50% 0.000000 75% 0.000000 max 99999.000000 Name: capital-gain, dtype: float64  ### ▮ capital-loss - Zero割合 0.953009828009828 - describe count 16280.000000 mean 88.075369 std 405.251482 min 0.000000 25% 0.000000 50% 0.000000 75% 0.000000 max 4356.000000 Name: capital-loss, dtype: float64  ### ▮ hours-per-week - Zero割合 0.0 - describe count 16280.000000 mean 40.410012 std 12.311716 min 1.000000 25% 40.000000 50% 40.000000 75% 45.000000 max 99.000000 Name: hours-per-week, dtype: float64 
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up