Github:[deepakdeepu8978-USAccidents](https://github.com/RainBowT0506/deepakdeepu8978-USAccidents) Kaggel:[how Severity the Accidents is ?](https://www.kaggle.com/code/deepakdeepu8978/how-severity-the-accidents-is/comments) # 認識數據  # 找出該欄位中所有不重複的值 ## 來源 ``` train_df.Source.unique() ``` ``` array(['MapQuest', 'MapQuest-Bing', 'Bing'], dtype=object) ``` ## 州 ``` states = train_df.State.unique() ``` ``` State : ['OH' 'WV' 'CA'] ``` # 按州可視化事故分佈  # 每列中缺失值的數量  # 可視化起點位置關係  # 視覺化終點位置關係  # 最容易發生事故的 5 種天氣狀況  # 特徵工程 ## 建立 dtype 資料框  ## 按類型聚合資料類型計數  ## 辨識高度缺失列  ## 按缺失計數篩選列 ``` ['TMC', 'End_Lat', 'End_Lng', 'Number', 'Wind_Chill(F)', 'Wind_Speed(mph)', 'Precipitation(in)'] ``` # 變數的相關係數  ## 分析唯一值 ``` Turning_Loop 1 Visibility(mi) 68 Pressure(in) 311 Humidity(%) 98 Temperature(F) 769 TMC 22 ``` ## 選擇顯著相關性  # 可視化 ## 可視化相關熱圖   ## 可視化特徵分佈  ## 可視化嚴重性分佈百分比  ## 可視化風寒的嚴重程度  ## 可視化嚴重性舒適度分佈  ## 可視化風寒強度分佈  ## 可視化嚴重性交叉分佈  ## 可視化嚴重程度連結分佈  ## 可視化嚴重程度的交通號誌分佈  ## 可視化特徵重要性  ## 可視化 xgboost 特徵重要性 
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up