# ML and FinTech: Project by 孫崇棨 --- ## Motivations (Talk 1) 最近聽到有保戶用死纏爛打戰術,照三餐打電話到幾間保險公司不勝其擾,取得龐大的保險費的案例。 詐保事件頻傳,每年造成保險公司增加大量的成本,也間接增加投保者的保費支出 [「詐保理賠金」竟高達105億!還都由全國保戶買單 恐將波及調高保險費率 ](https://www.chinatimes.com/realtimenews/20201217001101-260410?chdtv) **因此我想尋找一個適合判斷要保人是否有詐領保險金可能性的預測模型,能使公司更好的避免不必要的理賠支出**。 ### Keywords Insurance market, Fraud detection, Supervised learning ### 使用資料: [Car_Insurance_Fraud](https://www.kaggle.com/incarnyx/car-insurance-fraud) ## EDA (Talk 2) ### variable descriptions | variable | descriptions | | ---|---| |Fraud Found_P|是否有詐保情形| |Month|發生事故的月份| |Week Of Month|該月的第幾周發生該事故| |Day Of Week|事故發生是禮拜幾?| |Make|發生事故的車輛廠牌| |AccidentArea|在哪裡發生事故的(只有都市鄉村兩分類)| |Day Of Week Claimed|在禮拜幾進行事故索賠要求| |Month Claimed|事故索賠要求的月份| |Week Of Month Claimed|該月的第幾周進行事故索賠要求| |Sex|性別| |Marital Status|婚姻狀態| |Age|年齡| |Fault|事故歸咎者(投保者或第三方)| |Policy Type|保單類型| |Vehicle Category|車輛種類| |Vehicle Price|車輛價格範圍| |Policy Number|保單編號| |RepNumber|維修編號| |Deductible|保險自負額| |Driver Rating|駕駛人評分(越低越好,代表駕駛人有較低事故發生情形)| |Days_Policy_Accident|保後事故間隔時間| |Days_Policy_Claim|保後索賠要求間隔時間| |PastNumberOfClaims|之前有幾次事故索賠紀錄| |Age Of Vehicle|車輛年齡| |Age Of Policy Holder|受理理賠人員年齡| |PoliceReportFiled|索賠歸檔紀錄| |WitnessPresent|事故是否有目擊者| |AgentType|代理人類型| |NumberOfSupplement|附約數量| |Address Change Claim|住址是否改變| |Number Of Cars|擁有車輛數| |Base Policy|保險主約類別| |Year|保險成立年分| |Claim Size|索賠金額| ### data information ![變數資訊](https://i.imgur.com/V3cExEX.jpg) ### hist ![hist data](https://i.imgur.com/8n9z6Wm.png) ## Problem formulation (Talk 3) ## Analysis (Talk 4) ## Conclusion (Talk 4) --- ---