# 資管新生專題 電子商務 ## 數據集 ### 會員數據 * UnifiedUserId * MemberId * RegisterSourceTypeDef * RegisterDateTime * Gender * Birthday * APPRefereeId * APPRefereeLocationId * IsAppInstalled * IsEnableEmail * IsEnablePushNotification * IsEnableShortMessage * FirstAppOpenDateTime * LastAppOpenDateTime * MemberCardLevel * CountryAliasCode ## 主單資料 * UnifiedUserId * MemberId * TradesGroupCode * OrderDateTime * ChannelType * ChannelDetail * PaymentType * ShippingType * TsCount * Qty * TotalSalesAmount * TotalPrice * TotalDiscount * TotalPromotionDiscount * TotalCouponDiscount * TotalLoyaltyPointDiscount * StatusDef ## 行為資料 * MemberId * Media * HitDateTime # 會員分群 - 依據基本與進階資料分族群 **基本** - Gender 性別:主要 - Age 年齡層 以5歲為單位 **進階:** - RegisterDateTime 成為會員的時間長短 - IsAppInstalled 是否有下載App - Enable? 是否有開啟通知/信件 - LastAppOpenDateTime 前一次開啟的時間(近期是否活躍) - MemberCardLevel 會員等級 ## 消費行為 #註 地區別先以TW為分析對象 ### 消費頻率 **Mapping** - UnifiedUserId - MemberId - 使用Regression **原因** - Gender - Birthday (Age) - RegisterDateTime - MemberCardLevel - LastAppOpenDateTime - Enabled? - TotalPromotionDiscount - TotalCouponDiscount - Purchase with Discount/Total Purchase **結果** - LastAppOpenDateTime - OrderDateTime - 近期購買次數 (OrderDateTime / time period) **預期** - 探討增加消費次數的原因 - 可能是會員優惠(是否導果為因?) - 購買時有優惠可使用也有可能增加頻率 - 找出有效增加消費頻率的方法 ## 單筆金額 **回歸分析:預測金額** - 找出幾項相關性高的因素,進行訓練 - 透過給定因素,預測最終金額 - Scikit learn 中 Linear Regression 或 Polynominal Regression **Mapping** * UnifiedUserId * MemberId * TradesGroupCode **原因** - 消費族群 - Qty (數量必然與金額成正比) - TsCount - OrderDateTime - TotalPromotionDiscount - TotalCouponDiscount - TotalLoyaltyPointDiscount - StatisDef -> Return - ChannelDetail - PaymentType - ShippingType **結果:監督式訓練所需** - TotalPrice (去除折扣) 預測實際購買商品價值 - TotalSalesAmount 預測實際願意花費價格 **預期** - 主要想了解**優惠**與總金額的差異 - 可以退貨 是否會讓消費者多購買 (?) - 時間(生日的月份)是否是有效的促銷 (?) - **性別**、**年齡**、**會員等級** (mapping) - 希望能了解**通路✓**、**貨運方法✓**及**付款方法✓**的影響 - 也可以了解可提高消費金額的方法 - **時間✓**、**星期幾✓**、**日期✓**、**月份✓** - **Andriod、iOS、Web ✓** - **QTY** **Tableau** - **付款方式**: ![](https://i.imgur.com/QOadbS4.png) \*註:Google Pay, Easy Wallet 因使用次數少先不討論 Aftee->與91App有緊密合作(優惠) Credit Card->分期付款 > 一次付清 行動支付 -> ApplePay > JKO Pay > Line Pay (金融卡 小額匯兌) 超商支付 不一定使用信用卡 可使用現金 -> 金額較小 線下通路 最低 - 運貨方式 ![](https://i.imgur.com/InWvCOY.png) 關聯界不顯著 可先不採用 海外特別高、宅配(貨物量多) 略大於 超商取貨 > 超商取貨付款 (同上) - 通路 ![](https://i.imgur.com/edLm4Bd.png) iOS >= Android > mobile > desktop > 線下 - 月份 ![](https://i.imgur.com/UTbo5o0.png) 11月 - 日期 - 沒什麼關係 除了11日 ![](https://i.imgur.com/hJsdvrO.png) - 星期幾 ![](https://i.imgur.com/xhv1du3.png) - 時間(哪一小時) ![](https://i.imgur.com/wA0F46N.png) ## 訂單狀態 - 多元分類:取消、退貨、完成訂單、其他 - SVC, NuSVC,LinearSVC 中的 Multi-class classification - Nearest Neighbors Classification **原因** * TotalSalesAmount * RegisterDateTime * Age * Gender * MemberCardLevel * ChannelDetail * Qty * TotalDiscount **結果** - StatusDef (Cancel, Return, Finish) **預期** - 探討是否有些通路容易引起取消(操作不易) - 新用戶是否容易誤植訂單 - 折扣是否會造成購買過多而退貨 - 超出預期的數量是否會造成退貨 - 較不易退貨/取消的價格範圍 ## 是否購買 - 二元分類:購買 vs 不購買 - SVC, NuSVC,LinearSVC **原因** - Media - Age - Gender - MemberCardLevel - APPRefereeId - Enabled **結果** - HitDateTime - OrderDateTime - 在HitDateTime後是否有Order **預期** - 尋找進行購買的原因 - 進入網站時,不同族群的購買意願 - 會員是否較常瀏覽而不購買 - HitDateTime - OrderDateTime 時間小的人是否有特別的行為(已經找到目標,與退貨/消費金額的關聯) ## 流量 **目標** - Media - HitDateTime **預期** - 探討這兩者對於各項數據的影響 - 目前無法將其歸類於某種消費行為中 - 利用Regression找出可能相關的行為 Random Forest Accuracy: Training Data: ~93.14 Testing Data: ~82.07 ['ChannelDetail' 'PaymentType' 'ShippingType' 'TsCount' 'Qty' 'TotalSalesAmount' 'TotalPrice' 'TotalDiscount' 'TotalPromotionDiscount' 'TotalCouponDiscount' 'TotalLoyaltyPointDiscount' 'StatusDef' 'Weekday' 'Hour'] [0.04525247 0.02140641 0.01832341 0.01034805 0.09940372 0.19591368 0.22325462 0.04957432 0.0290761 0.02830609 0. 0.08789419 0.19124695]