# BI work with MKT on 數據整合 ## 資料導入專案三階段 ### 一、數據清整 #### 1. 數據收集 一個專案一定有要達成的目標,要收集為了達到目標需要的數據 譬如,想分析台北地區分店的會員招募成效, 就必須有品牌的分店地點、會員註冊地點、新會員購買紀錄 目前數據收集常用的方式有sftp傳輸及API交換兩種 以Migo目前的服務來說,以下幾張為常見表 * 會員表 * 會員編號,姓名,年齡,生日,手機,Email,註冊日,註冊店櫃等 * 會籍紀錄表 * 會員等級,等級生效日,等級截止日,等級狀態(啟用/停用)等 * 門市店櫃表 * 門市編號,名稱,地址,電話,區域別,通路別,負責人等 * 交易主表 * 訂單編號,訂單日,出貨日,購買會員編號,訂單門市編號,訂單金額等 * 交易明細表 * 訂單編號,購買產品編號,產品售價等 * 產品表 * 產品編號,產品名稱,產品分類,顏色,尺寸,定價等 * 折扣紀錄表 * 折扣號碼,折扣名稱,折抵金額等 * 點數紀錄表 * 點數增減,點數增減原因等 * 溝通紀錄表(Email/SMS/LINE) * 發送時間,發送號碼,發送是否成功,點擊時間等 並不是每間公司都能提供這些資料, 譬如有些公司只有收集每次交易的紀錄, 並沒有獨立的會員表, 我們為了分析需求,就要從交易紀錄中把會員資訊萃取出來,單獨成表 #### 2. 數據品質檢查與修正 我們想像中的資料表都長得很漂亮, 但實際上收到的數據,有可能檔案打不開,編碼或內容錯誤導致格式走鐘 能正確打開資料表之後,欄位內容也可能跟自己想像的不一樣 譬如我們想像的手機號碼是0999123456,結果有人的手機資料是中文字, 或填了市話或外國號碼,或是空值,這些都會影響數據被使用後的效益低於我們原本的期待 又或者,在購買紀錄表上,同一個訂單號碼有兩筆資料,且這兩筆資料竟然是由不同會員購買的,這又是怎麼回事呢? #### 數據清整常常遇到的雷 1. 資料重複:相同的資料重複出現,缺乏key值 2. 資料缺失:姓名/手機/地址未填寫,或一開始就沒有收集 3. 品質不佳:同一產品在不同訂單中顯示不同名稱,同一欄位內容格式不統一 4. 資料不一致:交易主表的訂單金額不等於交易明細金額的加總 5. 資料不夠全面:只有線上訂單或線下訂單 6. 資料不夠即時:線上/線下消費數據同步存在時間差 數據品質檢查與修正是最花時間的工作, 尤其當資料品質不佳,提供者必須回頭釐清原因並修正, 問題的釐清又可能必須要回溯歷史或詢問其他相關部門, 一次修正短至2-3天,長至1-2個月,甚至無解都有可能 #### 3. 資料流(Datapipeline)製作 當需要的欄位都備齊,每張表的品質也都過關後, 下一步是規劃有效率的資料流程 無論要製作分析報告或儀表板,相同的分析可能會做無數次,產生無數張新表 光是計算會員過去一年的訂單金額,就可能分為包含退貨及不含退貨的版本 這些常用的欄位要怎麼存放,計算時要用哪些表的哪些欄位,確定的定義是什麼 都需要找到最有效率的方式, 才不會每次都要重複計算相同的東西造成重工,或不同人用不同的方式計算同一個標籤,造成數據解讀的偏誤 有清楚的資料流程,我們也才知道當某一個表的內容異動時, 有哪些相關的欄位和儀表板的內容會被影響,需要更新 ### 二、資料特徵化 根據業務或營運需求,擴充資料的特徵與足跡,以豐富數據的內容 以Migo的經驗來說,品牌想知道的會員標籤通常有 * 最近一段時間內的交易次數、平均交易金額 * 是否偏好特定門市或通路 * 是否偏好特定產品 * 距離上次的消費時間間隔,平均多久會消費一次? * 平常會點擊簡訊或Email嗎?點擊後有沒有購買? * 有兌換贈送的點數或折價券嗎? ### 三、建立分群 根據行銷場景需求,建立資料的標籤與分群 什麼樣的分群方式最能把不同類型的會員分開, 讓品牌分別對他們採取不同的溝通策略呢? 除了CRM常用的RFM模型,Migo也有自行研發的NFES標籤 讓品牌了解會員的活性為何,制定相應的經營策略 * 新會員(N) * 鮮會員(F) * 活躍會員(E) * 沉睡會員(S) 除了採取不同的溝通策略外, 不同群的會員間也可以比較,產生商業洞察 例如:每天都要喝咖啡的消費者是不是習慣大量購買低價咖啡? 偶爾喝一次的消費者會不會比較能接受高價咖啡? 要回答這樣的問題,就需要依據消費者對咖啡的消費頻率進行分群和消費分析 ## 隱藏的魔王:外部資料交換 品牌常常同時與不同廠商合作,資料分散在不同廠商手中,整合困難: 1. 不同廠商資料記錄方式不同,缺乏整併key值或對應表 2. 不同廠商資料更新時間不同,導致消費者在不同地方取得的資訊有落差 3. 廠商間溝通成本高,各做各的,缺乏統一規劃資料流程的能力 4. 公司內不同部門向不同廠商取得資料,由於資料處理邏輯不同,造成數據不同,形成內部溝通與決策的阻力 常需要資料交換的廠商有: * 線上官方網站,電商平台 * 門市POS機資料 * 廣告投放廠商(DMP) * 會員資料平台(CDP) * 其他行銷工具廠商 如何統合不同廠商間的差異,打造共同的數據平台與優質服務體驗, 就算建立資料交換機制,又是另一個挑戰的開始, 因為打開資料交換的門,如果合作廠商丟了有問題的資料進來, 甚至會打亂自己已經整理好的資料... 各式各樣的問題都是本階段的重點,也是考驗經驗與專案控管能力的最佳戰場