# 原始資料 ## TPASS交易資料 (112.11.01 ~112.11.30) * 原始資料量: 3,975,749 * 運輸業者為**客運**的資料量: 1,390,337 * 轉成od資料: 691,950 (原始資料僅有上車/下車票卡資料) * 剔除明顯錯誤後的資料量: 655992 * 約刪除5%資料量 * 運輸業者為**非客運**的資料量: 2,584,742 * 有效的OD資料量: 3,240,734 * 欄位 * 交易日期時間、內碼、票卡序號、原始票價、運輸業者、進上車站、出下車站、路線、duration * **非客運類**原始資料即為**一筆**OD資料,所以**無法使用此資料計算出搭乘時間** * 因TPASS的上下車車站編號與經緯度、MaaS資料的表示方式不同,故暫時無法取得客運站的**經緯度資料(資料無法匹配)** * TPASS高雄客運車站編號表示 ![image](https://hackmd.io/_uploads/BJoPmVWzR.png) * MaaS高雄客運車站編號表示 ![image](https://hackmd.io/_uploads/BkTFQV-MA.png) ## MaaS資料 (高雄客運 2023-10-01~2023-10-31) * 資料為**高雄客運**的票卡資料 * 原始資料量: 132,866 * MaaS路線資料 * 共101條路線 * 缺少經緯度資料的路線數量: 18條 * 缺少經緯度資料的路線: 33, 104, 1513, 75, 11, 76, 1613, 1615, 1616, 209, 82, 210, 1519, 8117, 1015, 1623, 9017, 61 * MaaS站牌資料 * 原始資料內的站牌數: 3134 * 缺少經緯度資料的站牌數量: 510 * MaaS有效資料 * 有效路線數量: 77條 (有6條路線可能出現資料錯誤) * 有效車站數量: 1030 * 出現資料錯誤的路線: 62, 98, 612, 8041, 621, 622 * 錯誤狀況 * 語音代碼為0 ![image](https://hackmd.io/_uploads/ryi0yEbM0.png) # 初步成果 ## TPASS資料 * 可取得相同內碼(同一人的資料OD流) > 此範例為使用運輸業者種類最多的人(排除bike) > 交易日期時間 內碼 票卡序號 原始票價 運輸業者 進上車站 出下車站 路線 duration ![image](https://hackmd.io/_uploads/SyTQVE-GA.png) * 統計使用不同運具數量的人數 >排除bike ![image](https://hackmd.io/_uploads/SJRVY4bzA.png) ## MaaS資料 * 可取得相同內碼(同一人的資料OD流) > 此範例為資料量最多的卡號(共104筆資料) > '上車日期時間', '路線編號', '路線名稱', '上車招呼站名稱', '上車緯度', '上車經度', '下車招呼站名稱', '上車緯度', '下車緯度', 'duration' ![image](https://hackmd.io/_uploads/rkWBRNZzA.png)