# 原始資料
## TPASS交易資料 (112.11.01 ~112.11.30)
* 原始資料量: 3,975,749
* 運輸業者為**客運**的資料量: 1,390,337
* 轉成od資料: 691,950 (原始資料僅有上車/下車票卡資料)
* 剔除明顯錯誤後的資料量: 655992
* 約刪除5%資料量
* 運輸業者為**非客運**的資料量: 2,584,742
* 有效的OD資料量: 3,240,734
* 欄位
* 交易日期時間、內碼、票卡序號、原始票價、運輸業者、進上車站、出下車站、路線、duration
* **非客運類**原始資料即為**一筆**OD資料,所以**無法使用此資料計算出搭乘時間**
* 因TPASS的上下車車站編號與經緯度、MaaS資料的表示方式不同,故暫時無法取得客運站的**經緯度資料(資料無法匹配)**
* TPASS高雄客運車站編號表示

* MaaS高雄客運車站編號表示

## MaaS資料 (高雄客運 2023-10-01~2023-10-31)
* 資料為**高雄客運**的票卡資料
* 原始資料量: 132,866
* MaaS路線資料
* 共101條路線
* 缺少經緯度資料的路線數量: 18條
* 缺少經緯度資料的路線: 33, 104, 1513, 75, 11, 76, 1613, 1615, 1616, 209, 82, 210, 1519, 8117, 1015, 1623, 9017, 61
* MaaS站牌資料
* 原始資料內的站牌數: 3134
* 缺少經緯度資料的站牌數量: 510
* MaaS有效資料
* 有效路線數量: 77條 (有6條路線可能出現資料錯誤)
* 有效車站數量: 1030
* 出現資料錯誤的路線: 62, 98, 612, 8041, 621, 622
* 錯誤狀況
* 語音代碼為0

# 初步成果
## TPASS資料
* 可取得相同內碼(同一人的資料OD流)
> 此範例為使用運輸業者種類最多的人(排除bike)
> 交易日期時間 內碼 票卡序號 原始票價 運輸業者 進上車站 出下車站 路線 duration

* 統計使用不同運具數量的人數
>排除bike

## MaaS資料
* 可取得相同內碼(同一人的資料OD流)
> 此範例為資料量最多的卡號(共104筆資料)
> '上車日期時間', '路線編號', '路線名稱', '上車招呼站名稱', '上車緯度', '上車經度', '下車招呼站名稱', '上車緯度', '下車緯度', 'duration'
