TPASS X TDX
資料處理
第一次資料
第二次資料
- MaaS資料、各業者語音代碼經緯度對照表
- TPASS資料的車站序號 與 各業者語音代碼經緯度對照表 的代碼不同,無法匹配
- 第二次資料成果
第三次資料
- TPASS、漢程-高雄市77路-票證資料
- 因漢程提供之資料為票證資料,故車站序號不完整(有缺)
- 利用77路資料 與 各業者語音代碼經緯度對照表 merge,串出完整資料可 與 TPASS merge
- 但車站順序有些微不相符
第四次資料
- TPASS、TDX資料(TDX網站)
- TDX資料的公車路線站序 與 TPASS車站序號相符
- TDX資料已包含經緯度資料,可成功串出所需完整資料
利用TDX的資料進行匹配
- TDX資料:高雄市市區公車路線站序歷史資料2024-05-01
- 因市區公車不含"非整數路線"(如'3ADB'路線)故先剔除"非整數路線"
- 非整數路線
- 整數路線的TPASS資料
- TDX資料
- 配對失敗(TPASS資料有,但TDX資料無)
成功匹配經緯度之資料
- 檔案: matched_data.csv
- 資料量: 278806
- 成功配對路線個數: 153
77路資料比對
漢程客運提供之站序資料可能與TPASS、TDX的資料不符
-
TPASS的最後站序: 84

-
TDX串接後的最後站序: 84

-
漢程客運提供之最後站序: 81

方向與站序
Direction是1代表去, 0代表回
- 之前預設Direction是0代表去, 1代表回


- 發現許多人是從5上車,2下車 -> 若依照原本算法,會在旗山轉運站上車 -> 可能是1代表去, 0代表回

- 更正後

搭乘次數分析
- 每人搭乘次數統計
- 縱軸:累積人數 / 橫軸:搭乘次數

- 取出前五多的搭乘內碼
- 檔案:top_five_codes_data.csv
Kmeans
-
原先使用OD資料分群
- 可能會造成同個人被分到不同群(因為用票卡資料分群的)
-
改成使用同一內碼分群
- 票價 -> 取平均票價
- 搭乘次數 -> 總和
- weekday次數比例 -> 在weekday的次數 / 搭乘次數
- work_time次數比例 -> 在work_time的次數 / 搭乘次數
-
測試分幾群比較好 -> 取5群







Flow Map
空間分群
flow-clustering
- 只考慮od起訖站點(不考慮其od的運量)
- 使用參數:alpha = 0.55 (邊界圓尺度係數)、K = 25 (近鄰數)加註解
- 分成 2784 群
- 檔案:
merged_and_reordered_clusters.csv
- 前五多路線的群:
- 6 (1654)、16 (1335)、53 (1127)、13 (1102)、68 (1000)
- 前五多運量的群:
- 16 (13610)、6 (13213)、27 (11464)、2 (10890)、68 (10270)
分析第6群
QGIS FlowMapper
- GREEN nodes gaining flows (incoming>outgoing)
- RED nodes losing flows (incoming<outgoing)



若需將此群畫成一個起訖點,該怎麼決定起訖點的位子?
依權重選計算座標值? 選定較中間的一個站牌點位?
Top 30 SCluster 分析
檔案:top_30_clusters_data.csv
Weekday/ weekend


Work time


Price (distance)


- 41:塔仔腳 -> 中華路口(溪洲醫院) , 高鐵左營站 -> 旗山轉運站
- 48:竹崎(高雄科大.燕巢) -> 三民公園(博愛路口)
- 82:崙仔頂(福安) -> 叢仔坑
選取代表點位製作FlowMap
- 代表點位選取規則
- 先將同一群的票卡資料依權重(搭乘次數)加權平均,計算加權質心的經緯度
- 選取與加權質心的經緯度最鄰近的座標點
- 前五大路線的代表點位
- 民族國中側門 -> 民族陸橋 (第16群)
- 憲政路口 -> 大昌二路(建工路口) (6)
- 大樂民族店 -> 三民高中(明誠一路) (27)
- 台鋁新村 -> 前鎮站 (2)
- 高雄高商(五褔二路) -> 新聞報 (68)


