Image Not Showing
Possible Reasons
The image file may be corrupted The server hosting the image is unavailable The image path is incorrect The image format is not supported
Learn More →
Image Not Showing
Possible Reasons
The image file may be corrupted The server hosting the image is unavailable The image path is incorrect The image format is not supported
Learn More →
開放資料甘苦談:匯入地址到OpenStreetMap 2024年篇
slide: https://hackmd.io/@osm-tw/HyTFguS_0
CC-BY-4.0 OpenStreetMap Taiwan Community
台灣開放街圖社群
逐家好,閣來到 COSCUP 大會來分享 – ah,對逐家分享 OpenStreetMap 社群 tī 台灣 ê 跤跡,其中上要緊 ê sī kah 政府開放資料 ê 關聯,濟个城市 ê 地址點位匯入工課。進前 ū tī g0v Summit 2024 年講過匯入開放資料,今仔日主要 sī 講地址 ê 部份。
為何欲關注 OpenStreetMap?
受著維基百科 ê 啟發,維基式來產生地理資料
OpenStreetMap sī 迒跨語言 ê 地理資料庫
允准各種國際化 ê 語言,嘛有在地在庄 ê 語言
能索引其他資料庫 ê 資料,比如:Wikidata
OpenStreetMap ū 經緯度資訊,嘛是會當囥地理資料本身 ê 結構化資料
OpenStreetMap Taiwan kah Wikidata Taiwan 共同tī 台北主辦 ê 月聚
成員 ū 互相重疊
主要 sī 監視變動,閣有制訂編輯指南
tī 遮拍廣告,逐個月 OpenStreetMap kah Wikidata Taiwan 社群 tī 台北摩茲工寮聚會。兩爿 ê成員互相重疊猶閣有仝 ê 精神,才ū 法度辦落去。聚會時段主要討論上新變動 kah 制訂編輯指南。
監控針對台灣資料 ê 破壞 - 中國「規劃」 ê 迒跨台灣海峽大橋
04/03 07:58:11 UTC+8 花蓮地動
總統府 , CC BY 2.0 , via Wikimedia Commons
往過 ê 匯入經驗
AED
避難收容所 - 資料精準度問題
ETC 門柱
i郵箱
地址
匯入避難收容所-null island
政府捌釋出避難收容所 ê 資料,m̄-koh 資料量傷大,難免 ū 資料無寫位置,抑是寫毋著所在,其中 ū 幾十筆走到 0,0 位置,也就是一般講 null island ê 所在。
匯入避難收容所2-刪除台灣以外 ê 點位
村里資料匯入
戶役政系統代碼 ê 主管機關改變
主計總處->戶政司
縣市整併轄下 ê 村里
ex: 人口濟 ê 村里拆分
落尾寫程式監控資料
Ceb Wiki ljsbot 大量匯入溪流資料
溪流資料狀況
政府開資源整治 ê 溪流流城,出現河川代碼,其實這个清單 ê 溪流,比並實際上 ê 溪流閣較少。造成毋但 sī OpenStreetMap 抑是 Wikidata,欲整理無 tī 河川代碼清冊 ê 溪流建立資料。
地址資料-號 ê 處理
地址資料-台中 ū WGS84 經緯度
詳細詳細來講,地址資料 ê 處理。閣愛說多謝,感謝政府釋出(sek-chhut)資料,各縣市政府 mā 已經沓沓仔 kā 資料放出來 – ah。社群這爿 mā 陸續處理變成 OpenStreetMap ê 格式(keh-sek),親像這幅圖會當看著政府端資料生做按呢,縣市、鄉鎮市區 sī 用戶役政系統代碼表示,愛家己轉換做文字,巷、弄、門牌號碼 sī 用全型數字,攏需要前處理,處理好勢才會當匯入。
地址資料-用文字編輯器處理
Regex
行政區對代碼轉換變成文字
全型數字轉換變成半型數字
分開處理無路名地名地址 kah 有路名地址
合併路巷弄
分離號樓之幾
鬥出完整地址 (台中無)
前面提及代碼轉為用文字書寫 ê 行政區,猶閣全型數字變半型,閣有政府端資料道路、巷、弄 sī 分開 ê 欄位,毋過到 OpenStreetMap 都是用一个欄位無分。政府釋出資料號樓附註的都同一欄位,毋過 tī OpenStreetMap 遮你愛分開欄位。而且為著作業方便,mā ài kā 無路名 ê 地址分開,閣另外開檔案處理。地址 sī 人類會當讀 ê,mā 保留完整中文格式地址,供人類來檢閱使用。
地址資料-縣市別
六都:臺北市、臺中市、桃園市、臺南市、高雄市
省轄市:新竹市
縣:臺東縣、苗栗縣、雲林縣
上新咧處理 ê 所在:新北市
全型數字
罕用字地名
特殊門牌型式
揣出來落勾 ê 道路名號
OSM-Fr ê 問候
台灣上懸高樓台北101 ê 地址點位
大群館/凱旋苑 99个門牌
門牌整編
88風災滅村 ê 小林村
其他匯入資料
AED
ETC 門柱
消防栓
i郵箱
等待處理:變電箱、街燈、電火柱
遮 sī 阮 ê 連絡方式,嘛 ū 社群 ê Facebook 社團連結。To-siā, sṳ̀n-mùng-ǹ! Thank you!
Resume presentation
開放資料甘苦談:匯入地址到OpenStreetMap 2024年篇 slide: https://hackmd.io/@osm-tw/HyTFguS_0 CC-BY-4.0 OpenStreetMap Taiwan Community 台灣開放街圖社群 逐家好,閣來到 COSCUP 大會來分享 – ah,對逐家分享 OpenStreetMap 社群 tī 台灣 ê 跤跡,其中上要緊 ê sī kah 政府開放資料 ê 關聯,濟个城市 ê 地址點位匯入工課。進前 ū tī g0v Summit 2024 年講過匯入開放資料,今仔日主要 sī 講地址 ê 部份。
{"description":"View the slide with \"Slide Mode\".","contributors":"[{\"id\":\"6d29f5f5-3da6-40f2-b920-e9a4cc2181dd\",\"add\":23504,\"del\":8519}]","title":"開放資料甘苦談:匯入地址到OpenStreetMap 2024年篇"}