<div style="display:flex; flex-direction:column;">
<div>
![](https://upload.wikimedia.org/wikipedia/commons/b/b0/Openstreetmap_logo.svg =200x) ![](https://wiki.openstreetmap.org/w/images/7/74/OSM-tw.svg =200x)
</div>
<div style="font-size:55%;padding:32px">
# 開放資料甘苦談:匯入地址到OpenStreetMap <br/>2024年篇
</div>
<!-- Put the link to this slide here so people can follow -->
<div style="font-size:16px;display:flex;background-color:rgb(157 195 145/0.5);padding:32px;justify-content:flex-end;">
<div style="flex-direction:column; text-align:left">
<div>slide: https://hackmd.io/@osm-tw/HyTFguS_0</div>
<div>CC-BY-4.0 OpenStreetMap Taiwan Community</div>
<div>台灣開放街圖社群</div>
</div>
</div>
</div>
Note:
逐家好,閣來到 COSCUP 大會來分享--ah,對逐家分享 OpenStreetMap 社群 tī 台灣 ê 跤跡,其中上要緊 ê sī kah 政府開放資料 ê 關聯,濟个城市 ê 地址點位匯入工課。進前 ū tī g0v Summit 2024 年講過匯入開放資料,今仔日主要 sī 講地址 ê 部份。
---
## 我是誰?
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
- [Supaplex](https://www.openstreetmap.org/user/Supaplex)
- [OpenStreetMap](https://www.openstreetmap.org) :heart: [Wikidata](https://www.wikidata.org) :heart:
- [Wikimedia Taiwan](https://meta.wikimedia.org/wiki/Wikimedia_Taiwan/zh) :cat:
Note:
我網路頂 ê ID sī Supaplex,ū 參與 OpenStreetMap kah Wikidata 專案,mā 是維基媒體協會理事長。
---
## 為何欲關注 OpenStreetMap?
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
* 受著維基百科 ê 啟發,維基式來產生地理資料
* OpenStreetMap sī 迒跨語言 ê 地理資料庫
* 允准各種國際化 ê 語言,嘛有在地在庄 ê 語言
* 能索引其他資料庫 ê 資料,比如:Wikidata
* OpenStreetMap ū 經緯度資訊,嘛是會當囥地理資料本身 ê 結構化資料
Note:
hō͘ 逐家一寡 OpenStreetMap ê 基本概念,受到維基百科影像了後成立 ê 地理資料共同編輯機制。所以會當迒語言、迒資料庫。地理資訊部分親像講位置 sī tī node 遮儲存 ê。
---
## [OpenStreetMap Taiwan(Q104641278)](https://www.wikidata.org/wiki/Q104641278) & [Wikidata Taiwan(Q65555605)](https://www.wikidata.org/wiki/Q65555605)
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
* OpenStreetMap Taiwan kah Wikidata Taiwan 共同tī 台北主辦 ê 月聚
* 成員 ū 互相重疊
* 主要 sī 監視變動,閣有制訂編輯指南
Note:
tī 遮拍廣告,逐個月 OpenStreetMap kah Wikidata Taiwan 社群 tī 台北摩茲工寮聚會。兩爿 ê成員互相重疊猶閣有仝 ê 精神,才ū 法度辦落去。聚會時段主要討論上新變動 kah 制訂編輯指南。
---
## 監控針對台灣資料 ê 破壞 - 中國「規劃」 ê 迒跨台灣海峽大橋
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
![](https://i.imgur.com/k8tRdw9.png =560x)
Note:
上譀 ê 例 sī 迒跨台灣海峽大橋,中國官方地圖會標示,毋過應該 sī 真困難 ê 代誌,愛付出真大 ê 資源 kah 時間,近期 mā sī 無可能 ê。
---
## 04/03 07:58:11 UTC+8 花蓮地動
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1e/04.03_%E5%89%AF%E7%B8%BD%E7%B5%B1%E5%89%8D%E5%BE%80%E8%8A%B1%E8%93%AE%E7%9E%AD%E8%A7%A3%E7%81%BD%E5%AE%B3%E6%83%85%E5%BD%A2%E5%8F%8A%E6%95%91%E6%8F%B4%E9%80%B2%E5%BA%A6_-_53629407644_%28cropped%29.jpg/905px-04.03_%E5%89%AF%E7%B8%BD%E7%B5%B1%E5%89%8D%E5%BE%80%E8%8A%B1%E8%93%AE%E7%9E%AD%E8%A7%A3%E7%81%BD%E5%AE%B3%E6%83%85%E5%BD%A2%E5%8F%8A%E6%95%91%E6%8F%B4%E9%80%B2%E5%BA%A6_-_53629407644_%28cropped%29.jpg" data-background-opacity="1.0"-->
<a href="https://commons.wikimedia.org/wiki/File:04.03_%E5%89%AF%E7%B8%BD%E7%B5%B1%E5%89%8D%E5%BE%80%E8%8A%B1%E8%93%AE%E7%9E%AD%E8%A7%A3%E7%81%BD%E5%AE%B3%E6%83%85%E5%BD%A2%E5%8F%8A%E6%95%91%E6%8F%B4%E9%80%B2%E5%BA%A6_-_53629407644_(cropped).jpg">總統府</a>, <a href="https://creativecommons.org/licenses/by/2.0">CC BY 2.0</a>, via Wikimedia Commons
Note:
地動 ê 關係有真濟其他國家 ê 人來關心。
---
## 花蓮地動 ê HOT 專案
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
<div style="display:inline-flex;align-items:center;gap:2rem;">
<div style="flex:1;text-align:left;font-size:80%;left">
* 中橫公路東段:[16508](https://tasks.hotosm.org/projects/16508)
* 蘇花公路:[16507](https://tasks.hotosm.org/projects/16507/)
* 花東縱谷北段,新城、秀林、花蓮、吉安、壽豐:[16505](https://tasks.hotosm.org/projects/16505)
</div>
<div style="flex:1;text-align:left;font-size:100%;left">
<div style="flex-direction:column; text-align:left">
![Tasking Manager](https://hackmd.io/_uploads/B1q67BhxR.png =2000x)
</div>
</div>
</div>
Note:
頭起先講近期 ê 代誌,社群申請 ê HOT Tasking Manager 權限會當用,會當 hō͘ 國際友人跨海鬥相共,ū 所在來畫地圖。
---
## 往過 ê 匯入經驗
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
<div style="display:inline-flex;align-items:center;gap:2rem;">
<div style="flex:1;text-align:left;font-size:80%;left">
* AED
* 避難收容所 - 資料精準度問題
* ETC 門柱
* i郵箱
* 地址
</div>
<div style="flex:1;text-align:left;font-size:80%;left">
* 村里界
* 飲水機
* 本土語言標示地名計畫
* 消防栓
<div style="flex-direction:column; text-align:left">
</div>
</div>
</div>
Note:
台灣遮 ū 處理過 AED、避難收容所、ETC 門柱、地址、村里界、啉水機、本土語言標示地名計畫、消防栓(sng)等等。
---
## 匯入避難收容所-null island
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
[![圖片](https://hackmd.io/_uploads/SJHttma-0.png)](https://www.openstreetmap.org/changeset/49185168#map=2/23.2/78.0)
Note:
政府捌釋出避難收容所 ê 資料,m̄-koh 資料量傷大,難免 ū 資料無寫位置,抑是寫毋著所在,其中 ū 幾十筆走到 0,0 位置,也就是一般講 null island ê 所在。
---
## 匯入避難收容所2-刪除台灣以外 ê 點位
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
[![圖片](https://hackmd.io/_uploads/r1yhtQ6b0.png)](https://www.openstreetmap.org/changeset/49183572#map=3/13.92/60.82)
Note:
所以國際社群 ê 里長伯,德國 ê 圖客就刣掉台灣以外地方 ê 避難收容所 ê 資料。tī 台灣 ê 社群成員無法度清理資料抑是核對資料,嘛干焦按呢做爾爾。
---
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
## 村里資料匯入
* 戶役政系統代碼 ê 主管機關改變
* 主計總處->戶政司
* 縣市整併轄下 ê 村里
* ex: 人口濟 ê 村里拆分
* 落尾寫程式監控資料
Note:
有時陣會變動,發見進前欲匯入 ê 時,主管機關 ū 改變,對主計總處變成戶政司,各縣市 ū 無定期整併 ia̍h-sī kā 人口濟 ê 村里拆開。
---
## 行政區 ê 關係網路分析
<div style="display:inline-flex;align-items:center;gap:2rem;">
<div style="flex:1;text-align:left;font-size:100%;left" >
![圖片](https://hackmd.io/_uploads/r1e-qUabR.png =600x)
</div>
<div style="flex:1;text-align:left;font-size:100%;left">
<div style="flex-direction:column; text-align:left">
![圖片](https://hackmd.io/_uploads/r1S4qLabC.png =350x)
</div>
</div>
</div>
Note:
這是中國彼爿 ê 人用關係網路工具分析台灣行政區 ê 關係網絡,ū 掠著怪怪 ê 母子關係,親像圖內底 ū 無下跤轄的里,抑是一个村里仝時嘛是另外村里 kah 鄉 ê 子關係。
---
## Ceb Wiki ljsbot 大量匯入溪流資料
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
[![](https://i.imgur.com/ZU69q1R.png)](https://www.vice.com/en/article/4agamm/the-worlds-second-largest-wikipedia-is-written-almost-entirely-by-one-bot)
Note:
Cebese Wikipedia 用機器人衝數量,沒有多少真人編輯,全世界皆知道。也造就台灣已經有大量 GNS 來的溪流資料,急需要與既有資料整合。
---
## 溪流資料狀況
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
<div style="display:inline-flex;align-items:center;gap:2rem;">
<div style="flex:1;text-align:left;font-size:60%;left" >
* 河川代碼遮 ê 溪流真少
* Wikidata(ceb)上真濟 GNS 來 ê 溪流
* NLSC 地圖 mā 收袂少溪流
* 社群敢袂花時間建立河川代碼清單外 ê 溪流?
</div>
<div style="flex:1;text-align:left;font-size:100%;left">
<div style="flex-direction:column; text-align:left">
![JOSM River Relation](https://i.imgur.com/L3o35Z9.png =600x)
</div>
</div>
</div>
Note:
政府開資源整治 ê 溪流流城,出現河川代碼,其實這个清單 ê 溪流,比並實際上 ê 溪流閣較少。造成毋但 sī OpenStreetMap 抑是 Wikidata,欲整理無 tī 河川代碼清冊 ê 溪流建立資料。
---
## 地址資料-台中頭起先
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
![Taichung GitHub](https://hackmd.io/_uploads/ry1fFsdKA.png)
[GitHub 臺中市門牌資料匯入作業](https://gist.github.com/typebrook/c03326c77541733045331183c46032c3)
Note:
當當時 typebrook進行的,伊主要用Linux,所以用 ê 家私 sī Linux 遐的命令列工具。
---
## 地址資料-號 ê 處理
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
![Facebook-discuss](https://hackmd.io/_uploads/SyMmci_KR.png)
Note:
ū 徵求欲按怎處理號 ê 問題,落尾決定保留。
---
## 地址資料-台中 ū WGS84 經緯度
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
[![Taichung](https://hackmd.io/_uploads/BywrXV6bA.png)](https://gist.github.com/typebrook/c03326c77541733045331183c46032c3?permalink_comment_id=3675141)
Note:
詳細詳細來講,地址資料 ê 處理。閣愛說多謝,感謝政府釋出(sek-chhut)資料,各縣市政府 mā 已經沓沓仔 kā 資料放出來--ah。社群這爿 mā 陸續處理變成 OpenStreetMap ê 格式(keh-sek),親像這幅圖會當看著政府端資料生做按呢,縣市、鄉鎮市區 sī 用戶役政系統代碼表示,愛家己轉換做文字,巷、弄、門牌號碼 sī 用全型數字,攏需要前處理,處理好勢才會當匯入。
---
## 地址資料-用文字編輯器處理
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
<div style="display:inline-flex;align-items:center;gap:2rem;">
<div style="flex:1;text-align:left;font-size:70%;left" >
1. Regex
2. 行政區對代碼轉換變成文字
3. 全型數字轉換變成半型數字
4. 分開處理無路名地名地址 kah 有路名地址
5. 合併路巷弄
6. 分離號樓之幾
7. 鬥出完整地址 (台中無)
</div>
<div style="flex:1;text-align:left;font-size:100%;left">
<div style="flex-direction:column; text-align:left">
![圖片](https://hackmd.io/_uploads/BJiVi4TbC.png =500x)
</div>
</div>
</div>
Note:
前面提及代碼轉為用文字書寫 ê 行政區,猶閣全型數字變半型,閣有政府端資料道路、巷、弄 sī 分開 ê 欄位,毋過到 OpenStreetMap 都是用一个欄位無分。政府釋出資料號樓附註的都同一欄位,毋過 tī OpenStreetMap 遮你愛分開欄位。而且為著作業方便,mā ài kā 無路名 ê 地址分開,閣另外開檔案處理。地址 sī 人類會當讀 ê,mā 保留完整中文格式地址,供人類來檢閱使用。
---
## 地址資料-縣市別
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
<div style="display:inline-flex;align-items:center;gap:2rem;">
<div style="flex:1;text-align:left;font-size:80%;left">
* 六都:臺北市、臺中市、桃園市、臺南市、高雄市
* 省轄市:新竹市
* 縣:臺東縣、苗栗縣、雲林縣
* 上新咧處理 ê 所在:新北市
</div>
<div style="flex:1;text-align:left;font-size:100%;left">
<div style="flex-direction:column; text-align:left">
![圖片](https://hackmd.io/_uploads/SkXcyrTW0.png)
</div>
</div>
</div>
Note:
目前六都除了新北市以外攏已經釋出地址,其中臺北市 ê 座標格式比較較奇怪,需要加偏移量處理。其他 ê 所在親像新竹市、臺東縣、苗栗縣、雲林縣都有釋出。若是 ū 釋出就會進行處理。
---
## 全型數字
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
![圖片](https://hackmd.io/_uploads/Bk-hMSpbA.png)
Note:
逐家閣來看覓全型數字 ê 狀況,主要 sī 門牌號碼需要 kā 全型數字轉換變成半型數字
---
## 罕用字地名
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
![圖片](https://hackmd.io/_uploads/S1vv3NpW0.png)
Note:
以早 ū 一段時間電腦 ū 所謂 ê 罕用字,經過多次轉換變成問號,愛一个一个手動查閱確認其用字,閣改做正確 ê 字。
---
## 特殊門牌型式
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
![圖片](https://hackmd.io/_uploads/BJ_jn4TWA.png)
Note:
tī 處理 ê 過程當中,知影戶政遮 ū 加添加註 ê 方式。處理的時愛知影這種情形,拄著去設計對應 ê 轉換方式。
---
## 揣出來落勾 ê 道路名號
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
![missing road](https://hackmd.io/_uploads/SyGVeH6-R.png)
Note:
透過外部家私 osmism,ū 完整 ê 地址資訊,足簡單會當看出無寫道路名稱 ê 狀況
---
## OSM-Fr ê 問候
![圖片](https://hackmd.io/_uploads/BJjYv3C_C.png)
Note:
短期間內 ū 大量資料產生,ū 地址點位所在 ê 巷弄名稱,所以ē曝露出有不少巷名猶未加添名號 ê 問題
---
## 台灣上懸高樓台北101 ê 地址點位
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
![Taipei 101](https://hackmd.io/_uploads/By-Q-STW0.png)
Note:
這爿 sī 台北101大樓所在 ê 地址,臺北市信義區信義路五段7號,每一層樓攏有地址點位。
---
## 大群館/凱旋苑 99个門牌
![凱旋苑](https://hackmd.io/_uploads/rJNZBkWY0.png)
Note:
2024年國民黨總統侯選人侯有宜 ê 大群館/凱旋苑切割門牌予學生稅厝 ê 風波,對資料面得到證實,目前 tī OpenStreetMap 頂懸就是一寡地址。
---
## 門牌整編
![台南沙崙](https://hackmd.io/_uploads/S1RjMyZY0.png)
Note:
原先 ê 無路名地址變成 ū 路名地址系統,這是台南高鐵站遐,歸仁沙崙遐 ê 門牌整編 ê 列表。
---
## 88風災滅村 ê 小林村
![小林村](https://hackmd.io/_uploads/SJQi-yZtA.png)
Note:
原來 ê 聚落地址猶咧政府 ê 資料集內底,無予移除。
---
## 其他匯入資料
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
<div style="background-color: purple;
color: white;
padding: 10px;
border: solid 3px #0F7391;
margin: 10px;">
* AED
* ETC 門柱
* 消防栓
* i郵箱
* 等待處理:變電箱、街燈、電火柱
</div>
Note:
AED、ETC 門柱(mn̂g-thiāu)、消防栓、i郵箱。待處理 ê ū 台電變電箱、街燈、電火柱(tiān-hóe-thiāu)
---
## [To-siā!](https://en.wiktionary.org/wiki/%E5%A4%9A%E8%AC%9D#Chinese) [sṳ̀n-mùng-ǹ!](https://en.wiktionary.org/wiki/%E6%89%BF%E8%92%99%E4%BD%A0) Thank you!
<!-- .slide: data-background="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Wikidatacon_2023_Banner_-_04.png/1024px-Wikidatacon_2023_Banner_-_04.png" data-background-opacity="0.5"-->
- :sheep: [GitHub](https://github.com/Supaplextw/)
- Supaplex: [Wikidata](https://wikidata.org/wiki/User:Supaplex),[OpenStreetMap](https://www.openstreetmap.org/user/Supaplex)
- Or [email](mailto:dennis@wikimedia.tw)
- Facebook group [Wikidata Taiwan](https://www.facebook.com/groups/2212207218990971/)、[OpenStreetMap Taiwan](https://www.facebook.com/groups/OpenStreetMap.TW/)
Note:
遮 sī 阮 ê 連絡方式,嘛 ū 社群 ê Facebook 社團連結。To-siā, sṳ̀n-mùng-ǹ! Thank you!
{"description":"View the slide with \"Slide Mode\".","contributors":"[{\"id\":\"6d29f5f5-3da6-40f2-b920-e9a4cc2181dd\",\"add\":23504,\"del\":8519}]","title":"開放資料甘苦談:匯入地址到OpenStreetMap 2024年篇"}