# <font color="#000000">OpenStreetMap 佮 Wikidata 資料標準化的過程-溪流佮村里的例</font>
<!-- Put the link to this slide here so people can follow -->
<font color="#000000">slide: [https://hackmd.io/@osm-tw/rJ61y7-O9#/](https://hackmd.io/@osm-tw/rJ61y7-O9#/)</font>
<!-- .slide: data-background="https://i.imgur.com/zIpva9R.jpg" -->
<font color="#000000">COSCUP 2022 陳瑞霖</font>
---
## 我是啥人?
- Supaplex
- OpenStreetMap :heart: Wikidata :heart:
- Wikimedia Taiwan :cat:
Note:
線頂活動的名號是 Supaplex,是台灣維基協會的理事,參與台灣OpenStreetMap 佮 Wikidata的社群
---
## 舊年村里、溪流佮墓仔埔的代
* COSCUP 2021: [OpenStreetMap 佮 Wikidata,敢會當整理台灣所有溪流資料](/d017K1UJTai0QR7s8Jr2bw)
* HOT Summit:[Using OpenStreetMap and Wikidata to arrange river data in Taiwan](https://hackmd.io/@osm-tw/ByEYs5kLY)
* Wikidata Con:[Using OpenStreetMap and Wikidata to arrange river data in Taiwan](https://hackmd.io/@wikidata-tw/rJZbfxYBF)
* 墓地資訊:[DRGPA 2021第五屆研究記錄亞太墓地研討會](/h1u4K9sZQViud0AP1nyK2Q)、[文化與自然地理記錄工作坊](/dn9E5hS4RXe7tD-_OlJsyw)
Note:
舊年有講溪流、墓仔埔、村里資料,今年愛來繼續講相關進展,是利用Wikidata佮OpenStreetMap平台來記錄。
---
## 2022 年的進展
* 更新村里的資料(Plantoid會解說)
* 閣較濟的溪流關係
Note:
2022年因為政府有行政區村里重劃,所以佇OpenStreetMap佮Wikidata,嘛愛更新資料,這部份是Plantoid彼場會來解說。溪流的溪仔部份佇OpenStreetMap建立關聯處理。
---
## 演講重點
* OpenStreetMap 佮 Wikidata
* 村里
* * 溪流
* 墓仔埔
---
## 新增加減少村里清單
連結:[https://wikidata.planetoid.info/?q=已建立鄉鎮條目](https://wikidata.planetoid.info/?q=%已建立鄉鎮條目)

Note:
Wikidata村里部份,咱有監視政府開放資料,看著有新个就建立佇Wikidata合OpenStreetMap
---
## 村里的部份
* 欲綴上新的政府資料
* 即時反應共畫佇 OpenStreetMap,基本資料加添佇 Wikidata
Note:
新增加佮刪除的資料愛綴會著。Wikidata 會使進前來添加,毋過OpenStreetMap遐愛生效才會當畫佇地圖頂懸。
---
## 溪流的部分
* 較細條的溪仔欠缺文獻
* OpenStreetMap 關聯編輯門檻懸
* 需要實地踏查
Note:
較細條的溪仔無資料,欠書面文件。OpenStreetMap 愛編輯關聯處理是較進階的,較困難的。有時嘛需要實體踏查。
---
## 較無人知的 OpenStreetMap 強項
* 高壓電塔
* 𬦰山山路
* 墓仔埔
* 迒資料庫連結:Wikidata、Wikipedia
* 濟語言標示:Tâi-gír、Ha̍k-ka-fa、原住民語言、英語
Note:
OpenStreetMap 比其他地圖,有較完整的高壓電塔、𬦰山路線,嘛有專門畫墓仔埔。
因為是網路計畫,會當連結頭前講過的 Wikidata,猶閣有Wikipedia。嘛有濟語言的結構,有人會曉台語、hakka-fa、原住民語言,英文、日文攏會當寫
----
## 魯地圖

Note:
佇臺灣OpenStreetMap上強的應用是𬦰山時看路欲按怎行,行程規劃等等,上出名的𬦰山地圖是魯地圖,有用著OpenStreetMap的資料
----
## 全台中正路
* http://overpass-turbo.eu/s/jby

Note:
OpenStreetMap 資料分析,會當揣特別的資料,親像講全臺灣的中正路。
----
## 高壓電線與變電所
http://overpass-turbo.eu/s/kpv

Note:
這幅圖是顯示高壓輸電線路佮途中的變電所
---
## Wikidata
* 程式會當讀的 Wikipedia
* 連接第三方資料庫-資料庫的資料庫
* 濟語言架構 - 國際語言英語、台灣台語、台灣客語
---
## 溪流資料列表

Note:
Overpass API 嘛會當輸出清單,顯示全臺灣的溪流,猶閣有連結的 Wikidata
---
## 南山公墓的維基百科
[](https://zh.wikipedia.org/wiki/%E8%87%BA%E5%8D%97%E5%8D%97%E5%B1%B1%E5%85%AC%E5%A2%93)
Note:
群眾編輯的維基百科,有南山公墓的文字描述佮圖片,無地理座標佮範圍
----
[OSM南山公墓](https://www.openstreetmap.org/relation/6564784)

Note:
OSM頂面的南山公墓
---
## 盤點台灣墓地資訊
* 國土測繪中心-國土利用調查成果圖
* 商業地圖:Google地圖,點抑是面
* 缺點:無法度(一鍵)提著向量資料、可能愛開錢
Note:
商業地圖有一寡,官方的國土利用調查成果
無法度直接利用,需要描圖
----
## 國土利用調查成果圖

Note:
完整毋過是無向量檔(要錢)
----
## 批次匯入墓仔埔到 Wikidata

Note:
佇Wikidata建立大臺北遮的墓仔埔資料,包括有予徙走變成其他用途
----
## 篩選墓仔埔的指令檔
```
osmium tags-filter taiwan-latest.osm.pbf wr/landuse=cemetery wr/amenity=grave_yard -o cemetery-areas.geojson
```
Note:
用osmium來對OpenStreetMap的原始資料,篩出所有的墓仔埔
---
## 揣出墓仔埔相關的屬性
```
osmium tags-count 20220531/cemetery.osm.pbf --output=20220531/cemetery-stat.txt
```
Note:
osmium嘛會當篩出用著的標籤
---
## 墓仔埔相關的標籤

Note:
上濟是名號,猶閣有宗教,有一寡有連結Wikidata,嘛有地址
---
## 揣墓仔埔的名號
```
osmium tags-count 20220531/cemetery.osm.pbf name=* --output=20220531/cemetery-name.txt
```
Note:
咱來分析臺灣各地的墓仔埔的名號
---
## 各地公立佮私人的墓仔埔

Note:
發見講有袂少的私人公司經營的私墓
---
## 標示墓仔埔的宗教派別
* 臺灣遮較無用宗教來分墓仔埔
* 有一寡基督教的墓仔埔
Note:
臺灣遮的公有墓仔埔是無宗教的,分析資料發見寫無著的所在,共名號寫入去墓仔埔所屬的宗教欄位
----
## 墓仔埔的宗教
```
osmium tags-count 20220531/cemetery.osm.pbf religion=* --output=20220531/cemetery-religion.txt
```
Note:
佇國外墓仔埔是附屬教堂的,臺灣嘛有廟抑是教會經營的墓
----

Note:
發見有一寡寫毋著的,共名號寫入去所屬宗教
---
## 挑戰
* 資料品質
* 基礎平台無美光燈,難吸引維護人力
* * 其他輔助的:[Mapillary](https://mapillary.com/app/)、Wiki Commons、維基百科
* 需要資源投入~~捐款~~、~~出人力~~
* 濟語言
Note:
咱做的代誌是基礎个,所以無啥Spotlight,嘛因為按呢較無法度吸引人來做。
頭前講過,OpenStreetMap佮Wikidata是較基礎的資料收集,,所以是較無吸引人來做。
所以需要人力以外,猶閣有其他計畫親像Wikipedia、Wiki Commons,需要捐款,捐資料,出人來投入。
濟語言是愛加強的所在,毋但是國際語言親像英語,嘛愛顧慮本土語言。
---
## 資料品質
* 並無嚴格的品管機制,靠事後的修正漸漸*倚靠* ([1](https://www.wikidata.org/wiki/Wikidata:Contribute), [2](https://www.openstreetmap.org/fixthemap))完善
* 資料品質,落差大,毋過有工具會當檢視整體資料狀況,糾出有問題資料閣予修正
Note:
資料品質的部份,貢獻者有無仝程度,資料會差較濟,愛靠事後修正。
----
## 整合的困境
* OpenStreetMap 佮 Wikidata 會當互相連結,嘛會連結第三方的資料庫,親像 GNS
* 愛對 OpenStreetMap 佮 Wikidata 攏有熟似才有才調處理,甚至是需要寫程式
* 資料品質,落差大,毋過有工具會當檢視整體資料狀況,揣出有問題的資料閣來修正
Note:
OpenStreetMap佮Wikidata會當互相建立連結,嘛會當連結第三方資料庫,親像GNS
仝時間愛處理OSM佮Wikidata愛有兩項的智識
看著別人編輯過的資料,有時的發見䆀資料,愛沓沓修正
---
## 濟語言
* 欠缺會當寫台灣台語、台灣客語的人
* 本土語言大眾不重視書面化
* 本土語言總體欠文獻
Note:
毋過這二个平台Wikidata佮OpenStreetMap欠華語以外的國家語言,台灣台語佮台灣客語。這二个語言因為長期無重視書面化,文獻嘛欠缺,予咱有真大的挑戰。
----
## 客家話
* 決定用佗幾套併音文字系統
* 無仝系統的代碼:白話字、客拼 etc
* 徵求會曉客家話的人
Note:
這張主要是想欲揣客人來鬥相共,來處理客話佇OpenStreetMap佮Wikidata的處理問題。
---
## 未來的計畫
* 辦理主題工作坊
* 共 OpenStreetMap 有的溪流加入去 Wikidata
* Wikidata 遐的溪流加添濟語言:臺灣台語、臺灣客語、原住民語言的名號
Note:
雖然是疫情關係,無啥人欲參加活動,希望會當舉行主題的工作坊,整理溪流、墓仔埔資料,嘛希望添加濟語言
---
## OSM x Wikidata 月聚
* 8/15 19:30 @摩茲工寮
* Facebook [OpenStreetMap台灣](https://www.facebook.com/groups/OpenStreetMap.TW/)
Note:
歡迎逐家來阮的聚會,逐個月佇MozSpace遮舉行
---
## 謝謝! :sheep:
- [GitHub](https://github.com/Supaplextw/)
- Supaplex: [Wikidata](https://wikidata.org/wiki/User:Supaplex),[OpenStreetMap](https://www.openstreetmap.org/user/Supaplex)
- 抑是 [email](mailto:dennis@wikimedia.tw) 我
- 面書社團 [Wikidata Taiwan](https://www.facebook.com/groups/2212207218990971/)、[OpenStreetMap台灣](https://www.facebook.com/groups/OpenStreetMap.TW/)
Note:
提供聯絡訊,歡迎來揣我
{"metaMigratedAt":"2023-06-17T01:52:43.985Z","metaMigratedFrom":"YAML","title":"OpenStreetMap 佮 Wikidata 資料標準化的過程-溪流佮村里的例","breaks":true,"description":"View the slide with \"Slide Mode\".","contributors":"[{\"id\":\"6d29f5f5-3da6-40f2-b920-e9a4cc2181dd\",\"add\":8632,\"del\":9921}]"}