## OpenStreetMap 佮 Wikidata,敢會當整理台灣所有溪流資料
COSCUP 2021 開放內容議程軌 7/31
台灣維基協會 陳瑞霖
<!-- Put the link to this slide here so people can follow -->
slide: [https://hackmd.io/84wLiKz-TpCrm3sd65bo-Q](https://hackmd.io/d017K1UJTai0QR7s8Jr2bw)
![](https://upload.wikimedia.org/wikipedia/commons/thumb/c/c5/WdOsm-semanticBridge.jpg/640px-WdOsm-semanticBridge.jpg)
Note:
逐家好,我是陳瑞霖,是OpenStreetMap 佮 Wikidata 社群的參與者,今仔日紹介欲按怎用 OpenStreetMap 佮 Wikidata,共台灣溪流資料整理好勢
---
## 我是啥人?
- Supaplex
- OpenStreetMap :heart: Wikidata :heart:
- Wikimedia Taiwan :cat:
Note:
線頂活動的名號是 Supaplex,是台灣維基協會的理事,參與台灣OpenStreetMap 佮 Wikidata的社群
---
## 台語腔口差
* 近溪炊魚
* 雞排,豬跤,皮鞋
* 臺大病院
* 個人較倚泉州話的同安腔
Note:
代先來紹介台灣的腔口,第一逝這四字欲按怎讀?我台北人是唸 kūn khue tshe hû,南部這馬的普通腔,漳州腔是唸 kīn khe tshue hî,我其中一爿的祖先是安溪來的,是唸 kīrn khere tsher hîr
第二逝食的物件佮日用品我唸 kue-pâi 佮 tu-kha
第三是第五調的變調,tâi-tāi pīnn-īnn 5 變 3,普通腔是 tâi-tāi pēnn-īnn 5 變 7
---
## 溪流的語言
* 台語的水體用詞:江,溪(khue,khe,khere),港,溝,坑(khinn/khenn)
* 河是受著華語影響的詞:基隆河,淡水河
* 上古漢語***水***是溪流的意思,甚至水是專門講***黃河***,例:漢水、渭水、漳水
* 江可能是對南亞語系來的,例:湄公河(Mekong),後尾的河是傳到漢語區加添的後綴
Note:
閣來講溪流的語言
台語遮時常看著江,溪(khue,khe,khere),溝,坑(khinn/khenn)
這馬逐家知影的河,是受著華語影響來的:雞籠河,淡水河
古早時代的上古漢語***水***是溪流的意思,甚至上早是專門講***黃河***的,後來變成溪流的通稱,舉一个例:漢水,渭水(uī-tsuí),河伯獻祭的漳水
江這字可能是對南亞語系來的,舉例:湄公河(Mekong),後尾的河是傳到漢語區加添的後綴(āu-tuat)
----
## 溪流的語言
* 港墘,埤
* 溪流:khue-lâu, khue-liû
* 地號名:碧潭、溪洲(四界攏有)、深坑、平溪、大坑、小坑、坑口、溪湖、溪頭、雙溪口、鹿角坑、潭仔墘、楠仔坑、三角湧、五叉水路、五股坑、水堀頭、和尚洲、礁溪、靈潭陂
* 溪流:頭前溪,濁水(lô-tsuí)溪,清水溪,淡江,中港(中港溪),南勢溪,北勢溪
Note:
咱轉阮較熟的台灣,來看覓台灣佮水有關係的名號,臺北有港墘站,意思是溪岸。
溪流嘛有唸做khue-liû
地號名有深坑,四界攏有的溪洲,臺北公館遮嘛有
溪流名有真台語氣的頭前溪,無標示音真濟人袂曉唸的濁水溪,苗栗遐的中港溪唸中港較有台語氣口(khuì-kháu)的,已經是溪的意思
---
## 台灣溪流的狀況
* 長度短短的
* 懸低差真濟
* 有真明顯的水量差別,雨季水大港,焦季會使焦溪面駛車
* 欠水的問題
* 流經過市內的溪流有真嚴重的汙染問題
Note:
長度短短的 (tér-tér)
對山遐到海口懸低差真濟
水量嘛差真濟,雨季水大港,焦季會使焦溪面駛車
南部有欠水的問題
流經過市內的溪流有真嚴重的汙染(u-liám)問題
---
## 台灣有幾條清水溪?
* 濁水溪流域至少有兩條
* 北部嘛有
* 東部嘛有
* 計共 11 條
Note:
有人會當共我講佗位有清水溪?
北部的金山,東部的小清水、大清水
濁水溪有兩條支流叫清水溪
計共 11 條
----
## 溪流的重名問題
* 愛知影𪜶地理空間佇佗位
* 詳細的中介資料:佇佗一个縣市,溪頭的位
* 予逐个溪流攏愛有編號
Note:
到底遮的溪流佇佗位
愛有祥細的中介資料
上好是逐條溪流有唯一的編號
---
## 這條溪流佇佗位?
欲探討溪流的問題,第一步就是愛有溪流資料
* 看地圖-Google地圖
* 查維基百科
Note:
查溪流資料,看地圖,查維基百科
----
## Google 地圖
[Google 地圖-淡水河](https://www.google.com.tw/maps/place/%E6%B7%A1%E6%B0%B4%E6%B2%B3/@25.1154325,121.3869898,12z/data=!3m1!4b1!4m5!3m4!1s0x3442a5247f16a793:0x1d2228e30425e34a!8m2!3d25.1117431!4d121.4581599)
無線型資料
![](https://i.imgur.com/YGsBEpn.jpg)
Note:
逐家攏知的 Google 地圖,毋過干焦有基本資料,無線型資料
----
## Google 地圖
搜尋資料
![](https://i.imgur.com/jiQHorg.png)
Note:
Google 地圖整合 Google Search 搜查,有出現維基百科佮官衙的資料
----
## 國土測繪中心
[通用版電子地圖](https://maps.nlsc.gov.tw/T09/mobilemap.action)
![](https://i.imgur.com/ZRO73c4.png)
Note:
通用版電子地圖無啥人知影,是官方出的地圖,嘛會當參考
----
## 維基百科
維基百科 :[台灣河流列表](https://zh.wikipedia.org/wiki/%E8%87%BA%E7%81%A3%E6%B2%B3%E6%B5%81%E5%88%97%E8%A1%A8)
![](https://i.imgur.com/JcBqus8.png)
Note:
維基百科有台灣溪流的清單,毋過毋是逐个攏有條目,無條目的溪流干焦有簡單佇咧佗一个鄉鎮市區的資料
---
## 政府的資料
* 河川代碼清單
* 國土測繪中心的通用版電子地圖 (WMTS)
Note:
拄仔有提起河川代碼和通用版地圖,猶閣有經建版地圖,毋過傷舊的,和現代地貌差誠濟
---
## 政府有河川代碼,猶毋過有一寡問題
1. 無收錄台灣所有溪流,干焦有大港的溪佮大港溪流的重要支流(tsi-liû),嘛無溪仔的資料
2. 較大港的溪才有 GIS 檔案,一般人是無法度提著普通的溪仔的 GIS 資料
3. 有一寡溪無完整的描述的中介資料
Note:
官方的資料問題,干焦大港的溪流,佮大港溪流的支流(tsi-liû, 分流(pun-lâu),嘛無溪仔的資料
較大港,官府有整治的溪流有 GIS 檔案,小溪仔無資料,一般人嘛無法度提著 GIS 資料
有一寡溪無完整的描述中介資料,抑是無開放予一般人看
---
## 公家、社群欲來解決難題
* 公私合力的機制,OpenStreetMap 和 Wikidata 社群佮官府的合作
* 官方有資源有長期的人力
* 毋過較無法度知影一般人關心的代誌
* 社群有各種較新的作法,親像逐家參與的線頂共編機制的資料庫
* 線頂資料庫Wikidata、OpenStreetMap有基金會維持會當長期存在
* 毋過在地社群較無法度長期投入
Note:
公家(Kong-ka),社群入來共同處理猶未處理的代
各有各的長處,官方有人力,有資源
民間有較活,較新的做法
親像講共共編平台提來用,OpenStreetMap 佮 Wikidata
毋過社群流動性較懸,無法度長期投入
---
## 各資料庫收的資料
* OpenStreetMap: 有河川代碼、Wikidata QID
** 長度、各種語言名號、支流(爸仔囝關係)、Wikipedia 連結
* Wikidata: 有河川代碼、OpenStreetMap 關係編號
** 長度、各種語言名號、溪頭、海口、支流(屬性)、其他的資料庫編號 (GNS, Geonames)、Wikipedia 連結
* 官方溪流資料:河川代碼、Wikidata、OpenStreetMap ID (未來)
Note:
OpenStreetMap會當寫入河川代碼,Wikidata編號,攏總的長度,各種的語言名號,支流(爸仔囝關係)
----
## OpenStreetMap, Wikidata 的特性紹介
* 維基百科姊妹的計畫
* 線頂資料庫,群眾共同編輯的開放資料庫
** Wikidata: 予程式看的百科
** OpenStreetMap: 受著維基百科影響的線頂地理資料庫
* 會當國際化嘛會當在地化
** 英文名號,日文名號,Latin
** 台語(漢字,白話字,台羅),客語(白話字,客拼,漢字)
* 程式會當處理
Note:
咱來總結(tsóng-kiat)兩个計畫的特點:會當共同編輯,攏是受著維基百科影響成立的
書寫國際化,在地的記持
OpenStreetMap 佮 Wikidata 攏是線頂的資料庫,會當收無仝的語言,不論是在庄稱呼抑是外國語名號
英文,日文,Latin, 台語,台語無仝的寫法,客家話,白話字,客拼,漢字
真重要的一點是程式會當處理,嘛會當予逐家來共同編輯(編輯)
---
## openstreetmap.org
* https://www.openstreetmap.org
* OSM, osm.org
* 中文:開放街圖
* 2004成立,後來以英國NGO型式管理大家共編圖資
* 社群共編的網路地圖
* 維基百科版本的地圖
* 使用OSM的網站:Foursquare、Wikimedia、 Apple Photo、Facebook、Pokemon Go、實價登錄網站、台北市土壤潛勢地圖
Note:
OSM,中文翻譯做開放街圖,2004年成立的,後來佇英國成立基金會(脫歐後想欲搬到歐盟)
這是社群共同編輯的網路地圖,這馬有真濟商業網站佮政府網站用,親像Foursquare、Wikimedia、 Apple Photo、Facebook、Pokemon Go、實價登錄(si̍t-kè ting-lo̍k)地圖、台北市土壤潛勢地圖(tsiâm-sè tuē-tôo)
----
## 資料格式
![OSM data structure](https://i.imgur.com/mUI2wqw.png)
* 點:實際帶有經緯度資訊的部分
* 線、區域:線段或構成封閉區域
* 關聯:多個線段或點的集合,可構成公車路線、行政邊界、溪流流域
Note:
資料格式(keh-sik)方面,OSM的資料結構,有點,有線,猶閣有較特殊的關聯,通常是用來標示公車路線,行政區邊界,溪流流域
----
## 原始資料
![OSM XML](https://i.imgur.com/huvIwIs.png)
Note:
OSM xml 資料是生做按呢的款
----
## wikidata.org
* 中文:維基數據
* 2012 成立
* 德國維基分會起頭,得著 Google 大力支持
* 目標是成為所有人類知識的典藏庫
* 2019年佇臺灣開始有愈來愈濟人關注
Note:
中文叫維基數據, 2012年成立的,𪜶是德國分會靠 Google 資源大力(tuā-la̍t)來做的
目標是成為所有人類知識的典藏庫
2019年台灣開始愈來愈濟人關注
----
## Wikidata 的資料結構
![](https://upload.wikimedia.org/wikipedia/commons/thumb/e/e7/Datamodel_in_Wikidata_zh-hant.svg/640px-Datamodel_in_Wikidata_zh-hant.svg.png)
Note:
Wikidata是用三段論的方式來收人類的智識,嘛有注意愛收資料來源
英國作家Douglas Adams 來講,伊是人,是劍橋(kiàm-kiô)大學出業的,嘛有記錄遮的聲稱的文獻來源
---
## 社群的力量
* OSM 700 萬个口座
* Wikidata 499萬个口座
* OSM 點 65 億, 線接近 5 億, 關係 873 萬
* Wikidata 9,400萬个項目
時間:2021-06-19
Note:
OSM 700 萬个口座
Wikidata 499萬个口座
資料方面,OSM 點 65 億, 線近 5 億, 關係 873 萬
Wikidata 9,400萬个項目
----
## 想欲知影的代誌
* 佇山區的溪流的溪頭位置
* 平埔這爿溪尾佇佗位
* 上尾溪流流入大海的海口位置
* 有基本的資料,下一步才會當關心溪流的水質問題、規劃親水空間
Note:
對一條溪流,阮欲知影溪頭的位,溪尾海口佇佗位
有遮的資料,才會當進一步關心溪流的水質(tsuí-tsit)的問題,規劃予人的親水空間
---
## LASS 社群
* 空氣盒子的推手
* 近期重心轉到水質資料
* 打算先推行頭前溪佮鱉溪的示範計劃
* LASS 佮官方的人鬥陣去實察頭前溪,確定各支流的溪口的位置
Note:
LASS因為空氣盒仔所以予人注意,這改欲來處理溪流的資料,先對頭前溪來做,佮官方的人來確定官方文書記錄的支流流入主流的位是著的
----
##
![](https://i.imgur.com/Oa27vd0.png)
[天下雜誌訪問 LASS連結](https://www.cw.com.tw/article/5115243)
Note:
天下雜誌網站的文章,講到政府有濟濟單位,真簡單會變成管家己的代爾爾,失去跨部門合作的能力。政府有真濟公務員,嘛有咧做代誌,毋過權責分明,親像水保局佮溪流有關係,是管流入去溪流進前山坡地的水,一般人是毋捌
----
## 開會、實地參訪佮調查
![](https://i.imgur.com/jL07dPx.png)
([連結](https://www.facebook.com/groups/LASSnet/posts/2825612554356003/))
Note:
* LASS瞭解政府會當作的代誌,猶閣有限制
* 瞭解各單位是按怎知影水的資料:親像講測量(tshik-liông)站
* 實地看支流流入去主流的溪口位置,比對官方資料
---
## Wikidata, OpenStreetMap 具體的作法
* 共三方資料串聯
* Wikidata 會當串聯OSM, 河川代碼,猶閣有GNS、 geoname
* OSM 串聯 Wikidata、河川代碼
* 社群佮官方的合作,運用社群的活力,官方的權威性,推動溪流資料的標準化
* 佇Open Data網站官方有收 Wikidata QID 編號
Note:
共官府,Wikidata,OpenStreetMap 三方的資料鬥起來
Wikidata 會當串聯OSM, 河川代碼,猶閣有GNS、 geoname
OSM 串聯 Wikidata、河川代碼
社群佮官方的合作,運用社群的活力,官方的權威性,推動溪流資料的標準化
佇Open Data網站官方河川代碼表有收 Wikidata QID 編號
---
## OSM 溪流資料列表
* Overpass Query [表格資料](https://overpass-turbo.eu/s/197C)、[Google 試算表版本](https://docs.google.com/spreadsheets/d/1IOkECHL7Dnp3rrX-uCMKYqRPGFl0UXgDf3tGaKWj3j8/edit#gid=181957460)
![](https://i.imgur.com/InLoWvp.png)
Note:
目前OpenStreetMap遮已經共有河川代碼的溪流對應好勢矣,計共 1500偌條溪流
----
## OSM 溪流的資料
淡水河流域 polygon 資料
![JOSM River Relation](https://i.imgur.com/L3o35Z9.png)
Note:
這是淡水河流域的 polygon 資料,OpenStreetMap 有真好再利用的地理資料
----
## 進階檢索
流入臺灣海峽抑是太平洋的溪流
* [Overpass Query](https://overpass-turbo.eu/s/197L)
![](https://i.imgur.com/Bx4b0oJ.png)
Note:
data mining 來看覓台灣溪流的狀況
----
## 溪流的編輯
![OSM iD edit](https://i.imgur.com/9cfXGk2.png)
Note:
會當加各種的資料,編號,維基百科,Wikidata
----
## 溪流編輯
![OSM iD edit name](https://i.imgur.com/ZcKc47I.png)
Note:
OpenStreetMap內底編輯名稱的所在,會當加各種語言名稱
----
## 溪流編輯-溪流中間線
![](https://i.imgur.com/py7JBYF.png)
Note:
OpenStreetMap 遮的溪流資料用中間線代表溪流,有較闊的溪流會當畫水面
---
## Wikidata 溪流資料-名號
![](https://i.imgur.com/EsAQQP2.png)
Note:
Wikidata 有濟語言的能力,毋但收通行語,嘛有外國語英文,猶有在庄的語言名號
----
## Wikidata 溪流資料-位置
![](https://i.imgur.com/smWOciW.png)
Note:
位置(uī-tì)
Wikidata 會當收溪流海口,溪頭的經緯度(King-uī-tōo)資料
----
## Wikidata 溪流資料-編碼
![](https://i.imgur.com/cfTP4H5.png)
Note:
大部份的代碼對地理資料庫來的,小數是政府開放資料遐的編碼
----
## Wikidata Query Service
* [Query Link](https://query.wikidata.org/sparql?query=%23Rivers%20Taiwan%0ASELECT%20DISTINCT%20%3FplaceLabel%20%3Fref%20%3Friver%20%3FriverLabel%20%3Flocation%20%3Fopenstreetmap%20%3FGNS%20%3FGeoNames%20%20WHERE%20%7B%0A%20%20%3Friver%20(wdt%3AP31%2F(wdt%3AP279*))%20wd%3AQ355304%3B%0A%20%20%20%20wdt%3AP17%20wd%3AQ865.%0A%20%20OPTIONAL%20%7B%20%3Friver%20wdt%3AP131%20%3Fplace.%20%7D%20%20%0A%20%20OPTIONAL%20%7B%20%3Friver%20wdt%3AP9170%20%3Fref.%20%7D%0A%20%20OPTIONAL%20%7B%20%3Friver%20wdt%3AP625%20%3Flocation.%20%7D%0A%20%20OPTIONAL%20%7B%20%3Friver%20wdt%3AP402%20%3Fopenstreetmap.%20%7D%0A%20%20OPTIONAL%20%7B%20%3Friver%20wdt%3AP2326%20%3FGNS.%20%7D%0A%20%20OPTIONAL%20%7B%20%3Friver%20wdt%3AP1566%20%3FGeoNames.%20%7D%0A%20%20SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22zh-tw%2Czh-tw%2Czh%2Cen%2Cnan%22.%20%7D%0A%0A%7D)
* 1636條(包括人工水體)
![](https://i.imgur.com/RLbs3rk.png)
Note:
Wikidata Query Link,計共有1636條,其中有包括人工的水體,發現講猶有真濟溪流猶未畫到 OpenStreetMap 資料庫內底
---
## 未來計劃
* Wikidata 遐加上 OSM 關聯 ID
* Geonames 地名整合
** 對宿霧語維基補 Geonames 的資料
* 本土語言的標示,如台灣台語、台灣客語
** 要照歷史名稱猶是漢語拼音
** 例:淡水河 Tamsui He Vs Danshui He
* 國際化標示英語以及英語描述
Note:
未來的計劃佇 Wikidata 遐愛加添 OSM 對應的關聯資料,這馬是有猶未共 OSM 建好的關聯加著 Wikidata 項目遐
國際上有一个地理資料庫叫 Geonames,嘛會當加添入來
各種語言,毋但本土的台灣台語,台灣客家話,猶閣有英語方便國外阿啄仔看
---
## OSM x Wikidata 月聚
* 8/9 19:30 @摩茲工寮
* Facebook [OpenStreetMap台灣](https://www.facebook.com/groups/OpenStreetMap.TW/)
Note:
工商服務時間, 8月初9希望會解封降級(kàng-kip),防疫第二級會當佇 Moz 工寮聚會,毋過無法度就繼續線頂虛擬聚會
---
## 謝謝! :sheep:
Q&A:[slido.com #727 289](https://wall.sli.do/event/wvkdbhrw)
你會當佇遮的管道揣著我:
- [GitHub](https://github.com/Supaplextw/)
- Supaplex: [Wikidata](https://wikidata.org/wiki/User:Supaplex),[OpenStreetMap](https://www.openstreetmap.org/user/Supaplex)
- 抑是 [email](mailto:dennis@wikimedia.tw) 我
* 面書 [Wikidata Taiwan](https://www.facebook.com/groups/2212207218990971/)、[OpenStreetMap台灣](https://www.facebook.com/groups/OpenStreetMap.TW/)
Note:
提供聯絡訊,歡迎來揣我
{"metaMigratedAt":"2023-06-16T02:45:01.074Z","metaMigratedFrom":"YAML","title":"OpenStreetMap 佮 Wikidata,敢會當整理台灣所有溪流資料","breaks":"true","description":"View the slide with \"Slide Mode\".","slideOptions":"{\"spotlight\":{\"enabled\":true}}","contributors":"[{\"id\":\"6d29f5f5-3da6-40f2-b920-e9a4cc2181dd\",\"add\":18391,\"del\":7923}]"}