OpenStreetMap工作坊
slide: https://hackmd.io/@osm-tw/rkMFEZjPn
OpenStreetMap Taiwan 陳瑞霖
Ta̍k-ke hó, Hello everyone, This is Dennis Raylin Chen from Taiwan, I want to talk about cleaning and managing dataset. My speech's title is "Linking OpenStreetmap and Wikidata: Case study of Taiwan's villages and rivers datasets"
從反映地理實境的共編地圖 到跨資料庫鏈結 開放街圖的現在與未來
slide: https://hackmd.io/@osm-tw/SyKzgktpo
CC-BY-4.0 OpenStreetMap Taiwan Community
台灣開放街圖社群
為什麼要關注 OpenStreetMap
受維基百科啟發,維基式產生地理資料
OpenStreetMap 是跨語言的地理資料庫
允許國際化語言,也有在地化語言
能索引其他資料庫的資料,例如:Wikidata
OpenStreetMap 有經緯度資訊,也能存放地理資料本身的結構化資料
OSM 簡介
2004成立,後來以英國NGO型式管理大家共編圖資
社群共編的網路地圖
維基百科版本的地圖
使用OSM的網站:Foursquare、Wikimedia、 Apple Photo、Facebook、實價登錄網站、台北市土壤潛勢地圖
創辦人
英國人 Steve Coast
GIS 領域學生
當年英國OS Geodata太貴了
受到維基百科影響,決定創辦類似的地圖計畫,讓所有人都能貢獻圖資
勤跑各大Linux大會推廣
理念
開放街圖的三大特色
%%{init: {'theme':'forest'}}%%
graph LR;
1((開源 Open Source))-------2((開放 Open Data))-------3((協作 Collaboration))----1;
開源 Open Source
相關專案皆以軟體開源授權釋出
地圖編輯器 (iD、 JOSM)
地圖顯示器 (Mapnik 、 Leaflet)
資料伺服器使用開源軟體
(iD)
JOSM
原始資料
範例2 -國立臺北大學
amenity=university
name=國立臺北大學
name:nan=Kok-li̍p Tâi-pak Tāi-ha̍k
wikidata=Q707456
wikipedia=zh:國立臺北大學
使用情境 - 救災快速反應
災難後快速繪製地圖
Humanitarian OpenStreetMap Team
印度多語言地圖
線上互動地圖始祖-Google地圖
Google地圖圖資多,導航便利
Google地圖很好用
奠定線上地圖標準
人人很熟悉
工程師熟悉API
但是 …
$$$$
留信用卡資訊
Google Maps Platform
不論是否達收費標準,都需要留信用卡號
每千次API呼叫2~30美元
每月有200美元免費額度
網站擁有者初估收費漲1400%
Facebook!
Facebook 2015年開始使用OSM
Facebook使用OSM現況
回到 OpenStreetMap
很多企業為了逃離Google採用OSM
$$$$
避免用競爭對手的產品
Google地圖 Vs OpenStreetMap
一家整合多項服務 vs 眾多廠商組合的服務
Google包導航、街景、geocoding
老字號 vs 跟風維基概念的鄉民計劃
街景:Google街景 vs Mapillary, KartaView
Geocoding: Google API vs Nominatim
OSM 優勢
圖資採用 ODbL 開放資料庫授權
圖磚採用 Fair use,用量大請自行架伺服器或找廠商採商業方案
共同編輯,能容納被商業地圖忽略的不同類型資料
一份圖資,能夠弄出多樣的地圖
例如:消防設施、交通運輸、戶外運動、高壓電線
OSM Mapnik
自行車地圖
交通地圖
OpenInfraMap
災難繪圖
能夠快速反應繪製最新地圖,不被重視的地方
OpenStreetMap 現況
兩大 App
魯地圖
累積帳號 700 萬
累積資料量
時間:2021-03-03
線上描圖
編輯記錄
錯誤偵測
監控破壞與復原
** 可以靠 QA 工具如 OSMcha 來簡單找出來出來 **
OpenStreetMap 在台灣的長處
高壓電塔
登山路線
墓仔埔
跨資料庫:OpenStreetMap、Wikidata、Wikipedia
多語言:
臺灣閩南語/臺灣台語/臺灣話/Tai-gir/Hokien
Ha̍k-ka-fa/台灣客語/客家話
台灣南島民族語言/台灣原住民語言
相比其他商業地圖,OpenStreetMap 佇臺灣注重野外會當看著的物件,親像講高壓電塔、𬦰山路線,嘛有真濟墓仔埔。OpenStreetMap 是網路地圖,所以會當簡單連結線頂資源,親像 Wikidata 佮 Wikipedia。濟語言的嘛是加添臺灣的臺灣台語、臺灣 Hak-ka-fa、種種臺灣原住民語言攏會用得。當然外國人講的英文佮日語嘛是簡單加入。
Wikidata Taiwan 歷史
2014~2019:學術圈為主
2019:有些社群成員開始編輯,例如: OpenStreetMap x Wikidata 月聚
大量匯入法條、村里、學校、圖書館、劇集集別、政府出版品、論文
OpenStreetMap x Wikidata 月聚
OpenStreetMap 連結 Wikidata
溪流編輯
溪流編輯
水文資料來源
GNS、GeoNames
水利署公開文件
行政院公報
Wikidata、Wikipedia
區域排水整合型查詢系統
國土測繪中心通用版地圖
OpenStreetMap 這的 Wikidata 次級標籤
network=新北市區公車
新北市區公車939路線
台灣的村里
社群很早就開始處理了,在 OSM 共花了 4 年時間,Wikidata 集中在 2019 年
受到菲律賓社群 serv 的 Barangay 擬案啟發,欲來講台灣村里資料的處理故事
總數是 7,748
連結戶役政代碼、OSM 關係編號與 Wikidata QID
其實會來講臺灣村里的故事,是因為菲律賓社群的 Serv,伊會本名叫 Eugene,伊開始處理菲律賓的 Barangay,是菲律賓上小的行政單位。佇 OpenStreetMap 佮 Wikidata 建立村里,攏總開 4 年時間,計共 7,749 的村里處理好勢 (截至 2022 7/1),所有的村里連結戶役政系統代碼佮 Wikidata 編號。
OSM 村里視覺化
OSM 的村里
Wikidata 的村里
有失誤了
用到舊的,無維護的主計處資料集 (到 2018 而已)
沒有處理到 2018 年台南新整併的里
解決方式:用新的戶政司資料集
再次失誤啊
對 zh-min-nan 維基來的
Ceb Wiki - ljsbot
溪流的清單
Name Suggestion Index 是 2013 年 10 月開始的,附屬 OpenStreetMap 編輯器 iD 經營的,2019 年獨立出來。頭起先 NSI 是無人顧的 side project
跨語言,用 Wikidata 來做對應
目標是希望 OSM 這邊標示能夠標準化
台灣的常見商家
銀行
台灣銀行 - NSI 數量 175 個
學校資料特性
metadata 部分有 學校代碼 、地址、各語言名稱
Wikipedia, Wikidata, Wiki Commons
空間資料-OSM上有範圍
空間資料-Wikidata有收 經緯度
Wikidata 的國小
學校資料的挑戰
對 2019 年匯入了後,沒什麼更新
看新聞加新學校或是處理廢除的學校
整併日語維基百科那邊重複的資料
台灣公墓資料
OpenStreetMap 有相當高的繪製程度
Wikidata 上有雙北的資料
三峽的公墓
南山公墓的維基條目
結論 - 從圖徵到連結
實體點、線、面->網路連結
OSM 到連結第三方資料庫
例子:OSM 連結 Wikidata
OSM 的擴充:收錄 metadata、連結、編號
結論 - 維護資料
村里、學校資料維護的挑戰
建立資料/匯入(一次性粗暴進行)<->維護資料/資料比對(time comsuming and careful)
NSI 商家資料維護
資料應用:視覺化
結論 - 資料狀況
村里:監控戶政司資料 100% 完成
學校:一次性匯入後沒什麼更新
溪流:處理宿霧人的鍋
未來的計畫
主題工作坊
各種資料庫整理項目
多語言,像是台灣台語、臺灣客家話、臺灣原住民的語言
你可以在以下管道找到我
臉書社團 Wikidata Taiwan
臉書社團 OpenStreetMap台灣
OSM Wiki Taiwan
Resume presentation
OpenStreetMap工作坊 slide: https://hackmd.io/@osm-tw/rkMFEZjPn OpenStreetMap Taiwan 陳瑞霖 Ta̍k-ke hó, Hello everyone, This is Dennis Raylin Chen from Taiwan, I want to talk about cleaning and managing dataset. My speech's title is "Linking OpenStreetmap and Wikidata: Case study of Taiwan's villages and rivers datasets"
{"metaMigratedAt":"2023-06-17T10:15:14.103Z","metaMigratedFrom":"YAML","title":"OpenStreetMap Workshop","breaks":true,"description":"View the slide with \"Slide Mode\".","contributors":"[{\"id\":\"6d29f5f5-3da6-40f2-b920-e9a4cc2181dd\",\"add\":22271,\"del\":125}]"}