# <font color="#000000">OpenStreetMap 佮 Wikidata 資料標準化的過程-溪流佮村里的例</font> <!-- Put the link to this slide here so people can follow --> <font color="#000000">slide: [https://hackmd.io/@osm-tw/rJ61y7-O9#/](https://hackmd.io/@osm-tw/rJ61y7-O9#/)</font> <!-- .slide: data-background="https://i.imgur.com/zIpva9R.jpg" --> <font color="#000000">COSCUP 2022 陳瑞霖</font> --- ## 我是啥人? - Supaplex - OpenStreetMap :heart: Wikidata :heart: - Wikimedia Taiwan :cat: Note: 線頂活動的名號是 Supaplex,是台灣維基協會的理事,參與台灣OpenStreetMap 佮 Wikidata的社群 --- ## 舊年村里、溪流佮墓仔埔的代 * COSCUP 2021: [OpenStreetMap 佮 Wikidata,敢會當整理台灣所有溪流資料](/d017K1UJTai0QR7s8Jr2bw) * HOT Summit:[Using OpenStreetMap and Wikidata to arrange river data in Taiwan](https://hackmd.io/@osm-tw/ByEYs5kLY) * Wikidata Con:[Using OpenStreetMap and Wikidata to arrange river data in Taiwan](https://hackmd.io/@wikidata-tw/rJZbfxYBF) * 墓地資訊:[DRGPA 2021第五屆研究記錄亞太墓地研討會](/h1u4K9sZQViud0AP1nyK2Q)、[文化與自然地理記錄工作坊](/dn9E5hS4RXe7tD-_OlJsyw) Note: 舊年有講溪流、墓仔埔、村里資料,今年愛來繼續講相關進展,是利用Wikidata佮OpenStreetMap平台來記錄。 --- ## 2022 年的進展 * 更新村里的資料(Plantoid會解說) * 閣較濟的溪流關係 Note: 2022年因為政府有行政區村里重劃,所以佇OpenStreetMap佮Wikidata,嘛愛更新資料,這部份是Plantoid彼場會來解說。溪流的溪仔部份佇OpenStreetMap建立關聯處理。 --- ## 演講重點 * OpenStreetMap 佮 Wikidata * 村里 * * 溪流 * 墓仔埔 --- ## 新增加減少村里清單 連結:[https://wikidata.planetoid.info/?q=已建立鄉鎮條目](https://wikidata.planetoid.info/?q=%已建立鄉鎮條目) ![](https://i.imgur.com/rAxjSeN.png) Note: Wikidata村里部份,咱有監視政府開放資料,看著有新个就建立佇Wikidata合OpenStreetMap --- ## 村里的部份 * 欲綴上新的政府資料 * 即時反應共畫佇 OpenStreetMap,基本資料加添佇 Wikidata Note: 新增加佮刪除的資料愛綴會著。Wikidata 會使進前來添加,毋過OpenStreetMap遐愛生效才會當畫佇地圖頂懸。 --- ## 溪流的部分 * 較細條的溪仔欠缺文獻 * OpenStreetMap 關聯編輯門檻懸 * 需要實地踏查 Note: 較細條的溪仔無資料,欠書面文件。OpenStreetMap 愛編輯關聯處理是較進階的,較困難的。有時嘛需要實體踏查。 --- ## 較無人知的 OpenStreetMap 強項 * 高壓電塔 * 𬦰山山路 * 墓仔埔 * 迒資料庫連結:Wikidata、Wikipedia * 濟語言標示:Tâi-gír、Ha̍k-ka-fa、原住民語言、英語 Note: OpenStreetMap 比其他地圖,有較完整的高壓電塔、𬦰山路線,嘛有專門畫墓仔埔。 因為是網路計畫,會當連結頭前講過的 Wikidata,猶閣有Wikipedia。嘛有濟語言的結構,有人會曉台語、hakka-fa、原住民語言,英文、日文攏會當寫 ---- ## 魯地圖 ![](https://i.imgur.com/cWWpitq.jpg) Note: 佇臺灣OpenStreetMap上強的應用是𬦰山時看路欲按怎行,行程規劃等等,上出名的𬦰山地圖是魯地圖,有用著OpenStreetMap的資料 ---- ## 全台中正路 * http://overpass-turbo.eu/s/jby ![](https://i.imgur.com/28Qm35t.png) Note: OpenStreetMap 資料分析,會當揣特別的資料,親像講全臺灣的中正路。 ---- ## 高壓電線與變電所 http://overpass-turbo.eu/s/kpv ![](https://i.imgur.com/14dvGkO.png) Note: 這幅圖是顯示高壓輸電線路佮途中的變電所 --- ## Wikidata * 程式會當讀的 Wikipedia * 連接第三方資料庫-資料庫的資料庫 * 濟語言架構 - 國際語言英語、台灣台語、台灣客語 --- ## 溪流資料列表 ![](https://i.imgur.com/InLoWvp.png) Note: Overpass API 嘛會當輸出清單,顯示全臺灣的溪流,猶閣有連結的 Wikidata --- ## 南山公墓的維基百科 [![南山公墓維基百科](https://i.imgur.com/7LyZnHQ.png)](https://zh.wikipedia.org/wiki/%E8%87%BA%E5%8D%97%E5%8D%97%E5%B1%B1%E5%85%AC%E5%A2%93) Note: 群眾編輯的維基百科,有南山公墓的文字描述佮圖片,無地理座標佮範圍 ---- [OSM南山公墓](https://www.openstreetmap.org/relation/6564784) ![OSM南山公墓](https://i.imgur.com/kpH3z1f.png) Note: OSM頂面的南山公墓 --- ## 盤點台灣墓地資訊 * 國土測繪中心-國土利用調查成果圖 * 商業地圖:Google地圖,點抑是面 * 缺點:無法度(一鍵)提著向量資料、可能愛開錢 Note: 商業地圖有一寡,官方的國土利用調查成果 無法度直接利用,需要描圖 ---- ## 國土利用調查成果圖 ![NLSC Landuse](https://i.imgur.com/Ivt3H8u.png) Note: 完整毋過是無向量檔(要錢) ---- ## 批次匯入墓仔埔到 Wikidata ![](https://i.imgur.com/PRNCtnI.png) Note: 佇Wikidata建立大臺北遮的墓仔埔資料,包括有予徙走變成其他用途 ---- ## 篩選墓仔埔的指令檔 ``` osmium tags-filter taiwan-latest.osm.pbf wr/landuse=cemetery wr/amenity=grave_yard -o cemetery-areas.geojson ``` Note: 用osmium來對OpenStreetMap的原始資料,篩出所有的墓仔埔 --- ## 揣出墓仔埔相關的屬性 ``` osmium tags-count 20220531/cemetery.osm.pbf --output=20220531/cemetery-stat.txt ``` Note: osmium嘛會當篩出用著的標籤 --- ## 墓仔埔相關的標籤 ![](https://i.imgur.com/l39lWlW.png) Note: 上濟是名號,猶閣有宗教,有一寡有連結Wikidata,嘛有地址 --- ## 揣墓仔埔的名號 ``` osmium tags-count 20220531/cemetery.osm.pbf name=* --output=20220531/cemetery-name.txt ``` Note: 咱來分析臺灣各地的墓仔埔的名號 --- ## 各地公立佮私人的墓仔埔 ![](https://i.imgur.com/gu2kSth.png) Note: 發見講有袂少的私人公司經營的私墓 --- ## 標示墓仔埔的宗教派別 * 臺灣遮較無用宗教來分墓仔埔 * 有一寡基督教的墓仔埔 Note: 臺灣遮的公有墓仔埔是無宗教的,分析資料發見寫無著的所在,共名號寫入去墓仔埔所屬的宗教欄位 ---- ## 墓仔埔的宗教 ``` osmium tags-count 20220531/cemetery.osm.pbf religion=* --output=20220531/cemetery-religion.txt ``` Note: 佇國外墓仔埔是附屬教堂的,臺灣嘛有廟抑是教會經營的墓 ---- ![](https://i.imgur.com/d7gUqQB.png) Note: 發見有一寡寫毋著的,共名號寫入去所屬宗教 --- ## 挑戰 * 資料品質 * 基礎平台無美光燈,難吸引維護人力 * * 其他輔助的:[Mapillary](https://mapillary.com/app/)、Wiki Commons、維基百科 * 需要資源投入~~捐款~~、~~出人力~~ * 濟語言 Note: 咱做的代誌是基礎个,所以無啥Spotlight,嘛因為按呢較無法度吸引人來做。 頭前講過,OpenStreetMap佮Wikidata是較基礎的資料收集,,所以是較無吸引人來做。 所以需要人力以外,猶閣有其他計畫親像Wikipedia、Wiki Commons,需要捐款,捐資料,出人來投入。 濟語言是愛加強的所在,毋但是國際語言親像英語,嘛愛顧慮本土語言。 --- ## 資料品質 * 並無嚴格的品管機制,靠事後的修正漸漸*倚靠* ([1](https://www.wikidata.org/wiki/Wikidata:Contribute), [2](https://www.openstreetmap.org/fixthemap))完善 * 資料品質,落差大,毋過有工具會當檢視整體資料狀況,糾出有問題資料閣予修正 Note: 資料品質的部份,貢獻者有無仝程度,資料會差較濟,愛靠事後修正。 ---- ## 整合的困境 * OpenStreetMap 佮 Wikidata 會當互相連結,嘛會連結第三方的資料庫,親像 GNS * 愛對 OpenStreetMap 佮 Wikidata 攏有熟似才有才調處理,甚至是需要寫程式 * 資料品質,落差大,毋過有工具會當檢視整體資料狀況,揣出有問題的資料閣來修正 Note: OpenStreetMap佮Wikidata會當互相建立連結,嘛會當連結第三方資料庫,親像GNS 仝時間愛處理OSM佮Wikidata愛有兩項的智識 看著別人編輯過的資料,有時的發見䆀資料,愛沓沓修正 --- ## 濟語言 * 欠缺會當寫台灣台語、台灣客語的人 * 本土語言大眾不重視書面化 * 本土語言總體欠文獻 Note: 毋過這二个平台Wikidata佮OpenStreetMap欠華語以外的國家語言,台灣台語佮台灣客語。這二个語言因為長期無重視書面化,文獻嘛欠缺,予咱有真大的挑戰。 ---- ## 客家話 * 決定用佗幾套併音文字系統 * 無仝系統的代碼:白話字、客拼 etc * 徵求會曉客家話的人 Note: 這張主要是想欲揣客人來鬥相共,來處理客話佇OpenStreetMap佮Wikidata的處理問題。 --- ## 未來的計畫 * 辦理主題工作坊 * 共 OpenStreetMap 有的溪流加入去 Wikidata * Wikidata 遐的溪流加添濟語言:臺灣台語、臺灣客語、原住民語言的名號 Note: 雖然是疫情關係,無啥人欲參加活動,希望會當舉行主題的工作坊,整理溪流、墓仔埔資料,嘛希望添加濟語言 --- ## OSM x Wikidata 月聚 * 8/15 19:30 @摩茲工寮 * Facebook [OpenStreetMap台灣](https://www.facebook.com/groups/OpenStreetMap.TW/) Note: 歡迎逐家來阮的聚會,逐個月佇MozSpace遮舉行 --- ## 謝謝! :sheep: - [GitHub](https://github.com/Supaplextw/) - Supaplex: [Wikidata](https://wikidata.org/wiki/User:Supaplex),[OpenStreetMap](https://www.openstreetmap.org/user/Supaplex) - 抑是 [email](mailto:dennis@wikimedia.tw) 我 - 面書社團 [Wikidata Taiwan](https://www.facebook.com/groups/2212207218990971/)、[OpenStreetMap台灣](https://www.facebook.com/groups/OpenStreetMap.TW/) Note: 提供聯絡訊,歡迎來揣我
{"metaMigratedAt":"2023-06-17T01:52:43.985Z","metaMigratedFrom":"YAML","title":"OpenStreetMap 佮 Wikidata 資料標準化的過程-溪流佮村里的例","breaks":true,"description":"View the slide with \"Slide Mode\".","contributors":"[{\"id\":\"6d29f5f5-3da6-40f2-b920-e9a4cc2181dd\",\"add\":8632,\"del\":9921}]"}
    421 views
   Owned this note