<div style="display:flex; flex-direction:column;">
<div>
</div>
<div style="font-size:55%;padding:32px">
# 台灣 ê Wikidata 經驗 - 對迒語言連結文章到連結資料庫<br/>Wikidata 按怎連結全世界所有 ê 智識<br/>
</div>
<!-- Put the link to this slide here so people can follow -->
<div style="font-size:16px;display:flex;background-color:rgb(157 195 145/0.5);padding:32px;justify-content:flex-end;">
<div style="flex-direction:column; text-align:left">
<div>slide:https://hackmd.io/@wikidata-tw/B14060lyn</div>
<div>CC-BY-4.0 Wikidata Taiwan Community</div>
<div>台灣維基數據社群</div>
<div>2023/07/30</div>
</div>
</div>
</div>
---
## 我是誰?
- [Supaplex](https://www.openstreetmap.org/user/Supaplex)
- [OpenStreetMap](https://www.openstreetmap.org) :heart: [Wikidata](https://www.wikidata.org) :heart:
- [Wikimedia Taiwan](https://meta.wikimedia.org/wiki/Wikimedia_Taiwan/zh) :cat:
---
## 是按怎欲關注 Wikidata?
* 維基百科bueh結構化發展,變成機器ē-tàng讀
* 迒語言 kah 語言中立 ê 資料庫
* 允許國際化 ê 語言,嘛有在地化 ê 語言
* 資料庫 ê 資料庫:ē-tàng索引其他資料庫ê資料,舉例:OpenStreetMap、學校代碼、河川代碼
Note:
維基百科結構化了後,出來ê專案,予機器ē-tàng讀。𪜶是迒語言 kah 語言中立 ê 資料庫。嘛ē-tàng收各國語言,嘛有在地ê語言。Wikidata嘛是資料庫ê資料庫,ē-tàng索引其他資料庫ê項目代碼,舉例:OpenStreetMap、學校代碼、河川代碼
----
## 講起先 - COSCUP 2013
{%youtube dE52LLcUhYk %}
Note:
Wikimedia Deutschland, Wikidata 專案經理 Lydia 來台灣紹介 Wikidata,是臺灣上早的 Wikidata 演講
---
## Wikidata 佇台灣發展史
* 2014~2019 消沈期,學術界較關心,親像中研院莊庭瑞老師
* 2019 年開始社群關注,ex: OpenStreetMap x Wikidata月聚
* 有人大量匯入法條、村里、學校、圖書館、戲劇節目 ê 集、政府出版品、論文
Note:
毋過到 2019 進前,臺灣遮較無系統的推捒 Wikidata。2019 年開始有社群聚會,嘛有先對藝術資料,親像展覽品、展覽活動來記錄。仝時間嘛有個人匯入法條、村里、學校、圖書館、戲齣節目的集等等
---
## OpenStreetMap x Wikidata

Note:
逐個月有 OpenStreetMap 佮 Wikidata 社群佇台北遮的 Mozspace
---
## 範例1-摩茲工寮
<div style="display:inline-flex;align-items:left;">
<div left>

</div>
<div style="font-size:85%;display:flex;background-color:rgb(127 195 140/0.5);padding:1px;justify-content:flex-end;">
<div style="flex-direction:column; text-align:left">
* 性質:場地
* 官方網站:=[https://moztw.org/space/](https://moztw.org/space/)
* OSM node ID:5773168030
</div>
</div>
</div>
----
## 範例2 -國立臺灣科技大學
<div style="display:inline-flex;align-items:left;">
<div left>

</div>
<div style="font-size:85%;display:flex;background-color:rgb(127 195 140/0.5);padding:1px;justify-content:flex-end;">
<div style="flex-direction:column; text-align:left">
* 性質:大學
* OSM關係編號:5355856
* 學校代碼:0022
* 官方網站:https://www.ntust.edu.tw
* wikipedia:zh:國立臺灣科技大學
</div>
</div>
</div>
---
## Wikidata 連結地圖:OpenSteetMap
* 村里:type=boundary
* 溪流:type=waterway
* 學校:amenity=school
* 火車站、捷運站、輕軌站:railway=station
---
## Wikidatacon 2023 @Taiwan

---
## 台灣 ê Wikidata 項目 ū 位置|2021、2023差異

連結:[Wikidata Map in 2023](https://addshore.com/2023/07/wikidata-map-in-2023/)
---
## Wikidata.org
* https://www.wikidata.org
* 中文:維基數據/資料
* 2012 10/29 成立
* [維基百科](https://zh.wikipedia.org/) <-多媒體-> [維基共享資源](https://commons.wikimedia.org/wiki/)
* 維基百科 <-結構化資料-> 維基數據
* 目標是用結構化資料處理人類所有的智識
* 截至 2023 年 7 月,計共 [105,058,961 項目](https://www.wikidata.org/wiki/Special:Statistics),容量 [136.9 GB](https://dumps.wikimedia.org/wikidatawiki/20230701/)
Note:
一般較 Wikidata 翻譯做維基數據,是 2012 十月成立的,所以今年是十週年。伊運作的方式親像講維基共享資源存多媒體檔案,維基數據是存結構的資料。維基數據是欲存全人類的智識。到2023年七月,計共 1億偌的項目,量是 136.9 GB
---
## 語料資料
<section data-background-iframe="https://www.wikidata.org/wiki/Lexeme:L222612" data-preload
data-background-interactive>
<h2>Góa/Guá/我 - Wikidata</h2>
</section>
Note:
Wikidata 的新資料形式辭條,會當家己寫字詞典
---
## 台灣 ê 村里
* 社群真早tō開始處理--ah,tī OSM 攏總開 4 年時間,Wikidata 集中 tī 2019 年
* 受到菲律賓社群 [serv](https://www.openstreetmap/user/serv) ê [Barangay](https://en.wikipedia.org/wiki/Barangay) 提案啟發,欲來講台灣村里資料ê處理故事
* 總數量 sī 7,748
* 連結戶役政代碼、OSM 關係編號kah Wikidata QID
Note:
其實會來講臺灣村里的故事,是因為菲律賓社群的 Serv,伊會本名叫 Eugene,伊開始處理菲律賓的 Barangay,是菲律賓上小的行政單位。佇 OpenStreetMap 佮 Wikidata 建立村里,攏總開 4 年時間,計共 7,748 的村里處理好勢 (截至 2023 7/1),所有的村里連結戶役政系統代碼佮 Wikidata 編號。
---
## OSM 村里視覺化
[](https://overpass-turbo.eu/s/1kR3)
Note:
七千偌接近八千个村里佇咧 OpenStreetMap 的視覺化
---
## Wikidata ê 村里

Note:
Wikidata Query 顯示的地理分佈
---
## 村里資料的歷史
* 2019 年開始
* 最基本的地理單元
* 根據政府的開放資料來建立
* 提案[戶役政系統代碼 - P5020](https://www.wikidata.org/wiki/Property:P5020)
Note:
臺灣遮的村里資料是對2019年開始,村里是臺灣上基本的政治地理單位(忽略鄰一个通常無GSI範圍的單位)。是根據政府的開放資料來建立,嘛順紲共戶役政代碼提案屬性 P5020
---
## 有失誤了
* 用到舊的,無維護的主計處資料集 (到 2018 而已)
* 沒有處理到 2018 年台南新整併的里
* 解決方式:用新的戶政司資料集
Note:
彼時用到舊的資料,已經無維護的主計處資料集(到2018年1爾爾)。所以台南2018年整併的里。解決的方式是用上新的戶政司的資料集
---
## 再次失誤啊

Note:
zh-min-nan 維基百科那邊有人建立全台北市的里,所以 Wikidata 有建立項目
---
## 對 zh-min-nan 維基來的

Note:
因為匯入之後無人編輯過,基本都空空的
---
## 其他 ê 失誤
* 彰化 ê 村里維基百科條目寫作
* 嘉義 ê 村里維基百科條目寫作
---
## 監控新成立或是解散的村里
工具連結:[https://wikidata.planetoid.info/?q=已建立鄉鎮條目](https://wikidata.planetoid.info/?q=%已建立鄉鎮條目)

Note:
社群建立工具來監控對政府的資料集,有新的村里抑是刣去,就愛編輯 Wikidata 佮 OpenStreetMap
---
## 台灣的溪流
* 溪仔常常無文獻
* [OpenStreetMap 關係](https://wiki.openstreetmap.org/wiki/Relation)編輯難度高
* 實地踏查真重要
* [宿霧維基百科](https://en.wikipedia.org/wiki/Cebuano_Wikipedia)的問題
Note:
溪仔無資料,佇 OpenStreetMap 編輯溪流關係嘛真困難有難度。欲得著較正確的資料,有時愛實地踏查
---
## Ceb Wiki - ljsbot
[](https://www.vice.com/en/article/4agamm/the-worlds-second-largest-wikipedia-is-written-almost-entirely-by-one-bot)
Note:
Cebese Wikipedia 用機器人衝數量,無啥活人,通世界知
---
### Ceb Wiki - 無對應 ê Wikidata 項目
* 有 Ceb Wiki 條目
* 有 GNS ID
* 無連結 Wikidata
---
## 溪流 ê 清單
[](https://overpass-turbo.eu/s/1kR6)
Note:
用 Overpass Turbo 會當得著臺灣所有的溪流的清單,有河川代碼佮 Wikidata 的編號
---
## Ceb Wiki 頁面
* 干焦 ū Ceb 語言版本
---
## [Name Suggestion Index](https://wiki.openstreetmap.org/wiki/Name_Suggestion_Index)
* 2013 年 10 月開始,附屬 iD 專案
* 2019 年獨立出來:[State of the Map US 2019](https://2019.stateofthemap.us/program/sat/mapping-brands-with-the-name-suggestion-index.html) 宣佈
* 一開始是沒人顧的 side project
Note:
Name Suggestion Index 是 2013 年 10 月開始的,附屬 OpenStreetMap 編輯器 iD 經營的,2019 年獨立出來。頭起先 NSI 是無人顧的 side project
---
## [Name Suggestion Index](https://wiki.openstreetmap.org/wiki/Name_Suggestion_Index) - 連鎖商店正規化
* 解決仝體系各語言無仝 ê 標示方式問題
* 跨語言,用 Wikidata 來做對應
* 目標是希望 OSM 這邊標示能夠標準化
Note:
NSI 希望會當解決迒語言的問題,用 Wikidata 來做精確對應。向望編輯遮會當靠 NSI 予連鎖商家標示統一
---
## 台灣 ê 常見商家

Note:
臺灣人日常的消費的店家有真濟有加添入去
---
## 銀行

Note:
親像所有的銀行攏有加添入去矣,配合 OpenStreetMap 遮匯入的銀行據點,相對是較完整的
---
## 銀行 ê 例 - [聯邦銀行三峽分行](https://www.openstreetmap.org/node/5758382974)

Note:
聯邦銀行的三峽分行,除了地址以外,猶閣有 Wikidata 的連結
---
## 台灣銀行 - NSI 數量 175 個
[](https://overpass-turbo.eu/s/1naT)
Note:
因為時間關係,只有查全臺灣的臺灣銀行,照 NSI 的有 175 个
---
## Wikidata ê 應用:OpenStreetMap ê Wikidata 次級標籤

Note:
OpenStreetMap 遮的 Wikidata 次級標籤列表
---
## [subject:wikidata](https://wiki.openstreetmap.org/wiki/Key:subject:wikidata)=Q16574
> subject=蔣中正
> OSM -> https://www.openstreetmap.org/node/2700264358

Note:
蔣介石相關的記念物,道路、銅像(tâng-siōng)、各級學校的中正、介壽開頭的
---
## [brand:wikidata](https://wiki.openstreetmap.org/wiki/Key:brand:wikidata)=Q4642867
> [operator:wikidata](https://wiki.openstreetmap.org/wiki/Key:operator:wikidata)=Q4642867
> operator=7-Eleven
[](https://commons.wikimedia.org/wiki/File:7-Eleven_Pingxi_Store_20190908.jpg)
Note:
連鎖商家的部份,會當用 brand:wikidata
---
## [network:wikidata](https://wiki.openstreetmap.org/wiki/Key:network:wikidata)=Q21652250
> network=新北市區公車
> 新北市區公車939路線
[](https://commons.wikimedia.org/wiki/File:%E5%8F%B0%E5%8C%97%E5%AE%A2%E9%81%8B_KKA-9956.jpg)
Note:
早起是坐939公車對台北來到三峽,嘛會當連結都市的公車路網的 Wikidata 新北市公車
---
## [species:wikidata](https://wiki.openstreetmap.org/wiki/Key:species:wikidata)=Q1069046
> species:zh=大王椰子
> 其中一欉:[node/2238605651](https://www.openstreetmap.org/node/2238605651)
[](https://commons.wikimedia.org/wiki/File:National_Taiwan_University_%E6%A4%B0%E6%9E%97%E5%A4%A7%E9%81%93_(%E5%90%91%E6%A0%A1%E5%85%A7)_2021-10-10_afternoon.jpg)
Note:
台灣大學椰林大道的大王椰子會當用 species:wikidata 連接 wikidata
---
## 名號來源 - 蔣中正相關的物件標示方式
* [name:etymology](https://wiki.openstreetmap.org/wiki/Key:name:etymology)=蔣中正
* [name:etymology:wikidata](https://wiki.openstreetmap.org/wiki/Key:name:etymology:wikidata)=Q16574
* [name:etymology:wikipedia](https://wiki.openstreetmap.org/wiki/Key:name:etymology:wikipedia)=zh:蔣中正
Note:
名號來源,嘛會當透過 Wikidata 加添各地頭的中正路佮蔣介石的關係
---
### 學校資料
* metadata 部分有[學校代碼](https://www.wikidata.org/wiki/Property:P7121)、地址、各語言名稱
* Wikipedia, Wikidata, Wiki Commons
* 空間資料-OSM上有範圍
* 空間資料-Wikidata有收[經緯度](https://www.wikidata.org/wiki/Property:P625)
Note:
學校有完整收佇 Wikidata,metadata 的資料有學校代碼、地址、各種語言名號。空間的部份是會當連結 OpenStreetMap,Wikidata 本身嘛會當收經維度
---
## OSM 頂懸 ê 學校 - [Overpass Query](https://overpass-turbo.eu/s/1mZA)

Note:
OpenStreetMap 遮有記載的學校的視覺化結果
---
## Wikidata ê 國小

Note:
Wikidata 檢索的結果
---
## [Wikiproject Taiwan/Schools](https://www.wikidata.org/wiki/Wikidata:WikiProject_Taiwan/Schools)

Note:
在地社群有建立協調的頁面,制定欲按怎編輯
---
## 學校資料 ê 挑戰
* 對 2019 年匯入了後,tō 無啥物更新--ah
* 愛看新聞加新學校抑是處理廢除 ê 學校
* 比對教育部學校清單新設立閣有廢除 ê 學校
* 整併日語維基百科那邊重複 ê 資料
* 2023年 ū 對教育部資料處理新設立抑是廢除 ê 學校
Note:
對 2019 年了後,無啥更新。Wikidata 遐有新設立的學校,是看著新聞去加的,抑是有人佇 OpenStreetMap 加添。除了更新資料以外,另外有日語維基遐重疊,毋過無偌濟。
---
## 台灣公墓資料
* OpenStreetMap 有相當高的繪製程度
* Wikidata 上有雙北的資料
Note:
墓仔埔的資料佇 OpenStreetMap 相對佮完整,Wikidata 這爿是雙北遮有建立資料
---
## 三峽的公墓
[](https://w.wiki/5sSe)
Note:
進前 Allen 有依照三峽鎮誌加添本地的公墓,配合 OpenStreetMap,就會當知影位置佮範圍矣
---
## 南山公墓的維基條目
[](https://zh.wikipedia.org/wiki/%E8%87%BA%E5%8D%97%E5%8D%97%E5%B1%B1%E5%85%AC%E5%A2%93)
Note:
這是南山公墓的維基條目,有詳細的文字內容佮圖片,毋過無地理位置抑是範圍的資料
---
[OSM南山公墓](https://www.openstreetmap.org/relation/6564784)

Note:
OpenStreetMap 頂懸的南山公墓,靠 OpenStreetMap 有範圍的資料,連結 Wikidata 加添基本的資料
---
## ē-tàng 繼續做 ê 資料
* ū 阿啄仔匯入agoda、Booking.com ê 臺灣旅館資料
* 寫古蹟(kóo-tsik) ê metadata
* 村里:監控戶政司資料 100% 完成
* 學校:2023年 ū 對教育部資料,愛處理分校分班ê情形
* 溪流:處理宿霧人 ê 重疊資料
* 交通迷翕公車 ê Commons 相片分類 kah 維基學院公車條目對 Wikidata
---
## 結論 - 從圖徵到連結
* 實體點、線、面->網路連結
* OSM 到連結第三方資料庫
* 例子:OSM 連結 Wikidata
* OSM 的擴充:收錄 metadata、連結、編號
---
## 結論 - 維護資料
* 村里、學校資料維護的挑戰
* 建立資料/匯入(一次性粗暴進行)<->維護資料/資料比對(time comsuming and careful)
* NSI 商家資料維護
* 資料應用:視覺化
---
## 未來的計畫
* 主題工作坊
* 各種資料庫整理項目
* 多語言,像是台灣台語、臺灣客家話、臺灣原住民的語言
Note:
未來希望會當舉辦主題工作坊,毋但頭前講的村里、溪流、學校爾爾,各種資料庫的資料整理工課。另外濟語言的部份,不止仔台語的部份,猶閣有 Hak-ka-fa、臺灣原住民的語言
---
## OSM x Wikidata 月聚
* 8/15 19:30 @摩茲工寮
* Facebook [OpenStreetMap台灣](https://www.facebook.com/groups/OpenStreetMap.TW/)
---
## [To-siā!](https://en.wiktionary.org/wiki/%E5%A4%9A%E8%AC%9D#Chinese) [sṳ̀n-mùng-ǹ!](https://en.wiktionary.org/wiki/%E6%89%BF%E8%92%99%E4%BD%A0) Thank you! :sheep:
你可以在以下管道找到我
<div style="display:inline-flex;align-items:center;gap:2rem;">
<div style="flex:1;text-align:left" left>
- [GitHub](https://github.com/Supaplextw/)
- Supaplex: [Wikidata](https://wikidata.org/wiki/User:Supaplex),[OpenStreetMap](https://www.openstreetmap.org/user/Supaplex)
- 或是寄[電子郵件](mailto:dennis@wikimedia.tw)
</div>
<div style="flex:1;text-align:left" left>
* 臉書社團 Wikidata Taiwan
* 臉書社團 OpenStreetMap台灣
* OSM Wiki [Taiwan](https://wiki.openstreetmap.org/wiki/Taiwan)
</div>
</div>
{"breaks":true,"description":"View the slide with \"Slide Mode\".","title":"台灣 ê Wikidata 經驗 - 對迒語言連結文章到連結資料庫,Wikidata 按怎連結全世界所有 ê 智識","contributors":"[{\"id\":\"6d29f5f5-3da6-40f2-b920-e9a4cc2181dd\",\"add\":26635,\"del\":14439}]"}