<div style="display:flex; flex-direction:column;"> <div> </div> <div style="font-size:55%;padding:32px"> # 台灣 ê Wikidata 經驗 - 對迒語言連結文章到連結資料庫<br/>Wikidata 按怎連結全世界所有 ê 智識<br/> </div> <!-- Put the link to this slide here so people can follow --> <div style="font-size:16px;display:flex;background-color:rgb(157 195 145/0.5);padding:32px;justify-content:flex-end;"> <div style="flex-direction:column; text-align:left"> <div>slide:https://hackmd.io/@wikidata-tw/B14060lyn</div> <div>CC-BY-4.0 Wikidata Taiwan Community</div> <div>台灣維基數據社群</div> <div>2023/07/30</div> </div> </div> </div> --- ## 我是誰? - [Supaplex](https://www.openstreetmap.org/user/Supaplex) - [OpenStreetMap](https://www.openstreetmap.org) :heart: [Wikidata](https://www.wikidata.org) :heart: - [Wikimedia Taiwan](https://meta.wikimedia.org/wiki/Wikimedia_Taiwan/zh) :cat: --- ## 是按怎欲關注 Wikidata? * 維基百科bueh結構化發展,變成機器ē-tàng讀 * 迒語言 kah 語言中立 ê 資料庫 * 允許國際化 ê 語言,嘛有在地化 ê 語言 * 資料庫 ê 資料庫:ē-tàng索引其他資料庫ê資料,舉例:OpenStreetMap、學校代碼、河川代碼 Note: 維基百科結構化了後,出來ê專案,予機器ē-tàng讀。𪜶是迒語言 kah 語言中立 ê 資料庫。嘛ē-tàng收各國語言,嘛有在地ê語言。Wikidata嘛是資料庫ê資料庫,ē-tàng索引其他資料庫ê項目代碼,舉例:OpenStreetMap、學校代碼、河川代碼 ---- ## 講起先 - COSCUP 2013 {%youtube dE52LLcUhYk %} Note: Wikimedia Deutschland, Wikidata 專案經理 Lydia 來台灣紹介 Wikidata,是臺灣上早的 Wikidata 演講 --- ## Wikidata 佇台灣發展史 * 2014~2019 消沈期,學術界較關心,親像中研院莊庭瑞老師 * 2019 年開始社群關注,ex: OpenStreetMap x Wikidata月聚 * 有人大量匯入法條、村里、學校、圖書館、戲劇節目 ê 集、政府出版品、論文 Note: 毋過到 2019 進前,臺灣遮較無系統的推捒 Wikidata。2019 年開始有社群聚會,嘛有先對藝術資料,親像展覽品、展覽活動來記錄。仝時間嘛有個人匯入法條、村里、學校、圖書館、戲齣節目的集等等 --- ## OpenStreetMap x Wikidata ![OpenStreetMap x Wikidata](https://upload.wikimedia.org/wikipedia/commons/c/c5/WdOsm-semanticBridge.jpg) Note: 逐個月有 OpenStreetMap 佮 Wikidata 社群佇台北遮的 Mozspace --- ## 範例1-摩茲工寮 <div style="display:inline-flex;align-items:left;"> <div left> ![](https://hackmd.io/_uploads/Hys8R4_Fn.png) </div> <div style="font-size:85%;display:flex;background-color:rgb(127 195 140/0.5);padding:1px;justify-content:flex-end;"> <div style="flex-direction:column; text-align:left"> &nbsp; * 性質:場地 * 官方網站:=[https://moztw.org/space/](https://moztw.org/space/) * OSM node ID:5773168030 </div> </div> </div> ---- ## 範例2 -國立臺灣科技大學 <div style="display:inline-flex;align-items:left;"> <div left> ![](https://hackmd.io/_uploads/rJnKaWGo3.png) </div> <div style="font-size:85%;display:flex;background-color:rgb(127 195 140/0.5);padding:1px;justify-content:flex-end;"> <div style="flex-direction:column; text-align:left"> &nbsp; * 性質:大學 * OSM關係編號:5355856 * 學校代碼:0022 * 官方網站:https://www.ntust.edu.tw * wikipedia:zh:國立臺灣科技大學 </div> </div> </div> --- ## Wikidata 連結地圖:OpenSteetMap * 村里:type=boundary * 溪流:type=waterway * 學校:amenity=school * 火車站、捷運站、輕軌站:railway=station --- ## Wikidatacon 2023 @Taiwan ![](https://hackmd.io/_uploads/SktEC-zj3.png) --- ## 台灣 ê Wikidata 項目 ū 位置|2021、2023差異 ![Taiwan gif](https://addshore.com/wp-content/uploads/2023/07/2021-2023-Taiwan-diff.gif) 連結:[Wikidata Map in 2023](https://addshore.com/2023/07/wikidata-map-in-2023/) --- ## Wikidata.org * https://www.wikidata.org * 中文:維基數據/資料 * 2012 10/29 成立 * [維基百科](https://zh.wikipedia.org/) <-多媒體-> [維基共享資源](https://commons.wikimedia.org/wiki/) * 維基百科 <-結構化資料-> 維基數據 * 目標是用結構化資料處理人類所有的智識 * 截至 2023 年 7 月,計共 [105,058,961 項目](https://www.wikidata.org/wiki/Special:Statistics),容量 [136.9 GB](https://dumps.wikimedia.org/wikidatawiki/20230701/) Note: 一般較 Wikidata 翻譯做維基數據,是 2012 十月成立的,所以今年是十週年。伊運作的方式親像講維基共享資源存多媒體檔案,維基數據是存結構的資料。維基數據是欲存全人類的智識。到2023年七月,計共 1億偌的項目,量是 136.9 GB --- ## 語料資料 <section data-background-iframe="https://www.wikidata.org/wiki/Lexeme:L222612" data-preload data-background-interactive> <h2>Góa/Guá/我 - Wikidata</h2> </section> Note: Wikidata 的新資料形式辭條,會當家己寫字詞典 --- ## 台灣 ê 村里 * 社群真早tō開始處理--ah,tī OSM 攏總開 4 年時間,Wikidata 集中 tī 2019 年 * 受到菲律賓社群 [serv](https://www.openstreetmap/user/serv) ê [Barangay](https://en.wikipedia.org/wiki/Barangay) 提案啟發,欲來講台灣村里資料ê處理故事 * 總數量 sī 7,748 * 連結戶役政代碼、OSM 關係編號kah Wikidata QID Note: 其實會來講臺灣村里的故事,是因為菲律賓社群的 Serv,伊會本名叫 Eugene,伊開始處理菲律賓的 Barangay,是菲律賓上小的行政單位。佇 OpenStreetMap 佮 Wikidata 建立村里,攏總開 4 年時間,計共 7,748 的村里處理好勢 (截至 2023 7/1),所有的村里連結戶役政系統代碼佮 Wikidata 編號。 --- ## OSM 村里視覺化 [![](https://i.imgur.com/fs9Ds83.png)](https://overpass-turbo.eu/s/1kR3) Note: 七千偌接近八千个村里佇咧 OpenStreetMap 的視覺化 --- ## Wikidata ê 村里 ![](https://i.imgur.com/LphIh9G.jpg) Note: Wikidata Query 顯示的地理分佈 --- ## 村里資料的歷史 * 2019 年開始 * 最基本的地理單元 * 根據政府的開放資料來建立 * 提案[戶役政系統代碼 - P5020](https://www.wikidata.org/wiki/Property:P5020) Note: 臺灣遮的村里資料是對2019年開始,村里是臺灣上基本的政治地理單位(忽略鄰一个通常無GSI範圍的單位)。是根據政府的開放資料來建立,嘛順紲共戶役政代碼提案屬性 P5020 --- ## 有失誤了 * 用到舊的,無維護的主計處資料集 (到 2018 而已) * 沒有處理到 2018 年台南新整併的里 * 解決方式:用新的戶政司資料集 Note: 彼時用到舊的資料,已經無維護的主計處資料集(到2018年1爾爾)。所以台南2018年整併的里。解決的方式是用上新的戶政司的資料集 --- ## 再次失誤啊 ![](https://i.imgur.com/1pcuj9H.png) Note: zh-min-nan 維基百科那邊有人建立全台北市的里,所以 Wikidata 有建立項目 --- ## 對 zh-min-nan 維基來的 ![](https://i.imgur.com/1OTBT0a.png) Note: 因為匯入之後無人編輯過,基本都空空的 --- ## 其他 ê 失誤 * 彰化 ê 村里維基百科條目寫作 * 嘉義 ê 村里維基百科條目寫作 --- ## 監控新成立或是解散的村里 工具連結:[https://wikidata.planetoid.info/?q=已建立鄉鎮條目](https://wikidata.planetoid.info/?q=%已建立鄉鎮條目) ![](https://i.imgur.com/rAxjSeN.png) Note: 社群建立工具來監控對政府的資料集,有新的村里抑是刣去,就愛編輯 Wikidata 佮 OpenStreetMap --- ## 台灣的溪流 * 溪仔常常無文獻 * [OpenStreetMap 關係](https://wiki.openstreetmap.org/wiki/Relation)編輯難度高 * 實地踏查真重要 * [宿霧維基百科](https://en.wikipedia.org/wiki/Cebuano_Wikipedia)的問題 Note: 溪仔無資料,佇 OpenStreetMap 編輯溪流關係嘛真困難有難度。欲得著較正確的資料,有時愛實地踏查 --- ## Ceb Wiki - ljsbot [![](https://i.imgur.com/ZU69q1R.png)](https://www.vice.com/en/article/4agamm/the-worlds-second-largest-wikipedia-is-written-almost-entirely-by-one-bot) Note: Cebese Wikipedia 用機器人衝數量,無啥活人,通世界知 --- ### Ceb Wiki - 無對應 ê Wikidata 項目 * 有 Ceb Wiki 條目 * 有 GNS ID * 無連結 Wikidata --- ## 溪流 ê 清單 [![](https://i.imgur.com/InLoWvp.png)](https://overpass-turbo.eu/s/1kR6) Note: 用 Overpass Turbo 會當得著臺灣所有的溪流的清單,有河川代碼佮 Wikidata 的編號 --- ## Ceb Wiki 頁面 * 干焦 ū Ceb 語言版本 --- ## [Name Suggestion Index](https://wiki.openstreetmap.org/wiki/Name_Suggestion_Index) * 2013 年 10 月開始,附屬 iD 專案 * 2019 年獨立出來:[State of the Map US 2019](https://2019.stateofthemap.us/program/sat/mapping-brands-with-the-name-suggestion-index.html) 宣佈 * 一開始是沒人顧的 side project Note: Name Suggestion Index 是 2013 年 10 月開始的,附屬 OpenStreetMap 編輯器 iD 經營的,2019 年獨立出來。頭起先 NSI 是無人顧的 side project --- ## [Name Suggestion Index](https://wiki.openstreetmap.org/wiki/Name_Suggestion_Index) - 連鎖商店正規化 * 解決仝體系各語言無仝 ê 標示方式問題 * 跨語言,用 Wikidata 來做對應 * 目標是希望 OSM 這邊標示能夠標準化 Note: NSI 希望會當解決迒語言的問題,用 Wikidata 來做精確對應。向望編輯遮會當靠 NSI 予連鎖商家標示統一 --- ## 台灣 ê 常見商家 ![](https://i.imgur.com/oA8GOwf.png) Note: 臺灣人日常的消費的店家有真濟有加添入去 --- ## 銀行 ![](https://i.imgur.com/AqkUfMq.png) Note: 親像所有的銀行攏有加添入去矣,配合 OpenStreetMap 遮匯入的銀行據點,相對是較完整的 --- ## 銀行 ê 例 - [聯邦銀行三峽分行](https://www.openstreetmap.org/node/5758382974) ![](https://i.imgur.com/nof4Ba5.png) Note: 聯邦銀行的三峽分行,除了地址以外,猶閣有 Wikidata 的連結 --- ## 台灣銀行 - NSI 數量 175 個 [![](https://i.imgur.com/qUaBSbH.png)](https://overpass-turbo.eu/s/1naT) Note: 因為時間關係,只有查全臺灣的臺灣銀行,照 NSI 的有 175 个 --- ## Wikidata ê 應用:OpenStreetMap ê Wikidata 次級標籤 ![](https://i.imgur.com/Myfedyj.png) Note: OpenStreetMap 遮的 Wikidata 次級標籤列表 --- ## [subject:wikidata](https://wiki.openstreetmap.org/wiki/Key:subject:wikidata)=Q16574 > subject=蔣中正 > OSM -> https://www.openstreetmap.org/node/2700264358 ![](https://i.imgur.com/wHu0cVj.jpg) Note: 蔣介石相關的記念物,道路、銅像(tâng-siōng)、各級學校的中正、介壽開頭的 --- ## [brand:wikidata](https://wiki.openstreetmap.org/wiki/Key:brand:wikidata)=Q4642867 > [operator:wikidata](https://wiki.openstreetmap.org/wiki/Key:operator:wikidata)=Q4642867 > operator=7-Eleven [![](https://i.imgur.com/N8nJK6h.jpg)](https://commons.wikimedia.org/wiki/File:7-Eleven_Pingxi_Store_20190908.jpg) Note: 連鎖商家的部份,會當用 brand:wikidata --- ## [network:wikidata](https://wiki.openstreetmap.org/wiki/Key:network:wikidata)=Q21652250 > network=新北市區公車 > 新北市區公車939路線 [![](https://i.imgur.com/8bAvAPk.jpg)](https://commons.wikimedia.org/wiki/File:%E5%8F%B0%E5%8C%97%E5%AE%A2%E9%81%8B_KKA-9956.jpg) Note: 早起是坐939公車對台北來到三峽,嘛會當連結都市的公車路網的 Wikidata 新北市公車 --- ## [species:wikidata](https://wiki.openstreetmap.org/wiki/Key:species:wikidata)=Q1069046 > species:zh=大王椰子 > 其中一欉:[node/2238605651](https://www.openstreetmap.org/node/2238605651) [![](https://i.imgur.com/8zMCENo.jpg)](https://commons.wikimedia.org/wiki/File:National_Taiwan_University_%E6%A4%B0%E6%9E%97%E5%A4%A7%E9%81%93_(%E5%90%91%E6%A0%A1%E5%85%A7)_2021-10-10_afternoon.jpg) Note: 台灣大學椰林大道的大王椰子會當用 species:wikidata 連接 wikidata --- ## 名號來源 - 蔣中正相關的物件標示方式 * [name:etymology](https://wiki.openstreetmap.org/wiki/Key:name:etymology)=蔣中正 * [name:etymology:wikidata](https://wiki.openstreetmap.org/wiki/Key:name:etymology:wikidata)=Q16574 * [name:etymology:wikipedia](https://wiki.openstreetmap.org/wiki/Key:name:etymology:wikipedia)=zh:蔣中正 Note: 名號來源,嘛會當透過 Wikidata 加添各地頭的中正路佮蔣介石的關係 --- ### 學校資料 * metadata 部分有[學校代碼](https://www.wikidata.org/wiki/Property:P7121)、地址、各語言名稱 * Wikipedia, Wikidata, Wiki Commons * 空間資料-OSM上有範圍 * 空間資料-Wikidata有收[經緯度](https://www.wikidata.org/wiki/Property:P625) Note: 學校有完整收佇 Wikidata,metadata 的資料有學校代碼、地址、各種語言名號。空間的部份是會當連結 OpenStreetMap,Wikidata 本身嘛會當收經維度 --- ## OSM 頂懸 ê 學校 - [Overpass Query](https://overpass-turbo.eu/s/1mZA) ![](https://i.imgur.com/189UnMU.png) Note: OpenStreetMap 遮有記載的學校的視覺化結果 --- ## Wikidata ê 國小 ![](https://i.imgur.com/v52wwKk.png) Note: Wikidata 檢索的結果 --- ## [Wikiproject Taiwan/Schools](https://www.wikidata.org/wiki/Wikidata:WikiProject_Taiwan/Schools) ![](https://i.imgur.com/1YozljD.png) Note: 在地社群有建立協調的頁面,制定欲按怎編輯 --- ## 學校資料 ê 挑戰 * 對 2019 年匯入了後,tō 無啥物更新--ah * 愛看新聞加新學校抑是處理廢除 ê 學校 * 比對教育部學校清單新設立閣有廢除 ê 學校 * 整併日語維基百科那邊重複 ê 資料 * 2023年 ū 對教育部資料處理新設立抑是廢除 ê 學校 Note: 對 2019 年了後,無啥更新。Wikidata 遐有新設立的學校,是看著新聞去加的,抑是有人佇 OpenStreetMap 加添。除了更新資料以外,另外有日語維基遐重疊,毋過無偌濟。 --- ## 台灣公墓資料 * OpenStreetMap 有相當高的繪製程度 * Wikidata 上有雙北的資料 Note: 墓仔埔的資料佇 OpenStreetMap 相對佮完整,Wikidata 這爿是雙北遮有建立資料 --- ## 三峽的公墓 [![](https://i.imgur.com/YPbUMeT.png)](https://w.wiki/5sSe) Note: 進前 Allen 有依照三峽鎮誌加添本地的公墓,配合 OpenStreetMap,就會當知影位置佮範圍矣 --- ## 南山公墓的維基條目 [![台南南山公墓的維基條目](https://i.imgur.com/7LyZnHQ.png)](https://zh.wikipedia.org/wiki/%E8%87%BA%E5%8D%97%E5%8D%97%E5%B1%B1%E5%85%AC%E5%A2%93) Note: 這是南山公墓的維基條目,有詳細的文字內容佮圖片,毋過無地理位置抑是範圍的資料 --- [OSM南山公墓](https://www.openstreetmap.org/relation/6564784) ![OSM南山公墓](https://i.imgur.com/kpH3z1f.png) Note: OpenStreetMap 頂懸的南山公墓,靠 OpenStreetMap 有範圍的資料,連結 Wikidata 加添基本的資料 --- ## ē-tàng 繼續做 ê 資料 * ū 阿啄仔匯入agoda、Booking.com ê 臺灣旅館資料 * 寫古蹟(kóo-tsik) ê metadata * 村里:監控戶政司資料 100% 完成 * 學校:2023年 ū 對教育部資料,愛處理分校分班ê情形 * 溪流:處理宿霧人 ê 重疊資料 * 交通迷翕公車 ê Commons 相片分類 kah 維基學院公車條目對 Wikidata --- ## 結論 - 從圖徵到連結 * 實體點、線、面->網路連結 * OSM 到連結第三方資料庫 * 例子:OSM 連結 Wikidata * OSM 的擴充:收錄 metadata、連結、編號 --- ## 結論 - 維護資料 * 村里、學校資料維護的挑戰 * 建立資料/匯入(一次性粗暴進行)<->維護資料/資料比對(time comsuming and careful) * NSI 商家資料維護 * 資料應用:視覺化 --- ## 未來的計畫 * 主題工作坊 * 各種資料庫整理項目 * 多語言,像是台灣台語、臺灣客家話、臺灣原住民的語言 Note: 未來希望會當舉辦主題工作坊,毋但頭前講的村里、溪流、學校爾爾,各種資料庫的資料整理工課。另外濟語言的部份,不止仔台語的部份,猶閣有 Hak-ka-fa、臺灣原住民的語言 --- ## OSM x Wikidata 月聚 * 8/15 19:30 @摩茲工寮 * Facebook [OpenStreetMap台灣](https://www.facebook.com/groups/OpenStreetMap.TW/) --- ## [To-siā!](https://en.wiktionary.org/wiki/%E5%A4%9A%E8%AC%9D#Chinese) [sṳ̀n-mùng-ǹ!](https://en.wiktionary.org/wiki/%E6%89%BF%E8%92%99%E4%BD%A0) Thank you! :sheep: 你可以在以下管道找到我 <div style="display:inline-flex;align-items:center;gap:2rem;"> <div style="flex:1;text-align:left" left> - [GitHub](https://github.com/Supaplextw/) - Supaplex: [Wikidata](https://wikidata.org/wiki/User:Supaplex),[OpenStreetMap](https://www.openstreetmap.org/user/Supaplex) - 或是寄[電子郵件](mailto:dennis@wikimedia.tw) </div> <div style="flex:1;text-align:left" left> * 臉書社團 Wikidata Taiwan * 臉書社團 OpenStreetMap台灣 * OSM Wiki [Taiwan](https://wiki.openstreetmap.org/wiki/Taiwan) </div> </div>
{"breaks":true,"description":"View the slide with \"Slide Mode\".","title":"台灣 ê Wikidata 經驗 - 對迒語言連結文章到連結資料庫,Wikidata 按怎連結全世界所有 ê 智識","contributors":"[{\"id\":\"6d29f5f5-3da6-40f2-b920-e9a4cc2181dd\",\"add\":26635,\"del\":14439}]"}
    339 views
   Owned this note