--- tags: Website, wikidata, openstreetmap, opendataday, opendata title: 【Open Data Day Taiwan 2025 專題演講】臺灣本土語言的 Wikidata 條目與詞位建構 --- [Open Data Day Taiwan 2025 活動共筆](https://hackmd.io/@wikidata-tw/opendatadaytw2025) # 臺灣本土語言的 Wikidata 條目與詞位建構 ![【Open Data Day Taiwan 2025 專題演講】臺灣本土語言的 Wikidata 條目與詞位建構](https://upload.wikimedia.org/wikipedia/commons/b/b5/Open_Data_Day_Taiwan_2025_Program_Banner_08.png) * Wikidata Taiwan 王文岳 * [Meta-Wiki 頁面](https://meta.wikimedia.org/wiki/Wikimedia_Taiwan/Wikidata_Taiwan/Open_Data_Day_Taiwan_2025/%E8%87%BA%E7%81%A3%E6%9C%AC%E5%9C%9F%E8%AA%9E%E8%A8%80%E7%9A%84_Wikidata_%E6%A2%9D%E7%9B%AE%E8%88%87%E8%A9%9E%E4%BD%8D%E5%BB%BA%E6%A7%8B) ## 講座簡介 Wikidata 的資料參與方式多元,除了條目(item)內容的直接貢獻、對應知識圖譜的屬性(property)建構以及直接收錄詞彙的詞位(lexeme)都能將原始資料結構轉為 RDF 三元組,並以鏈結開放資料(Linked Open Data)的方式供全球使用者使用。 所有的內容結構上都包含有多語言欄位,除了各語言、文化上獨有的知識架構外,所有通用結構都能做個語言的翻譯與對照。本次講座將會概述目前臺灣本土語言:臺灣台語(在維基媒體中使用 nan-tw)、客家話(hak)、閩東語(cdo,馬祖話屬於閩東語的分支)、莆仙語(cpx,烏坵話屬於莆仙話的分支)以及各臺灣原住民族語在 Wikidata 的資料概況與一般條目的語言收錄,並示範 Wikidata 單一詞位的收錄方式。 ## 講者簡介 ![Wikidata Taiwan 社群 王文岳](https://upload.wikimedia.org/wikipedia/commons/f/f8/Open_Data_Day_Taiwan_2025_42.jpg) 王文岳 Allen Wang Wikidata Taiwan 臺灣維基數據社群共同發起人 過去曾任第一屆第一期立法院開放國會委員會民間委員、國家文化記憶庫:110-111年社群經營與運作模式建置計畫資訊技術協力、社團法人台灣維基媒體協會秘書長,曾共同主持有「客家@維基」資料多元應用專案以及執行李梅樹紀念館國家文化記憶庫專案「臺灣美術巨擘的最後一程—李梅樹告別式相關文物掃描」等資料開放專案。 # 參考資料 # 共筆區 ## Wikidata 扮演著串連全部網路的角色 * Wikidata 能串接很多專案 ## Wikidata 也扮演著多語言/多計畫資料整合對照的角色 * 條目的語言映射實作早期是直接到個語言新增連結,是促成 Wikidata 的契機 * 目前可以支援超過四百種語言 ## 是 VLAF 的一份子 ## Wikidata 的主要內容架構 * Item 叫 Q 的原因跟創辦人有關 * 三元組? ## (待補:Wikidata、翻譯、原住民語、InstanceOf 欄位) * ?提高小語言使用者資料的可用性 ## Wikidata 亦稱為欄位 * 音界號 * 可以找到同一個 item * 賽德克族「桂竹」有三個部落翻譯也可以用這個 * 同一個東西在不同部落會有不同稱呼 * 南勢溪 = 在南邊的溪 * 頭前溪 = 在我家前面的溪 ## ? ## 母語標籤僅詞位、部份屬性可用 ## 目前 Wikidata 無法使用的語言 * 等 translatewiki 語言小組審核 * 含幾乎快失傳的語言 ## 目前條目資料數量 (2024) * 泰雅族人也不知道為什麼會有 15 萬組 ## 目前法定原住民族語言 ## 如何積極參與? ### 條目或是屬性翻譯 * 感謝 Dennis 貢獻台語翻譯 ### 詞位 Lexeme * 排灣用戶組非常積極貢獻詞位