--- tags: Website, wikidata, openstreetmap, opendataday, opendata, mediawiki title: 【Open Data Day Taiwan 2025 專題演講】漢語族語言及臺灣原住民族語言在 MediaWiki 的現況 --- [Open Data Day Taiwan 2025 活動共筆](https://hackmd.io/@wikidata-tw/opendatadaytw2025) # 漢語族語言及臺灣原住民族語言在 MediaWiki 的現況 ![【Open Data Day Taiwan 2025 專題演講】漢語族語言及臺灣原住民族語言在 MediaWiki 的現況](https://upload.wikimedia.org/wikipedia/commons/4/41/Open_Data_Day_Taiwan_2025_Program_Banner_07.png) * MediaWiki 中文暨漢語族社群 Winston Sung * [Meta-Wiki 頁面](https://meta.wikimedia.org/wiki/Wikimedia_Taiwan/Wikidata_Taiwan/Open_Data_Day_Taiwan_2025/%E6%BC%A2%E8%AA%9E%E6%97%8F%E8%AA%9E%E8%A8%80%E5%8F%8A%E8%87%BA%E7%81%A3%E5%8E%9F%E4%BD%8F%E6%B0%91%E6%97%8F%E8%AA%9E%E8%A8%80%E5%9C%A8_MediaWiki_%E7%9A%84%E7%8F%BE%E6%B3%81) ## 講座簡介 本議程將介紹關於漢語族語言及臺灣原住民族語言在 MediaWiki 的相關背景知識及現況,並針對部份技術內容講解操作過程,期望引領更多人投入 MediaWiki 的語言發展。 ## 講者簡介 ![MediaWiki 中文暨漢語族社群 Winston Sung](https://upload.wikimedia.org/wikipedia/commons/1/1e/Open_Data_Day_Taiwan_2025_02.jpg) Winston Sung MediaWiki 中文暨漢語族社群坑主、MediaWiki 原始碼審核員 Winston Sung 於2020年3月10日起開始參與MediaWiki開發,於2023年4月17日正式取得 MediaWiki 原始碼審核員身分,並於2023年12月29日起擔任 MediaWiki 中文暨漢語族社群坑主至今。目前致力於推動漢語族語言及臺灣原住民族語言在 MediaWiki 及維基媒體專案的發展及標準化作業。 ## 參考資料 * 社群 Telegram 群組連結: https://t.me/mediawiki_zh * 簡報: https://t.me/mediawiki_zh/24661 * https://translatewiki.net * https://www.iana.org/assignments/language-subtag-registry/language-subtag-registry * https://iso639-3.sil.org/code_changes/submitting_change_requests ## 共筆區 ### 開場 * 有些地名來自平埔族與或原住民語 * e.g. 羅東的古稱:老懂(??語的「猴子」的意思) * 有遇到能貢獻本土語言的夥伴也能邀請參加維基專案本土語言的建置 ### 關於我 * Fandom 上面建第一個 wiki * 因繁簡轉換問題成為 MediaWiki 開發人員 * 被提名 MediaWiki 原始碼審核員 ### 摘要 * MediaWiki 要求加入語言支援的門檻看主譯文檔的字串數比例 ### 背景 #### 什麼是 MediaWiki? * Minecraft Wiki 原本建在 Gamepedia,因與合併後的 Fandom 理念不合已分出去了 * Miraheze 比較自由一點(設定自訂外觀、擴充功能與自訂域名) * wiki.gg * 依 Gamepedia 理念另建 * 沒有廣告 #### MediaWiki 標誌 #### 什麼是系統訊息? * 側欄用的是特殊的格式 #### 什麼是 translatewiki.net * 註冊帳號表單就在首頁 * 右上角的搜尋框僅適合搜尋頁面,在首頁的搜尋框比較容易找到要修的翻譯字串 * 進度條 * 綠色:已經過審核(審核功能無阻擋效果) * 藍色:已翻譯 * 灰色:尚未翻譯 #### 什麼是漢語族? * 是很多種語言 * 拉丁文字:拼音系統 etc. * 包含文言文的翻譯支援 * BCP 47 缺乏漢羅的代碼 #### 臺灣原住民族語言 * 由傳教士所建立,使用拉丁文字的書寫體系 #### 什麼是 BCP 47? * 標準;語言標籤 * Hans 簡化漢字 * Hant 繁體中文? * BCP 47 由 IETF 組織管理 * 可以去 IETF 的 registry 查詢 * Added 欄位:什麼時候被加進去的? * Suppress-Script 欄位:指定是否需要忽略 script 部份(跟備援機制有關) * Macrolanguage:不只代表一種語言,可行下應用更準確的語言子標籤 * 香港:書寫用中英文、口說用英、粵、華 * BCP 47 ≠ ISO 639 * BCP 47 為了相容性沒有棄用 `sh` 語言子標籤 * 有可能有 Wikimedia 網站欄位錯誤要求你輸入 ISO 639 但實質為接受 BCP 47 輸入 ### Language statistics #### 漢語族語言 * zh-Hant-HK 為香港用詞增補集,用於替代臺灣用詞 * 非華語的簡化漢字語言翻譯進度幾乎都是 0% * > 因為要拆分這些語言的關係所以有管理權限 * 有些簡化漢字語言的漢字不能比照華語的簡化方式被簡化 #### 語言狀態 - 漢語語語言 * 上次閩南語分拆的提案(2021)被 ISO 駁回(2024/09/09)了 #### 台灣原住民語言 #### 語言狀態 - 台灣原住民語言 * 排灣族語有過匯出門檻 * 茂林語與多納語應與魯凱族分拆,但要經過 ISO 核可 * 要有能力的人填申請表 * pzh(巴宰-噶哈巫語)也需要 ISO 分拆 * 賽德克語要拆四個 * 也可以先拆三個再分拆第四個 #### 分拆不同書寫體系 * BCP 47 填申請表到 ietf-languages 郵件清單後,經過討論後正式登錄變體子標籤 * 申請表有行長硬換行限制 ### 讓 MediaWiki 支援新語言 * ISO 不分拆的語言就沒轍 * Winston 沒有 translatewiki repo 的核准(寫入)權限,所以要等 Wikimedia 語言團隊 * 魯凱族不用 Drekay 是因為族語考試題庫都沒用 Drekay * 備援鏈:先 fallback 到排灣再到繁體 * 閩東/南語不要 fallback 到彼此的拉丁文字,因為看不懂 ### 總結 ### Q&A #### (待補) #### Amir...(待補)