# <font color="#000000">The Past and Future of Hokkien Languages (nan) on Wikimedia Projects </font> <!-- Put the link to this slide here so people can follow --> <div style="font-size:16px;display:flex;background-color:rgb(157 195 145/0.5);padding:32px;justify-content:flex-end;"> <div style="flex-direction:column; text-align:left"> <font color="#000000">slide: https://hackmd.io/@wikidata-tw/B1xgEtln2</font> <!-- .slide: data-background="https://i.imgur.com/cOXo0Yj.jpg" --> <font color="#000000">Wikimania 2023 Wikimedia Taiwan Tân Suī-lîm</font> </div> </div> Note: Hello ever逐家好,我sī陳瑞霖,sī OpenStreetMap kah Wikidata 社群ê參與者, 今仔日 bueh 繼續講臺灣台語 ê 話題,題目sī「台灣台語/閩南語/福建話/咱人話 (nan) tī 維基媒體計畫 ê 過去 kah 未來」 紹介台灣話欲按怎 tī 線頂 ê 百科全書來書寫臺灣話,猶閣 ū 拄著啥款 ê 問題 --- ## Who am I? - Supaplex - [OpenStreetMap](https://www.openstreetmap.org/user/Supaplex) :heart: [Wikidata](https://www.wikidata.org/wiki/User:Supaplex) :heart: - [Wikimedia Taiwan](https://meta.wikimedia.org/wiki/Wikimedia_Taiwan/zh) :cat: Note: 阮網路上ê名號sī Supaplex,這馬 tī OpenStreetMap kah Wikidata 社群走傱 mā-sī 台灣維基協會 ê 理事 --- ## Previous Speech * The Numbers of Written Form Articles in Taiwan Taigi is quite weak, but it is improving in these years * Emphasis you can write in Hokkien on Wikipedia too * Main namespace on nan Wikipedia use POJ(Latinization form), also Possible to Write in Hanji Characters * Manpower needed Note: 最近學台語變時行,網路頂 ū 專門 ê 所在 tī-teh 寫台文。毋過無啥人欲來寫閩南語維基百科 你這馬拍開zh-min-nan Wikipedia,攏sī看著白話字,其實你嘛會當寫台文漢字 需要新ê人參與 --- ## Introduction of Min Nan/Bân-lâm/Hokkien Language ![](https://upload.wikimedia.org/wikipedia/commons/2/24/Banlamgu.svg) <a href="https://commons.wikimedia.org/wiki/File:Banlamgu.svg">Luuva</a>, <a href="https://creativecommons.org/licenses/by-sa/3.0">CC BY-SA 3.0</a>, via Wikimedia Commons Note: 除了臺灣人熟似 ê 臺灣台語 kah 福建 ê 閩南語以外,猶閣 ū 廣東 ê 潮汕話 kah 中山閩語,浙江 ê 蒼南閩語,ū 無仝程度 ê 互通性 --- ## Introduction of Min Nan/Bân-lâm/Hokkien Language * Total Speaking Population: 48 Millions * One of the Main Languages: Taiwan, Fujian(Hokkien) * Minority Languages: [The Phillippine](https://en.wikipedia.org/wiki/Philippine_Hokkien), Hong Kong, [Singapore](https://en.wikipedia.org/wiki/Singaporean_Hokkien), [Malaysia](https://en.wikipedia.org/wiki/Southern_Peninsular_Malaysian_Hokkien), [Indonesia](https://en.wikipedia.org/wiki/Medan_Hokkien), Thailand, --- ## The Past of Taiwanese Taigi * One Language Policy * Mandarin in Education System * Entertainment: Taigi Songs, Drama * Market language Note: 過去因為政府消滅(siau-bia̍t)方言政策,台語 ê 發展受著限制,親像教育系統 kah 媒體圈 sī 國語為主。ū 一部份 ê 娛樂圈 ū 推出台語歌 kah 戲齣作品 koh-lâi sī 市場 ū 用台語來溝通交易(kau-i̍k) --- ## The Recent Developement of Taiwanese Taigi * End of the One Language Policy in 1993 which Limited the Boardcasting time of Taigi or Hakka * Taigi Language Test: Ministry of Education, National Chengchong Unversity * Became one of the National Languages in 2017 after the Pass of [Development of National Languages Act](https://www.wikidata.org/wiki/Q9685196) * POJ or Hanji * Online Dictionary: * [The 2023 New Version Taigi Dictionary](https://sutian.moe.edu.tw/zh-hant/) * [ChhoeTaigi](https://chhoe.taigi.info/) Dictionary from [Tâibûn Kesimī](https://www.zeczec.com/projects/taibun-kesimi) Crowd-fund Project Note: 對1993年廢除電視遐ê方言限制,教育系統遮 mā 開始 ū 本土語言 ê 教育。這馬台語ê語言檢定 ū 教育部 kah 成大 ê 系統,ū 正式教師 kah 支援教師。 欲選漢字ū本字之爭,POJ 抑是漢字ê問題 線頂辭典 ū 改版 ê 教育部辭典 kah 整理過往辭典資料 ê 台文雞絲麵計畫,上出名 sī 揣台語網站 --- ## [PTS Taigi Station](https://www.taigitv.org.tw/) ![](https://hackmd.io/_uploads/H1YgKfLhh.png) --- ## The Possible Split of nan * Appeal for a (https://iso639-3.sil.org/request/2021-045) ISO 639-3 Code by ÌTHUÂN KHOKI (意傳科技) and other NGOs * Taiwan Taigi: oan * nan split into Eleven Codes: [Luezhou Min](https://en.wikipedia.org/wiki/Leizhou_Min), [Hainanese](https://en.wikipedia.org/wiki/Hainanese), [Haklau](https://zh.wikipedia.org/wiki/%E6%B5%B7%E4%B8%B0%E8%AF%9D), [Datian Min](https://en.wikipedia.org/wiki/Datian_Min), [Zhangzhou & Quanzhou](https://en.wikipedia.org/wiki/Hokkien), Zhenan Min, [Teo-Swa](https://en.wikipedia.org/wiki/Teo-Swa_Min), [Zhongshan Min](https://en.wikipedia.org/wiki/Zhongshan_Min) etc. Note: 有人無佮意閩南語 ê 這个名號,所以2021年時 ū 提案,bueh kā 原來 nan 代碼分做 11 ê,臺灣話hōo 伊新ê代碼oan,其他原來tī nan 代碼下跤ê語言,親像雷州話、海南話、海陸話、浙南閩語、潮汕話、漳泉話、龍嚴話,ē ū 新 ê 代碼 --- ## The Different Names and Varies of Hokkien * Taiwan: Tâi-uân Bân-lâm-gú/Tâi-uân Bân-lâm-gí/Tâi-uân Bân-lâm-gír * Historic Name: Tâi-oân-ōe, Tâi-gí * New Official Name: Taiwanese Taigi(Proposed) * South East Asia: Hokkian/Hokkien/福建話 * The Phillipine: Lan-lang-oe/咱人話/咱儂話 * Hakka's called Hoklo(鶴老話) Note: 真濟人無愛閩南語這个名號,毋過臺灣閩南語sī目前ê官方名號 歷史上有人講叫做臺灣話,台語 官方ū拍算欲改做台灣台語這个名 福建話(Hok-kiàn-uē),sī 自稱 mā-ū 別人 hōo-ê 稱呼,mā-ū 對家己 ê 角度 ê 稱呼 ê 咱人話。客人sī叫鶴老話 --- ## Wiki 頂懸 ê 臺灣台語內容 * [Min Nan Wikipedia](https://nan.wikipedia.org/) * [Wikidata](https://wikidata.org) nan/nan-hani labels, description * Wikidata [Lexeme](https://www.wikidata.org/wiki/Wikidata:Lexicographical_data) (Wikidata Lexeme) * [Wiktionary](https://www.wiktionary.org/) --- ## Bân-lâm-gú(nan) Wikipedia [Tâi-tang-koān](https://nan.wikipedia.org/wiki/T%C3%A2i-tang-ko%C4%81n) án-ni niā-niā ![](https://i.imgur.com/ZbkYMmJ.png) Note: ISO-639-3 hōo 閩南語 ū 獨立 ê 代碼sī teh 閩南語維基百科成立後tsiah-ū ê,所以後來 ū 對nan轉址到 zh-min-nan 社群 bô 活力,kah台灣相關ê條目,親像臺東縣無啥人tī-teh寫,敢若 ū 底下 ê 鄉鎮市 ê 連結 style=" --- ## The Problem of nan Wikipedia <div style="background-color: black; color: white;display:inline-flex;align-items:center;gap:2rem;"> <div style="flex:1;text-align:left;font-size:110%;" left> * More Favor of POJ, lack of Hanji Content * Too much Administrative Articles, not so many Scinece Articles * Lack of Community * Many Articles not linking to Wikidata </div> <div style="flex:1;text-align:left;font-size:110%;" left> * 無使用永久重覆項處理無仝書寫方式 * 整體 nan 社群討論風氣無好,愛攻擊無仝主張 ê 人 </div> </div> Note: 咱來看 nan Wikipedia 問題,早期參與者ê決定,𪜶排斥(pâi-thik)漢字,無愛人來寫漢字 為著條目ê數量夠濟,大量用機器人加添無啥內容ê地號名 應對小數漢字版本ê條目,嘛無用永久重複項處理tī Wikidata ê 連結問題 --- ## Problem of nan Wikipedia 2 - Spam ![](https://hackmd.io/_uploads/HJ-yDIdKh.png) --- ## Problem Case 1: Duplicated Poland Place ![](https://i.imgur.com/34pAuwY.png) Note: 重複匯入資料,仝款ê波蘭地號名。臺灣遮嘛有人做佮Cebu仝款的代誌,大量機器人去創造條目,毋過後續無人來編輯 --- ## Problem Case 2: Thousands of Non Wikidata-linked Articles ![](https://i.imgur.com/7McrjBB.png) Note: 無對著較新 ê Wikidata 計畫,zh-min-nan Wikipedia ū 上千ê條目無對應到Wikidata --- ## Problem Case 3: Duplicated Villages in Taipei(Fixed) ![](https://i.imgur.com/WvSv8co.png) Note: 進前兩冬有處理匯入臺灣村里到 Wikidata 遐,自本sī認為干焦ū兩三个人仝時做,無細膩重複。毋過代誌毋是咱想ê遐簡單 --- ## Problem Case 3: Duplicated Villages in Taipei(Fixed) ![](https://i.imgur.com/MPomHNc.png) Note: 以早有人tī zh-min-nan 建立條目,干焦兩句話ê條目,毋過嘛hōo機器人建立對應 ê Wikidata 項目 --- ## Problem Case 3: Duplicated Villages in Taipei(Fixed) ![](https://i.imgur.com/WjEmd46.png) Note: 後來匯入時無檢查到,煞重複增加ê里 --- ## Wikidata Labels & Descritions: nan, nan-hani ![](https://hackmd.io/_uploads/Hk3VMfxi2.png) Note: 嘛 ē-tàng 寫台文漢字,毋是干焦 ū 白話字 --- ## POJ and Hanji: Permanent Duplicated Item * 客家話、閩東話有 buē-tsio 漢字 kah POJ ê 條目 * 予講仝一件代誌無仝ê書寫方式會當tī Wikidata 連結 Note: 因為長江南爿 ê 漢語族語言,比如講吳語、閩東話、客家話 ū 真深 ê 羅馬字拼寫傳統,佮官話系統音差真濟,所以仝款ê內容(luē-iông),ū 兩種無仝寫法ê頁面 tī Wikidata 遮就 hōo 其中一頁指定sī永久重覆頁面來處理,白話字kah漢字版本之間 iōng 永久重複項連結 ---- ## [Permanent Duplicated Item](https://www.wikidata.org/wiki/Property:P2959)(P2959) > this item duplicates another item and the two can't be merged, as one Wikimedia project includes two pages, e.g. in different scripts or languages (only applies to some wikis, e.g.: cdowiki, gomwiki, nanwiki). Use P31=Q17362920 for other wikis. Note: 仝內容,毋過用無仝書寫系統,親像無仝字母抑是語言。以早是因為閩東語關係有用漢字抑是白話字的條目,所以提這个屬性property ---- ## [Wikimedia Permanent Duplicated Page](https://www.wikidata.org/wiki/Q21286738)(Q21286738) > this item duplicates another item and the two can't be merged, as one Wikimedia project includes two pages, e.g. in different scripts or languages (only applies to some wikis, e.g.: cdowiki, gomwiki, nanwiki). Use P31=Q17362920 for other wikis. Note: 說明是無法度合併,因為書寫系統無仝。 ---- ## Example of Permanent Duplicated Item [Taiwan Permanent Duplicated Item](https://www.wikidata.org/wiki/Q22337467) ![](https://i.imgur.com/PNFXPJ8.png) Note: 來看覓咱國中華民國ê永久重複頁面,ū客家話、閩東話、zh min-nan,kah印度遐ê語言 ---- ## Relation between Permanent Duplicated Item || Main Item | Permanent Duplicated Item | |------| -------- | -------- | |Wikidata| [Q865](https://www.wikidata.org/wiki/Q865) | [Q22337467](https://www.wikidata.org/wiki/Q22337467) | | zh-min-nan | [Tiong-hôa-bîn-kok](https://zh-min-nan.wikipedia.org/wiki/Tiong-ho%C3%A2_B%C3%AEn-kok) | [Taiwan](https://zh-min-nan.wikipedia.org/wiki/Pang-chān:中華民國) | | hak | [Chûng-fà Mìn-koet](https://hak.wikipedia.org/wiki/Ch%C3%BBng-f%C3%A0_M%C3%ACn-koet) | [Taiwan](https://hak.wikipedia.org/wiki/中華民國) | | cdo | [Dṳ̆ng-huà Mìng-guók](https://cdo.wikipedia.org/wiki/D%E1%B9%B3%CC%86ng-hu%C3%A0_M%C3%ACng-gu%C3%B3k) | [中Taiwan](https://cdo.wikipedia.org/wiki/中華民國) | Note: 咱來直接看仝語言,用無仝書寫系統是啥意思,zh-min-nan維基百科的中華民國條目有白話字kah台文漢字的版本 --- ## Wikidata Lexeme [Wikidata辭條:箸](https://www.wikidata.org/wiki/Lexeme:L305178) ![](https://i.imgur.com/rXkl1wR.png) Note: Wikidataê辭條sī新ê物件,收語言資料 毋但主流ê語言,mā會當收小數語言 ---- ## Wikidata Lexeme Meaning and Translation ![](https://i.imgur.com/ktG7XRc.png) Note: 辭條會當寫字詞ê意義,猶閣ū翻譯,翻譯會當連到別ê語言ê辭條 ---- ## Wikidata Lexeme Including Dialect and scripts(POJ, Tai-lo) ![](https://i.imgur.com/gL7PxDe.png) Note: 收無仝所在ê方音變體,台灣較ū聽著ê漳州腔,泉州腔,猶有鹿港仔腔(lo̍k-ka̋ng-á),安溪話,宜蘭腔,永靖腔(eng-tseng) ---- ## Wikidata Lexeme Example Sentence ![](https://i.imgur.com/CF927La.png) Note: mā-ū收例句,主要iōng漢字kah羅馬字 ---- ## Lexeme Challenge ![](https://hackmd.io/_uploads/r160JGej3.png) Note: 定期推出,鼓勵逐家一禮拜一禮拜來寫辭條,逐禮拜無仝主題 ---- ## Merits of Writing Hokkien on Wikidata * Using few Words of short Sentences filled in Description * An already Existing Structure ** Use English as Reference to Write Hokkien ** No need to rely on Mandarin * Writing form: POJ, nan-hani, or Mixed(漢羅濫) * Linked Data Note: Wikidata親像in-ê兄弟維基百科,Wikidata sī國際化ê,所以mā會當直接連結外國語言 你無滿意當前ê書寫方式,mā會當照這種書寫方式來累積(luí-tsik)資料 愛注意ū可能無啥人bueh照你ê書寫方式來參與,你家己ài出較濟力 上重要 ê 一部份 sī 遮 ê 資料 sī Linked Data --- ## Sister's Project: nan name field on OSM OpenStreetMap name:nan: [Overpass Query](https://overpass-turbo.eu/s/19i0) ![](https://i.imgur.com/oGXZgZt.jpg) Note: 姊妹計畫ê狀況 sī ū 真濟計畫愈來愈重視本土語言,除了國際上時行ê語言,本地ê官方語言以外,在庄ê語言 mā ū 收錄 舉一个例,線頂共編 ê OpenStreetMap ū 收袂少 ê 台語地號名,相對之下閩南語維基百科無啥動能 咱親身看覓OpenStreetMap遮 用Overpass API來搜查(soo-tsa),大臺北尤其中永和ū真濟小地名,sī參照地方誌來標示。除了客家區,原住民區以外,真濟在庄小地名來源 sī 台語 ---- ## Wikimedia Map by Wikimedia Foundation Wikimedia Map [lang label nan POJ](https://maps.wikimedia.org/?lang=nan#7/24.722/117.806) Powered by OpenStreetMap [Taigi Hanji](https://maps.wikimedia.org/?lang=nan-HJ#16/24.9725/121.5437), [Tâi-lô](https://maps.wikimedia.org/?lang=nan-TL#16/24.9725/121.5437) ![](https://i.imgur.com/C6z5Uu4.png) Note: 維基基金會 ê 地圖 Wikimedia Map,mā會當改代碼來即時變成你想欲 ê 語言,nan sī 代表閩南話,改做nan-TL變成台羅標示,tī OpenStreetMap 遐ū資料ê攏會使顯示 ---- ## Plan for nan Wikipedia * Let's Start Contribution: POJ or Hanji * Taiwan MOE [Recommend Hanji](https://zh.wikipedia.org/zh-tw/%E8%87%BA%E7%81%A3%E9%96%A9%E5%8D%97%E8%AA%9E%E6%8E%A8%E8%96%A6%E7%94%A8%E5%AD%97) or Koa-á-chheh Characters * Hanji-POJ linked by Permanent Duplicated Items on Wikidata Note: 講遐濟,我認為你真真正正關心台語,mā-ài開一寡時間貢獻台語ê書面化,會當貢獻tī線頂資料庫 趁著教育界統一用規範字,來閩南語維基百科用規範字來寫漢文版本,嘛是會當寫POJ內容,莫攏是機器人處理的地號名矣 --- ## Plan for nan Wikipedia * Establish Mass number of Hanji Articles * Administraive units * Science * Establish the Correnspond Wikidata Permanent Duplicated Item * Telegram Group: [Wikimedia-nan](https://t.me/Wikimedia_nan) Note: 所以 ài tī 閩南語維基百科遐建立基礎,kā基礎ê資料建漢文版本,親像縣市行政區 mā-ài建 Wikidata ê永久重複項hōo程式了解 in ê關係 --- ## The Possible way of Dealing with Dialect * Depends on Editors Choose * There are some Regional Words Difference or Pronunciation Difference * Automatic Approach for Pronunciation Difference * Example: [Chinese Wikipedia Language Conversion System](https://zh.wikipedia.org/wiki/Wikipedia:%E5%AD%97%E8%A9%9E%E8%BD%89%E6%8F%9B%E8%99%95%E7%90%86) ![](https://i.imgur.com/ac0V5UV.png) Note: 中文維基百科已經ū運作誠久ê轉換系統,處理ū規則ê kah 特殊 ê 地區用詞lóng會使 運作ê方式sī án-ni,ài先建腔口ê對照表,猶有用詞對照表 ---- ## Please Join the Writing Champion * Stop the agurement * Need Code of Code to Stop the Extreme or Unproduce Speech * The Possible of the 11 ISO-639-3 code, might imclubated new Wikipedia Sites * Edit nan/nan-hani Labels or Descriptions on WIkidata * Wiktonary * Wikidata Lexeme Note: 爭取ISO-693-3新代 學術ê成果hōo維基百科來當做文獻 ài-ū 人線頂協作參與共編ê計畫,多多來寫,寫啥物,來寫維基百科,維基辭典,Wikidata --- ## [To-siā!](https://en.wiktionary.org/wiki/%E5%A4%9A%E8%AC%9D#Chinese) [sṳ̀n-mùng-ǹ!](https://en.wiktionary.org/wiki/%E6%89%BF%E8%92%99%E4%BD%A0) Thank you! :sheep: Q&A: Communication Channels - [GitHub](https://github.com/Supaplextw/)、[Wikidata](https://wikidata.org/wiki/User:Supaplex)、[OpenStreetMap](https://www.openstreetmap.org/user/Supaplex) - [email](mailto:dennis@wikimedia.tw) - Facebook Group: [Wikidata Taiwan](https://www.facebook.com/groups/2212207218990971/)、[OpenStreetMap Taiwan](https://www.facebook.com/groups/OpenStreetMap.TW/) Note: 提供聯絡訊,歡迎來揣我
{"breaks":true,"title":"<font color=\"#000000\">The Past and Future of Hokkien Languages (nan) on Wikimedia Projects </font>","description":"Note:逐家好,我sī陳瑞霖,sī OpenStreetMap kah Wikidata 社群ê參與者,今仔日 bueh 繼續講臺灣台語 ê 話題,題目sī「台灣台語/閩南語/福建話/咱人話 (nan) tī 維基媒體計畫 ê 過去 kah 未來」紹介台灣話欲按怎 tī 線頂 ê 百科全書來書寫臺灣話,猶閣 ū 拄著啥款 ê 問題","contributors":"[{\"id\":\"6d29f5f5-3da6-40f2-b920-e9a4cc2181dd\",\"add\":17287,\"del\":6034,\"latestUpdatedAt\":null}]"}
    904 views
   Owned this note