# 台灣話觀點ê閩南語維基百科-應該欲按怎做較好 <!-- Put the link to this slide here so people can follow --> slide: [https://hackmd.io/84wLiKz-TpCrm3sd65bo-Q](https://hackmd.io/gEzQ-gEIS1Gt-e61TmVMQg) COSCUP 2021 臺灣語言x維基媒體 7/31 台灣維基協會 陳瑞霖 Note: 逐家好,我是陳瑞霖,是 OpenStreetMap 佮 Wikidata 社群的參與者, 今仔日ê題目sī「台灣話觀點ê閩南語維基百科-應該欲按怎做較好」 紹介台灣話欲按怎佇線頂的百科全書來書寫臺灣話 --- ## 我是啥人? - Supaplex - OpenStreetMap :heart: Wikidata :heart: - Wikimedia Taiwan :cat: Note: 阮網路上ê名號sī Supaplex,這馬 tī OpenStreetMap kah Wikidata 社群走傱 mā-sī 台灣維基協會ê理事 --- ## 台語腔口差 * 近溪炊魚 * 雞排,豬跤,皮鞋 (ue/e, i/u) * 抓耙仔,二九暝,無暝無日 (l, j) * 七月初七,鍋仔,生鍋 (e, ue) * 臺大病院 (第五調 ê 變調) Note: 繼續講進前來紹介無仝所在ê腔口差 第一逝 tse 四字欲按怎讀?我台北人 sī 唸 kūn khue tshe hû,南部 tsit-má ê 普通腔,漳州腔sī唸 kīn khe tshue hî,我其中一爿的祖先sī安溪來的,是唸 kīrn khere tsher hîr 第二逝我唸 kue-pâi tu-kha 佮 phê-uê 第三逝sī liàu-pê-á/jiàu-pê-á, lī-káu-mî, bô-mî-bô-li̍t 第四逝 sī tshit-ge̍h tshe-tshit,e-á, sinn-e 第五逝sī第五調的變調,tai3-tai7 pinn3-inn7 5 變 3,普通腔是 tai7-tai7 penn3-inn7 5 變 7 ---- ## 用詞差別 * 讀書 vs 讀冊 * 灌腸 vs 煙腸 * thoo33-ma55-tooh3 vs 臭柿仔 vs 柑仔蜜 Note: tha̍k-tsu tha̍k-tsheh kuàn-tshiâng iân-tshiân thoo33-ma55-tooh3 ê 無仝用詞 tshàu-khī-á, kam-á-bi̍t ---- ## 台語特殊腔口 * 猶有宜蘭腔,鹿港腔,永靖腔等等 * mā-hōo 欲書面化ê台語一寡挑戰 * 欲iōng佗一个腔口來書面化 Note: 宜蘭腔tsiah-puīnn phè lōo-nuī, lo̍k-ka̋ng-á Éng-tsēng 老泉腔 ê 安溪話 an-kere 書面化ê挑戰真大 佗一个腔口來書面化? --- ## 臺灣話 kah 臺灣閩南語 * 官方名稱:臺灣閩南語(Tâi-uân Bân-lâm-gú/Tâi-uân Bân-lâm-gí/Tâi-uân Bân-lâm-gír) * 歷史上ê 名稱:臺灣話,臺語 * 新ê官方名稱:臺灣臺語 * 東南亞:Hokkian/Hokkien/福建話 * 菲律賓:咱人話/咱儂話 * 客家人ê稱呼:鶴老話 Note: 追求台灣主體性ê人無愛閩南語這个名號,毋過這sī目前ê官方名號 歷史上有人講叫做臺灣話,台語 官方ū拍算欲改做台灣台語這个名 福建話(Hok-kiàn-uē),sī 自稱 mā-ū 別人 hōo-ê 稱呼 mā-ū 對家己 ê 角度 ê 稱呼 ê 咱人話 ---- ## 台灣話 ê 定位-青盲摸象 ![](https://upload.wikimedia.org/wikipedia/commons/1/17/Illustrated_proverb-_Blind_men_and_an_elephant.jpg) <a href="https://commons.wikimedia.org/wiki/File:Illustrated_proverb-_Blind_men_and_an_elephant.jpg">Pawyi Lee</a>, Public domain, via Wikimedia Commons Note: 逐家lóng知影青盲摸象ê故事,台灣話mā-ū相𫝛ê狀況,有人講台灣話sī古早ê漢語,嘛有人講幾若代 ê 官方 sī講台語 ê 敢有影? ---- ## 台灣話 ê 定位-濟來源 * ū 上古漢語ê詞-鼎 * ū 文讀系統-真濟中古漢語ê詞-劍(kiàm)、箭(tsìnn)ê分別,念唐詩較合韻(相對華語) * 南方族群百越-狀侗語族ê底層-虼蚻、狗蟻、風颱 * 和製漢字,日文來ê詞-thôo-má-toh Note: 實際上 ê 狀況sī臺灣話ū真濟來源,無遐古早,差不多唐朝時形成 ê 臺灣話 ū 上古漢語ê古早時字,譬如講鼎 中古漢語影響臺灣話ê文讀音,所以唸唐詩較合韻 ū一寡字華語變走音ah,但是tī-teh臺語猶是照中古音 mā-ū 百越ê影響,台灣話ê底層詞,會當tuì虼蚻, 狗蟻 ka 起頭ê詞,sī 非漢語ê 風颱這个詞相對華語 sī 倒反(tò-píng) ê ---- ## 拚音ia̍h-sī文字? * 台羅ê定位:教學時陣來標示拚音 * POJ:文字 * 系出同源 * 漢字 vs 拚音 ** 逐家lóng捌漢字, POJ愛開時間來學 ** 拼音文字毋免煩惱發音問題 ** 這爿無討論寫拼音kah漢字背後ê意圖, 政治主張 Note: 臺羅、POJ各有各ê好處 寫臺語sī iōng 拼音抑是漢字,牽涉tio̍h家己本身按怎看待台語,sī誠複雜ê政治問題 ---- ## 教育部正字書寫選擇吵規晡 * 教育體系ê力量 * 學校 ê 台語老師 ** 補充教師kah台語正式教師 * 有學理上會當討論 ê 空間 * 至少 sī khah-ū 力量 * 問題: ** 連音字 ** 非漢語來源ê字得用訓讀,bah, bô hit/he tsit/tse, lâng, ê etc. Note: 教育部ê推薦(thui-tsiàn)用字,愈來愈濟人學 學校台語正式教師ài大學相關科系(台文系)畢業,整體力量sī上大ê 毋過ū一寡用字學理上會當討論,有時ū爭議(tsing-gī) 連音字ê問題,非漢語來源欲iōng訓讀處理 親像 bah, bô, 代名詞 hit/he tsit/tse, lâng, ê ---- ## 台灣閩南語常用詞辭典 * 教典,[教育部辭典](https://twblg.dict.edu.tw/holodict_new/) * 目前收上濟台語的辭典 * 附錄有地號名的整理 * 有一寡常用詞無收,例:推捒 * 傷偏漳州腔 * 應該愛揣泉州腔的人來錄音 * 衍生ê[萌典](https://www.moedict.tw/'%E6%B5%AE%E5%86%87),無收詳細ê方音差 Note: 台灣閩南語常用詞辭典簡稱sī教典,教育部辭典 收上濟ê台語辭典 附錄mā誠方便,ū收地名,身體部位ê名稱 偏漳州腔,只有漳州腔ê錄音,應該ài學習客語辭典,揣無仝腔口ê人來錄 萌典sī手機仔上方便ê辭典app,毋過無收祥細各地頭ê方音差 --- ## 維基頂懸 kah 臺灣話相關ê計劃 * [閩南語維基百科](https://nan.wikipedia.org/) * [維基辭典](https://www.wiktionary.org/) ** [英文維基辭典](https://en.wiktionary.org/wiki/Wiktionary:Main_Page) ** [中文維基辭典](https://zh.wiktionary.org/zh-hant/Wiktionary:%E9%A6%96%E9%A1%B5) ** [閩南語維基辭典](https://zh-min-nan.wiktionary.org/wiki/Th%C3%A2u-ia%CC%8Dh) * [維基數據](https://wikidata.org) ** [辭條](https://www.wikidata.org/wiki/Wikidata:Lexicographical_data) Note: 辭典無夠好,網路頂揣人來同齊(tâng-tsê)來編寫 ū閩南語維基百科,維基辭典,猶有新興ê維基數據(sòo-kù)mā會當寫辭條 ---- ## 是按怎bô臺灣話維基百科 * 臺灣臺語 kah ISO 639-3 ê 問題,敢有可能有臺灣話 ê Wikipedia? * 關心ê臺灣人愛了解規則,愛家己tī-teh國際來爭取 * 家己mā ài ū共識 * 相𫝛無仝ê代碼例: ** 塞爾維亞語(srp)/克羅埃西亞語(hrv) ** 馬來西亞語(ms)/印尼語(id) Note: Ū真濟人無愛閩南語這个名號,就無愛插閩南語維基百科。這sī因為臺灣話sī無獨立ê ISO 639-3 ê 代碼 對語言學ê角度來講,ū兩組語言,Serbian/Croatia、Bahasa Melayu/Bahasa Indonesia sī真相𫝛,毋過 ū 無仝 ê 代碼,受著政治邊界 ê 影響 ---- ## 閩南語維基百科 * 白話字為主,排斥漢字(教會ê人) * 小數 ū 漢字版本 ** 毋過視作過度ê,態度上sī ài學習白話字來寫 * ū台語人無遐熟白話字所以無啥人來寫 * 社群無活力,無綴著最近ê台語復興風潮 Note: 閩南語維基百科白話字為主,hōo人講排斥(pâi-thik)漢字,所以漢字ê內容真少 𪜶認為用白話字來寫較著,所以造成無人來寫,社群無活力(ua̍h-li̍k) ---- ## 閩南語維基百科 [Tâi-tang-koān](https://nan.wikipedia.org/wiki/T%C3%A2i-tang-ko%C4%81n) án-ni niā-niā ![](https://i.imgur.com/ZbkYMmJ.png) Note: ISO-639-3 hōo 閩南語 ū 獨立 ê 代碼sī teh 閩南語維基百科成立後tsiah-ū ê,所以後來 ū 對nan轉址到 zh-min-nan 社群 bô 活力,kah台灣相關ê條目,親像臺東縣無啥人tī-teh寫,敢若 ū 底下 ê 鄉鎮市 ê 連結 --- ## POJ kah 漢字共存ê可能-永久重覆項 * 客家話、閩東話有buē-tsio漢字kah POJ ê 條目 * 予講仝一件代誌無仝ê書寫方式會當tī Wikidata 連結 Note: 因為長江南爿 ê 漢語族語言,比如講吳語、閩東話、客家話 ū 真深 ê 羅馬字拼寫傳統,佮官話系統音差真濟,所以仝款ê內容(luē-iông),ū 兩種無仝寫法ê頁面 tī Wikidata 遮就 hōo 其中一頁指定sī永久重覆頁面來處理,白話字kah漢字版本之間 iōng 永久重複項連結 ---- ## Wikidata 頁面 [中華民國永久重覆頁面](https://www.wikidata.org/wiki/Q22337467) ![](https://i.imgur.com/wua3UJB.png) Note: 來看覓咱國中華民國ê永久重複頁面,ū客家話,閩東話,kah印度遐ê語言,假使講有人建閩南語維基ê條目mā會當連過來 --- ## 客語大茅埔ê推廣 ![](https://i.imgur.com/8NbAipK.png) Note: 客家語資源濟,毋但客委會,猶閣 ū 客傳會ê資源,雖然佇民間 ê 活力客家話無蓋好,毋過至少 ū 官方ê資源入來 甚至投入資源 tī COSCUP ---- ## 台灣南島語族ê維基百科 * 撒奇萊雅族語 ** 原先 tī ISO-639-3 代碼 sī ais ** hōo視為阿美語變體,毋過並毋是 ** 申請新代碼szy * 台灣維基協會鬥相共 * 泰雅語 tay * 太魯閣語/賽德克語 trv Note: 這幾年台灣維基協會幫贊三个原住民南島語言泰雅語(Atayal)、太魯閣語(Truku)、撒奇萊雅語(Sakizaya)成立維基百科 其中猶閣發見撒奇萊雅語(Sakizaya)ê iso-639-3 創毋著,所以新申請代碼 szy ---- ## 泰雅語、賽德克語維基百科上線 [「族語維基集向國際」 泰雅語與賽德克語正式列入維基百科語言列](https://epaper.edu.tw/topical.aspx?period_num=969&topical_sn=1196&page=0) ![](https://i.imgur.com/v3C7nPn.png) Note: 台灣維基協會 ū 原住民語,ū 客家話ê計畫,無臺灣話ê計畫 真可惜協會 ê 成員無法度為家己 ê 母語來做代誌,攏是原住民,客家話 ū 資源創一寡代誌 --- ## 維基辭條 * 真濟內容對教育部辭典來ê * 英文維基辭典收較濟資料 Note: 真濟內容對教育部辭典來ê 英文維基辭典收上濟資料 --- ## Wikidata 標籤(label) 敘述(Description) 母語名稱([P1705](https://www.wikidata.org/wiki/Property:P1705)) 官方名稱([P1448](https://www.wikidata.org/wiki/Property:P1448)) Note: Wikidata 遮會當寫台語ê欄位(lân-uī):標籤,描述,母語名稱,官方名稱 --- ## 教育部本土語言標示計劃 * [教育部以本土語言標注臺灣地名計畫](https://language.moe.gov.tw/001/Upload/Files/site_content/M0001/mhigeonames/twplacename.html) * 森林公園站(Som-lîm Kong-hn̂g tsām) ![](https://i.imgur.com/ZneFJOK.png) Note: 雖然官方予台灣話的資源無濟,但是猶是有做一寡代誌 教育部以本土語言標注臺灣地名計畫這个計畫, ū 處理台中遐在地 ê 森林公園 ê 森(som) ê 唸法 ---- ## 地號名資料庫 * [地名資訊服務網](http://gn.geog.ntu.edu.tw/GeoNames/index.aspx)-臺大地理系管理ê * 內政部ê系統 * 有一寡地號名ū發音 Note: 內政部ê地號名系統-地名資訊服務網,目前𪜶sī委託臺大地理系來維護,sī官方目前收錄上濟ê系統 ---- ## 地號名資料庫 * [深坑](http://gn.geog.ntu.edu.tw/GeoNames/GNMap/GeoNamesSearchPrint.aspx?ID=1000118-001) ![](https://i.imgur.com/7x1khfe.png) Note: 內政部地名系統ū收一寡地號名ū發音,親像地名深坑(tshim-khinn) tō-ū ah,照在地安溪人ê發音唸 ---- ## Wikidata 辭條 [Wikidata辭條:箸](https://www.wikidata.org/wiki/Lexeme:L305178) ![](https://i.imgur.com/rXkl1wR.png) Note: Wikidataê辭條sī新ê物件,收語言資料 毋但主流ê語言,mā會當收小數語言 ---- ## Wikidata 辭條 意義 kah 翻譯 ![](https://i.imgur.com/ktG7XRc.png) Note: 辭條會當寫字詞ê意義,猶閣ū翻譯,翻譯會當連到別ê語言ê辭條 ---- ## Wikidata 辭條 ū 各種方音變體 ê 處理方式 ![](https://i.imgur.com/gL7PxDe.png) Note: 收無仝所在ê方音變體,台灣較ū聽著ê漳州腔,泉州腔,猶有鹿港仔腔(lo̍k-ka̋ng-á),安溪話,宜蘭腔,永靖腔(eng-tseng) ---- ## Wikidata 辭條 例句 ![](https://i.imgur.com/CF927La.png) Note: mā-ū收例句,主要iōng漢字kah羅馬字 ---- ## Wikidata ê優點 * 跨語言,會當直接對英文ê資料 ** 擺脫台語倚佇華語底下ê情形 ** 國際接軌 * 會當寫bô-kâng ê書寫方式 * 連接資料 (Linked Data) Note: Wikidata親像in-ê兄弟維基百科,Wikidata sī國際化ê,所以mā會當直接連結外國語言 你無滿意當前ê書寫方式,mā會當照這種書寫方式來累積(luí-tsik)資料 愛注意ū可能無啥人bueh照你ê書寫方式來參與,你家己ài出較濟力 上重要 ê 一部份 sī 遮 ê 資料 sī Linked Data --- ## 姊妹仔計畫ê狀況 * OpenStreetMap ū 收 name:nan * Wikidata 有人寫台語的說明文件 * OpenStreetMap 嘛有人寫台語的文件 * Wikidata ū Label_nan,mā-ū 辭條 * 閩南語維基百科停滯不前 Note: 姊妹計畫ê狀況 sī ū 真濟計畫愈來愈重視本土語言,除了國際上時行ê語言,本地ê官方語言以外,在庄ê語言 mā ū 收錄 舉一个例,線頂共編 ê OpenStreetMap ū 收袂少 ê 台語地號名,相對之下閩南語維基百科無啥動能 ---- ## OSM 台語標示 [Overpass 檢索](https://overpass-turbo.eu/s/19i0) ![](https://i.imgur.com/oGXZgZt.jpg) Note: 咱親身看覓OpenStreetMap遮 用Overpass API來搜查(soo-tsa),大臺北尤其中永和ū真濟小地名,sī參照地方誌來標示。除了客家區,原住民區以外,真濟在庄小地名來源 sī 台語 ---- ## Wikimedia Map [Wikimedia Map lang label nan](https://maps.wikimedia.org/?lang=nan#7/24.722/117.806) OpenStreetMap ê 資料 [台文漢字](https://maps.wikimedia.org/?lang=nan-Hant#16/24.9725/121.5437)、[台羅](https://maps.wikimedia.org/?lang=nan-Latn-tailo#16/24.9725/121.5437) ![](https://i.imgur.com/C6z5Uu4.png) Note: 維基基金會 ê 地圖 Wikimedia Map,mā會當改代碼來即時變成你想欲 ê 語言,nan sī 代表閩南話,改做nan-TL變成台羅標示,tī OpenStreetMap 遐ū資料ê攏會使顯示 ---- ## Taigi 地圖 [Taigi地圖](https://protomaps.com/lab/taigi/#11.93/24.74992/121.06907) OpenStreetMap name:nan tag ![](https://i.imgur.com/EAGVSyG.jpg) Note: 今仔日有演講 ê Brandon sī地圖專家,hōo足濟人講ài來做台語地圖 伊 ê 地圖 mā-sī顯示 OpenStreetMap ū ê name:nan 標示地號名 --- ## 閩南語維基百科ê計畫 * 寫,毋管sīPOJ ia̍h-sī漢字攏來 * 漢字用教育部[規範漢字](https://zh.wikipedia.org/zh-tw/%E8%87%BA%E7%81%A3%E9%96%A9%E5%8D%97%E8%AA%9E%E6%8E%A8%E8%96%A6%E7%94%A8%E5%AD%97) * 漢字-POJ版本佇Wikidata用永久重複項處理 * Wiki Commons [收錄音](https://commons.wikimedia.org/wiki/Category:Audio_files_in_Taiwanese),寫台語ê說明 * [POJ infobox](https://zh.wikipedia.org/wiki/Template:Infobox_Hokkien_name) 截取,搬到 Wikidata tsit-pîng Note: 講遐濟,我認為你真真正正關心台語,mā-ài開一寡時間貢獻台語ê書面化,會當貢獻tī線頂資料庫 趁著教育界統一用規範字,來閩南語維基百科用規範字來寫漢文版本 進前講過 Wikidata 遐會當處理漢字-POJ ê資料連結問題 ū錄音抑是程式ê能力,mā會當透過聲音kah資料處理來貢獻 --- ## 閩南語維基百科ê計畫 * 閩南語維基百科大量建漢字版本 * 縣市、行政區條目進行 * 國家公園 * 高速公路 * 歷任總統 * Wikidata建永久重覆項 Note: 所以 ài tī 閩南語維基百科遐建立基礎,kā基礎ê資料建漢文版本,親像縣市行政區 國家公園,高速公路,歷史上ê總統 mā-ài建 Wikidata ê永久重複項hōo程式了解 in ê關係 --- ## 無組織ê台語 * 原住民族語有學術機關的資源,相比之下台語無組織(較細)來推動 * ū 倡議組織 * 書面數位化欠人做 * 無死 sī 因為 sī 上濟人母語,基礎厚 * ū 人講愛 ū 台語委員會 Note: 看著原住民語kah客家話,雖然人口少但是ū組織(tsoo-tsit),ū一定ê發展 對比台語,ū倡議(tshiong-gī)組織真濟,猶毋過欠缺(khiàm-khueh)書面ê數位化,毋免講Wikidata kah OpenStreetMap 遮資料ê貢獻kah維護 台語無遐慘sī因為人口濟,基礎厚niā-niā,長期sī無受著重視 ---- ## 台語腔口差 ê 處理 * 參與者寫啥件就收 * 讀音的差異、字辭的差異 * 透過轉換系統來處理無仝的腔口差 * [中文維基百科的繁簡地區詞轉換系統](https://zh.wikipedia.org/wiki/Wikipedia:%E5%AD%97%E8%A9%9E%E8%BD%89%E6%8F%9B%E8%99%95%E7%90%86) Note: 中文維基百科已經ū運作誠久ê轉換系統,處理ū規則ê kah 特殊 ê 地區用詞lóng會使 ---- ## 轉換系統ê運作方式 * 有人建對應轉換詞/腔口對照 * 手工單一ê條目ê轉換 ![](https://i.imgur.com/ac0V5UV.png) Note: 運作ê方式sī án-ni,ài先建腔口ê對照表,猶有用詞對照表 ---- ## 倡議之外多多來寫 * ISO-639-3 爭取新代碼,閣來成立台語ê百科 * ū學術ê討論,才會當當做來源文獻寫百科 * 來寫閩南語維基百科 * 來寫維基辭典 * 來寫Wikidata辭條 Note: 爭取ISO-693-3新代碼 學術ê成果hōo維基百科來當做文獻 ài-ū 人線頂協作參與共編ê計畫,多多來寫,寫啥物,來寫維基百科,維基辭典,Wikidata --- ## OSM x Wikidata 月聚 * 8/9 19:30 @摩茲工寮 * Facebook [OpenStreetMap台灣](https://www.facebook.com/groups/OpenStreetMap.TW/) Note: 工商服務時間, 8月初9希望解封,防疫第二級會當佇 Moz 工寮聚會,毋過無法度就繼續線頂虛擬(hi-gí)聚會(tsū-huē) --- ## 謝謝! :sheep: Q&A: [Sli.do #655 632](https://wall.sli.do/event/psmfh4pl) 你會當佇紲來ê管道揣著我 - [GitHub](https://github.com/Supaplextw/)、[Wikidata](https://wikidata.org/wiki/User:Supaplex)、[OpenStreetMap](https://www.openstreetmap.org/user/Supaplex) - 或是 [email](mailto:dennis@wikimedia.tw) 我 - 臉書 [Wikidata Taiwan](https://www.facebook.com/groups/2212207218990971/)、[OpenStreetMap台灣](https://www.facebook.com/groups/OpenStreetMap.TW/) Note: 提供聯絡訊,歡迎來揣我
{"metaMigratedAt":"2023-06-16T02:45:07.599Z","metaMigratedFrom":"YAML","title":"台灣話觀點ê閩南語維基百科-應該欲按怎做較好","breaks":true,"description":"View the slide with \"Slide Mode\".","slideOptions":"{\"spotlight\":{\"enabled\":false}}","contributors":"[{\"id\":\"6d29f5f5-3da6-40f2-b920-e9a4cc2181dd\",\"add\":15432,\"del\":4452}]"}
    700 views
   owned this note