# 台灣話觀點ê閩南語維基百科-應該欲按怎做較好
<!-- Put the link to this slide here so people can follow -->
slide: [https://hackmd.io/84wLiKz-TpCrm3sd65bo-Q](https://hackmd.io/gEzQ-gEIS1Gt-e61TmVMQg)
COSCUP 2021 臺灣語言x維基媒體 7/31
台灣維基協會 陳瑞霖
Note:
逐家好,我是陳瑞霖,是 OpenStreetMap 佮 Wikidata 社群的參與者,
今仔日ê題目sī「台灣話觀點ê閩南語維基百科-應該欲按怎做較好」
紹介台灣話欲按怎佇線頂的百科全書來書寫臺灣話
---
## 我是啥人?
- Supaplex
- OpenStreetMap :heart: Wikidata :heart:
- Wikimedia Taiwan :cat:
Note:
阮網路上ê名號sī Supaplex,這馬 tī OpenStreetMap kah Wikidata 社群走傱
mā-sī 台灣維基協會ê理事
---
## 台語腔口差
* 近溪炊魚
* 雞排,豬跤,皮鞋 (ue/e, i/u)
* 抓耙仔,二九暝,無暝無日 (l, j)
* 七月初七,鍋仔,生鍋 (e, ue)
* 臺大病院 (第五調 ê 變調)
Note:
繼續講進前來紹介無仝所在ê腔口差
第一逝 tse 四字欲按怎讀?我台北人 sī 唸 kūn khue tshe hû,南部 tsit-má ê 普通腔,漳州腔sī唸 kīn khe tshue hî,我其中一爿的祖先sī安溪來的,是唸 kīrn khere tsher hîr
第二逝我唸 kue-pâi tu-kha 佮 phê-uê
第三逝sī liàu-pê-á/jiàu-pê-á, lī-káu-mî, bô-mî-bô-li̍t
第四逝 sī tshit-ge̍h tshe-tshit,e-á, sinn-e
第五逝sī第五調的變調,tai3-tai7 pinn3-inn7 5 變 3,普通腔是 tai7-tai7 penn3-inn7 5 變 7
----
## 用詞差別
* 讀書 vs 讀冊
* 灌腸 vs 煙腸
* thoo33-ma55-tooh3 vs 臭柿仔 vs 柑仔蜜
Note:
tha̍k-tsu tha̍k-tsheh
kuàn-tshiâng iân-tshiân
thoo33-ma55-tooh3 ê 無仝用詞 tshàu-khī-á, kam-á-bi̍t
----
## 台語特殊腔口
* 猶有宜蘭腔,鹿港腔,永靖腔等等
* mā-hōo 欲書面化ê台語一寡挑戰
* 欲iōng佗一个腔口來書面化
Note:
宜蘭腔tsiah-puīnn phè lōo-nuī, lo̍k-ka̋ng-á
Éng-tsēng
老泉腔 ê 安溪話 an-kere
書面化ê挑戰真大
佗一个腔口來書面化?
---
## 臺灣話 kah 臺灣閩南語
* 官方名稱:臺灣閩南語(Tâi-uân Bân-lâm-gú/Tâi-uân Bân-lâm-gí/Tâi-uân Bân-lâm-gír)
* 歷史上ê 名稱:臺灣話,臺語
* 新ê官方名稱:臺灣臺語
* 東南亞:Hokkian/Hokkien/福建話
* 菲律賓:咱人話/咱儂話
* 客家人ê稱呼:鶴老話
Note:
追求台灣主體性ê人無愛閩南語這个名號,毋過這sī目前ê官方名號
歷史上有人講叫做臺灣話,台語
官方ū拍算欲改做台灣台語這个名
福建話(Hok-kiàn-uē),sī 自稱 mā-ū 別人 hōo-ê 稱呼
mā-ū 對家己 ê 角度 ê 稱呼 ê 咱人話
----
## 台灣話 ê 定位-青盲摸象

<a href="https://commons.wikimedia.org/wiki/File:Illustrated_proverb-_Blind_men_and_an_elephant.jpg">Pawyi Lee</a>, Public domain, via Wikimedia Commons
Note:
逐家lóng知影青盲摸象ê故事,台灣話mā-ū相𫝛ê狀況,有人講台灣話sī古早ê漢語,嘛有人講幾若代 ê 官方 sī講台語 ê
敢有影?
----
## 台灣話 ê 定位-濟來源
* ū 上古漢語ê詞-鼎
* ū 文讀系統-真濟中古漢語ê詞-劍(kiàm)、箭(tsìnn)ê分別,念唐詩較合韻(相對華語)
* 南方族群百越-狀侗語族ê底層-虼蚻、狗蟻、風颱
* 和製漢字,日文來ê詞-thôo-má-toh
Note:
實際上 ê 狀況sī臺灣話ū真濟來源,無遐古早,差不多唐朝時形成 ê
臺灣話 ū 上古漢語ê古早時字,譬如講鼎
中古漢語影響臺灣話ê文讀音,所以唸唐詩較合韻
ū一寡字華語變走音ah,但是tī-teh臺語猶是照中古音
mā-ū 百越ê影響,台灣話ê底層詞,會當tuì虼蚻, 狗蟻 ka 起頭ê詞,sī 非漢語ê
風颱這个詞相對華語 sī 倒反(tò-píng) ê
----
## 拚音ia̍h-sī文字?
* 台羅ê定位:教學時陣來標示拚音
* POJ:文字
* 系出同源
* 漢字 vs 拚音
** 逐家lóng捌漢字, POJ愛開時間來學
** 拼音文字毋免煩惱發音問題
** 這爿無討論寫拼音kah漢字背後ê意圖, 政治主張
Note:
臺羅、POJ各有各ê好處
寫臺語sī iōng 拼音抑是漢字,牽涉tio̍h家己本身按怎看待台語,sī誠複雜ê政治問題
----
## 教育部正字書寫選擇吵規晡
* 教育體系ê力量
* 學校 ê 台語老師
** 補充教師kah台語正式教師
* 有學理上會當討論 ê 空間
* 至少 sī khah-ū 力量
* 問題:
** 連音字
** 非漢語來源ê字得用訓讀,bah, bô hit/he tsit/tse, lâng, ê etc.
Note:
教育部ê推薦(thui-tsiàn)用字,愈來愈濟人學
學校台語正式教師ài大學相關科系(台文系)畢業,整體力量sī上大ê
毋過ū一寡用字學理上會當討論,有時ū爭議(tsing-gī)
連音字ê問題,非漢語來源欲iōng訓讀處理
親像 bah, bô, 代名詞 hit/he tsit/tse, lâng, ê
----
## 台灣閩南語常用詞辭典
* 教典,[教育部辭典](https://twblg.dict.edu.tw/holodict_new/)
* 目前收上濟台語的辭典
* 附錄有地號名的整理
* 有一寡常用詞無收,例:推捒
* 傷偏漳州腔
* 應該愛揣泉州腔的人來錄音
* 衍生ê[萌典](https://www.moedict.tw/'%E6%B5%AE%E5%86%87),無收詳細ê方音差
Note:
台灣閩南語常用詞辭典簡稱sī教典,教育部辭典
收上濟ê台語辭典
附錄mā誠方便,ū收地名,身體部位ê名稱
偏漳州腔,只有漳州腔ê錄音,應該ài學習客語辭典,揣無仝腔口ê人來錄
萌典sī手機仔上方便ê辭典app,毋過無收祥細各地頭ê方音差
---
## 維基頂懸 kah 臺灣話相關ê計劃
* [閩南語維基百科](https://nan.wikipedia.org/)
* [維基辭典](https://www.wiktionary.org/)
** [英文維基辭典](https://en.wiktionary.org/wiki/Wiktionary:Main_Page)
** [中文維基辭典](https://zh.wiktionary.org/zh-hant/Wiktionary:%E9%A6%96%E9%A1%B5)
** [閩南語維基辭典](https://zh-min-nan.wiktionary.org/wiki/Th%C3%A2u-ia%CC%8Dh)
* [維基數據](https://wikidata.org)
** [辭條](https://www.wikidata.org/wiki/Wikidata:Lexicographical_data)
Note:
辭典無夠好,網路頂揣人來同齊(tâng-tsê)來編寫
ū閩南語維基百科,維基辭典,猶有新興ê維基數據(sòo-kù)mā會當寫辭條
----
## 是按怎bô臺灣話維基百科
* 臺灣臺語 kah ISO 639-3 ê 問題,敢有可能有臺灣話 ê Wikipedia?
* 關心ê臺灣人愛了解規則,愛家己tī-teh國際來爭取
* 家己mā ài ū共識
* 相𫝛無仝ê代碼例:
** 塞爾維亞語(srp)/克羅埃西亞語(hrv)
** 馬來西亞語(ms)/印尼語(id)
Note:
Ū真濟人無愛閩南語這个名號,就無愛插閩南語維基百科。這sī因為臺灣話sī無獨立ê ISO 639-3 ê 代碼
對語言學ê角度來講,ū兩組語言,Serbian/Croatia、Bahasa Melayu/Bahasa Indonesia sī真相𫝛,毋過 ū 無仝 ê 代碼,受著政治邊界 ê 影響
----
## 閩南語維基百科
* 白話字為主,排斥漢字(教會ê人)
* 小數 ū 漢字版本
** 毋過視作過度ê,態度上sī ài學習白話字來寫
* ū台語人無遐熟白話字所以無啥人來寫
* 社群無活力,無綴著最近ê台語復興風潮
Note:
閩南語維基百科白話字為主,hōo人講排斥(pâi-thik)漢字,所以漢字ê內容真少
𪜶認為用白話字來寫較著,所以造成無人來寫,社群無活力(ua̍h-li̍k)
----
## 閩南語維基百科
[Tâi-tang-koān](https://nan.wikipedia.org/wiki/T%C3%A2i-tang-ko%C4%81n) án-ni niā-niā

Note:
ISO-639-3 hōo 閩南語 ū 獨立 ê 代碼sī teh 閩南語維基百科成立後tsiah-ū ê,所以後來 ū 對nan轉址到 zh-min-nan
社群 bô 活力,kah台灣相關ê條目,親像臺東縣無啥人tī-teh寫,敢若 ū 底下 ê 鄉鎮市 ê 連結
---
## POJ kah 漢字共存ê可能-永久重覆項
* 客家話、閩東話有buē-tsio漢字kah POJ ê 條目
* 予講仝一件代誌無仝ê書寫方式會當tī Wikidata 連結
Note:
因為長江南爿 ê 漢語族語言,比如講吳語、閩東話、客家話 ū 真深 ê 羅馬字拼寫傳統,佮官話系統音差真濟,所以仝款ê內容(luē-iông),ū 兩種無仝寫法ê頁面
tī Wikidata 遮就 hōo 其中一頁指定sī永久重覆頁面來處理,白話字kah漢字版本之間 iōng 永久重複項連結
----
## Wikidata 頁面
[中華民國永久重覆頁面](https://www.wikidata.org/wiki/Q22337467)

Note:
來看覓咱國中華民國ê永久重複頁面,ū客家話,閩東話,kah印度遐ê語言,假使講有人建閩南語維基ê條目mā會當連過來
---
## 客語大茅埔ê推廣

Note:
客家語資源濟,毋但客委會,猶閣 ū 客傳會ê資源,雖然佇民間 ê 活力客家話無蓋好,毋過至少 ū 官方ê資源入來
甚至投入資源 tī COSCUP
----
## 台灣南島語族ê維基百科
* 撒奇萊雅族語
** 原先 tī ISO-639-3 代碼 sī ais
** hōo視為阿美語變體,毋過並毋是
** 申請新代碼szy
* 台灣維基協會鬥相共
* 泰雅語 tay
* 太魯閣語/賽德克語 trv
Note:
這幾年台灣維基協會幫贊三个原住民南島語言泰雅語(Atayal)、太魯閣語(Truku)、撒奇萊雅語(Sakizaya)成立維基百科
其中猶閣發見撒奇萊雅語(Sakizaya)ê iso-639-3 創毋著,所以新申請代碼 szy
----
## 泰雅語、賽德克語維基百科上線
[「族語維基集向國際」 泰雅語與賽德克語正式列入維基百科語言列](https://epaper.edu.tw/topical.aspx?period_num=969&topical_sn=1196&page=0)

Note:
台灣維基協會 ū 原住民語,ū 客家話ê計畫,無臺灣話ê計畫
真可惜協會 ê 成員無法度為家己 ê 母語來做代誌,攏是原住民,客家話 ū 資源創一寡代誌
---
## 維基辭條
* 真濟內容對教育部辭典來ê
* 英文維基辭典收較濟資料
Note:
真濟內容對教育部辭典來ê
英文維基辭典收上濟資料
---
## Wikidata
標籤(label)
敘述(Description)
母語名稱([P1705](https://www.wikidata.org/wiki/Property:P1705))
官方名稱([P1448](https://www.wikidata.org/wiki/Property:P1448))
Note:
Wikidata 遮會當寫台語ê欄位(lân-uī):標籤,描述,母語名稱,官方名稱
---
## 教育部本土語言標示計劃
* [教育部以本土語言標注臺灣地名計畫](https://language.moe.gov.tw/001/Upload/Files/site_content/M0001/mhigeonames/twplacename.html)
* 森林公園站(Som-lîm Kong-hn̂g tsām)

Note:
雖然官方予台灣話的資源無濟,但是猶是有做一寡代誌
教育部以本土語言標注臺灣地名計畫這个計畫, ū 處理台中遐在地 ê 森林公園 ê 森(som) ê 唸法
----
## 地號名資料庫
* [地名資訊服務網](http://gn.geog.ntu.edu.tw/GeoNames/index.aspx)-臺大地理系管理ê
* 內政部ê系統
* 有一寡地號名ū發音
Note:
內政部ê地號名系統-地名資訊服務網,目前𪜶sī委託臺大地理系來維護,sī官方目前收錄上濟ê系統
----
## 地號名資料庫
* [深坑](http://gn.geog.ntu.edu.tw/GeoNames/GNMap/GeoNamesSearchPrint.aspx?ID=1000118-001)

Note:
內政部地名系統ū收一寡地號名ū發音,親像地名深坑(tshim-khinn) tō-ū ah,照在地安溪人ê發音唸
----
## Wikidata 辭條
[Wikidata辭條:箸](https://www.wikidata.org/wiki/Lexeme:L305178)

Note:
Wikidataê辭條sī新ê物件,收語言資料
毋但主流ê語言,mā會當收小數語言
----
## Wikidata 辭條
意義 kah 翻譯

Note:
辭條會當寫字詞ê意義,猶閣ū翻譯,翻譯會當連到別ê語言ê辭條
----
## Wikidata 辭條
ū 各種方音變體 ê 處理方式

Note:
收無仝所在ê方音變體,台灣較ū聽著ê漳州腔,泉州腔,猶有鹿港仔腔(lo̍k-ka̋ng-á),安溪話,宜蘭腔,永靖腔(eng-tseng)
----
## Wikidata 辭條
例句

Note:
mā-ū收例句,主要iōng漢字kah羅馬字
----
## Wikidata ê優點
* 跨語言,會當直接對英文ê資料
** 擺脫台語倚佇華語底下ê情形
** 國際接軌
* 會當寫bô-kâng ê書寫方式
* 連接資料 (Linked Data)
Note:
Wikidata親像in-ê兄弟維基百科,Wikidata sī國際化ê,所以mā會當直接連結外國語言
你無滿意當前ê書寫方式,mā會當照這種書寫方式來累積(luí-tsik)資料
愛注意ū可能無啥人bueh照你ê書寫方式來參與,你家己ài出較濟力
上重要 ê 一部份 sī 遮 ê 資料 sī Linked Data
---
## 姊妹仔計畫ê狀況
* OpenStreetMap ū 收 name:nan
* Wikidata 有人寫台語的說明文件
* OpenStreetMap 嘛有人寫台語的文件
* Wikidata ū Label_nan,mā-ū 辭條
* 閩南語維基百科停滯不前
Note:
姊妹計畫ê狀況 sī ū 真濟計畫愈來愈重視本土語言,除了國際上時行ê語言,本地ê官方語言以外,在庄ê語言 mā ū 收錄
舉一个例,線頂共編 ê OpenStreetMap ū 收袂少 ê 台語地號名,相對之下閩南語維基百科無啥動能
----
## OSM 台語標示
[Overpass 檢索](https://overpass-turbo.eu/s/19i0)

Note:
咱親身看覓OpenStreetMap遮
用Overpass API來搜查(soo-tsa),大臺北尤其中永和ū真濟小地名,sī參照地方誌來標示。除了客家區,原住民區以外,真濟在庄小地名來源 sī 台語
----
## Wikimedia Map
[Wikimedia Map lang label nan](https://maps.wikimedia.org/?lang=nan#7/24.722/117.806)
OpenStreetMap ê 資料
[台文漢字](https://maps.wikimedia.org/?lang=nan-Hant#16/24.9725/121.5437)、[台羅](https://maps.wikimedia.org/?lang=nan-Latn-tailo#16/24.9725/121.5437)

Note:
維基基金會 ê 地圖 Wikimedia Map,mā會當改代碼來即時變成你想欲 ê 語言,nan sī 代表閩南話,改做nan-TL變成台羅標示,tī OpenStreetMap 遐ū資料ê攏會使顯示
----
## Taigi 地圖
[Taigi地圖](https://protomaps.com/lab/taigi/#11.93/24.74992/121.06907)
OpenStreetMap name:nan tag

Note:
今仔日有演講 ê Brandon sī地圖專家,hōo足濟人講ài來做台語地圖
伊 ê 地圖 mā-sī顯示 OpenStreetMap ū ê name:nan 標示地號名
---
## 閩南語維基百科ê計畫
* 寫,毋管sīPOJ ia̍h-sī漢字攏來
* 漢字用教育部[規範漢字](https://zh.wikipedia.org/zh-tw/%E8%87%BA%E7%81%A3%E9%96%A9%E5%8D%97%E8%AA%9E%E6%8E%A8%E8%96%A6%E7%94%A8%E5%AD%97)
* 漢字-POJ版本佇Wikidata用永久重複項處理
* Wiki Commons [收錄音](https://commons.wikimedia.org/wiki/Category:Audio_files_in_Taiwanese),寫台語ê說明
* [POJ infobox](https://zh.wikipedia.org/wiki/Template:Infobox_Hokkien_name) 截取,搬到 Wikidata tsit-pîng
Note:
講遐濟,我認為你真真正正關心台語,mā-ài開一寡時間貢獻台語ê書面化,會當貢獻tī線頂資料庫
趁著教育界統一用規範字,來閩南語維基百科用規範字來寫漢文版本
進前講過 Wikidata 遐會當處理漢字-POJ ê資料連結問題
ū錄音抑是程式ê能力,mā會當透過聲音kah資料處理來貢獻
---
## 閩南語維基百科ê計畫
* 閩南語維基百科大量建漢字版本
* 縣市、行政區條目進行
* 國家公園
* 高速公路
* 歷任總統
* Wikidata建永久重覆項
Note:
所以 ài tī 閩南語維基百科遐建立基礎,kā基礎ê資料建漢文版本,親像縣市行政區
國家公園,高速公路,歷史上ê總統
mā-ài建 Wikidata ê永久重複項hōo程式了解 in ê關係
---
## 無組織ê台語
* 原住民族語有學術機關的資源,相比之下台語無組織(較細)來推動
* ū 倡議組織
* 書面數位化欠人做
* 無死 sī 因為 sī 上濟人母語,基礎厚
* ū 人講愛 ū 台語委員會
Note:
看著原住民語kah客家話,雖然人口少但是ū組織(tsoo-tsit),ū一定ê發展
對比台語,ū倡議(tshiong-gī)組織真濟,猶毋過欠缺(khiàm-khueh)書面ê數位化,毋免講Wikidata kah OpenStreetMap 遮資料ê貢獻kah維護
台語無遐慘sī因為人口濟,基礎厚niā-niā,長期sī無受著重視
----
## 台語腔口差 ê 處理
* 參與者寫啥件就收
* 讀音的差異、字辭的差異
* 透過轉換系統來處理無仝的腔口差
* [中文維基百科的繁簡地區詞轉換系統](https://zh.wikipedia.org/wiki/Wikipedia:%E5%AD%97%E8%A9%9E%E8%BD%89%E6%8F%9B%E8%99%95%E7%90%86)
Note:
中文維基百科已經ū運作誠久ê轉換系統,處理ū規則ê kah 特殊 ê 地區用詞lóng會使
----
## 轉換系統ê運作方式
* 有人建對應轉換詞/腔口對照
* 手工單一ê條目ê轉換

Note:
運作ê方式sī án-ni,ài先建腔口ê對照表,猶有用詞對照表
----
## 倡議之外多多來寫
* ISO-639-3 爭取新代碼,閣來成立台語ê百科
* ū學術ê討論,才會當當做來源文獻寫百科
* 來寫閩南語維基百科
* 來寫維基辭典
* 來寫Wikidata辭條
Note:
爭取ISO-693-3新代碼
學術ê成果hōo維基百科來當做文獻
ài-ū 人線頂協作參與共編ê計畫,多多來寫,寫啥物,來寫維基百科,維基辭典,Wikidata
---
## OSM x Wikidata 月聚
* 8/9 19:30 @摩茲工寮
* Facebook [OpenStreetMap台灣](https://www.facebook.com/groups/OpenStreetMap.TW/)
Note:
工商服務時間, 8月初9希望解封,防疫第二級會當佇 Moz 工寮聚會,毋過無法度就繼續線頂虛擬(hi-gí)聚會(tsū-huē)
---
## 謝謝! :sheep:
Q&A: [Sli.do #655 632](https://wall.sli.do/event/psmfh4pl)
你會當佇紲來ê管道揣著我
- [GitHub](https://github.com/Supaplextw/)、[Wikidata](https://wikidata.org/wiki/User:Supaplex)、[OpenStreetMap](https://www.openstreetmap.org/user/Supaplex)
- 或是 [email](mailto:dennis@wikimedia.tw) 我
- 臉書 [Wikidata Taiwan](https://www.facebook.com/groups/2212207218990971/)、[OpenStreetMap台灣](https://www.facebook.com/groups/OpenStreetMap.TW/)
Note:
提供聯絡訊,歡迎來揣我
{"metaMigratedAt":"2023-06-16T02:45:07.599Z","metaMigratedFrom":"YAML","title":"台灣話觀點ê閩南語維基百科-應該欲按怎做較好","breaks":true,"description":"View the slide with \"Slide Mode\".","slideOptions":"{\"spotlight\":{\"enabled\":false}}","contributors":"[{\"id\":\"6d29f5f5-3da6-40f2-b920-e9a4cc2181dd\",\"add\":15432,\"del\":4452}]"}