# <font color="#000000">台灣台語/閩南語/福建話/咱人話 (nan) tī 維基媒體計畫 ê 過去 kah 未來 </font>
<!-- Put the link to this slide here so people can follow -->
<div style="font-size:16px;display:flex;background-color:rgb(157 195 145/0.5);padding:32px;justify-content:flex-end;">
<div style="flex-direction:column; text-align:left">
<font color="#000000">slide: https://hackmd.io/@wikidata-tw/HkYR08Vuc#/</font>
<!-- .slide: data-background="https://i.imgur.com/cOXo0Yj.jpg" -->
<font color="#000000">COSCUP 2023
台灣維基協會 陳瑞霖</font>
</div>
</div>
Note:
逐家好,我sī陳瑞霖,sī OpenStreetMap kah Wikidata 社群ê參與者,
今仔日 bueh 繼續講臺灣台語 ê 話題,題目sī「台灣台語/閩南語/福建話/咱人話 (nan) tī 維基媒體計畫 ê 過去 kah 未來」
紹介台灣話欲按怎 tī 線頂 ê 百科全書來書寫臺灣話,猶閣 ū 拄著啥款 ê 問題
---
## 我 sī 啥人?
- Supaplex
- [OpenStreetMap](https://www.openstreetmap.org/user/Supaplex) :heart: [Wikidata](https://www.wikidata.org/wiki/User:Supaplex) :heart:
- [Wikimedia Taiwan](https://meta.wikimedia.org/wiki/Wikimedia_Taiwan/zh) :cat:
Note:
阮網路上ê名號sī Supaplex,這馬 tī OpenStreetMap kah Wikidata 社群走傱
mā-sī 台灣維基協會 ê 理事
---
## 進前 ê 演講
* 比並進前網路書寫台文 koh khah 濟
* 維基百科嘛 ē-tàng 寫台文
* 雖罔主要 sī POJ,嘛會當寫台文漢字 ê 條目
* 需要新人來寫
Note:
最近學台語變時行,網路頂 ū 專門 ê 所在 tī-teh 寫台文。毋過無啥人欲來寫閩南語維基百科
你這馬拍開zh-min-nan Wikipedia,攏sī看著白話字,其實你嘛會當寫台文漢字
需要新ê人參與
---
## 台灣台語 ê 過去狀況
* 過去-予人打壓,國語政策
* 教育系統 bô 重視,國語教育
* 娛樂 ū 台語歌 kah 戲齣
* 做生理 ê 語言
Note:
過去因為政府消滅(siau-bia̍t)方言政策,台語 ê 發展受著限制,親像教育系統 kah 媒體圈 sī 國語為主。ū 一部份 ê 娛樂圈 ū 推出台語歌 kah 戲齣作品
koh-lâi sī 市場 ū 用台語來溝通交易(kau-i̍k)
---
## 台灣台語 ê 現此時 ê 狀況
* 1993年廢除電視 ê 方言 ê 播出時段 kah 時長限制
* 教育部閩南語檢定 kah 成大台語檢定
* 教育系統 ū 正式教師 kah 支援教師
* (漢)本字之爭,白話字 vs 漢字
* 線頂辭典:
* 2023年新版教育部辭典
* 台文雞絲麵 ê 揣台語
Note:
對1993年廢除電視遐ê方言限制,教育系統遮 mā 開始 ū 本土語言 ê 教育。這馬台語ê語言檢定 ū 教育部 kah 成大 ê 系統,ū 正式教師 kah 支援教師。
欲選漢字ū本字之爭,POJ 抑是漢字ê問題
線頂辭典 ū 改版 ê 教育部辭典 kah 整理過往辭典資料 ê 台文雞絲麵計畫,上出名 sī 揣台語網站
---
## 台灣台語 ê 社群生態
* 愛彼此出征攻擊對方言論
* 陣營分真開,彼此無合作 kah 聯合 ê 可能
* 重建zh-min-nan Wikipedia社群
* 需要引進 Code of Conduct 機制來規範傷超過 ê 言論 kah 行為
Note:
有人講一寡人予人叫臺羅仔,愛出征無佮意 ê 言論,無欲溝通討論,kā 網路頂懸 ê 討論空間變閣較極端 kah 無健康。嘛ū分真濟派,彼此嘛ē冤家kah大戰
反應到Wikipedia遮,ū zh-min-nan ê 站,毋過𪜶較注重寫白話字,ū 刁工排除漢字 ê 書寫
這馬十幾年過去矣,各個社群包括(pau-kuat)推捒 Code of Conduct,zh-min-nan 猶閣ū 臺灣ê 台語社群,嘛應該推捒類似 ê 規則
---
## 台灣台語 ê 未來
* 2021年意傳科技kah一寡團體[申請](https://iso639-3.sil.org/request/2021-045) ISO 639-3 新代碼予台灣台語
* 台灣台語:oan
* 原來nan之下攏總分做 11 ê:雷州話、海南話、海陸話、浙南閩語、潮汕話、漳泉話、龍嚴話 etc
Note:
有人無佮意閩南語 ê 這个名號,所以2021年時 ū 提案,bueh kā 原來 nan 代碼分做 11 ê,臺灣話hōo 伊新ê代碼oan,其他原來tī nan 代碼下跤ê語言,親像雷州話、海南話、海陸話、浙南閩語、潮汕話、漳泉話、龍嚴話,ē ū 新 ê 代碼
---
## 臺灣話 kah 臺灣閩南語
* 官方名稱:臺灣閩南語(Tâi-uân Bân-lâm-gú/Tâi-uân Bân-lâm-gí/Tâi-uân Bân-lâm-gír)
* 歷史上ê 名稱:臺灣話,臺語
* 新 ê 官方名稱:臺灣臺語(研擬)
* 東南亞:Hokkian/Hokkien/福建話
* 菲律賓:咱人話/咱儂話
* 客家人予 ê 稱呼:鶴老話
Note:
真濟人無愛閩南語這个名號,毋過臺灣閩南語sī目前ê官方名號
歷史上有人講叫做臺灣話,台語
官方ū拍算欲改做台灣台語這个名
福建話(Hok-kiàn-uē),sī 自稱 mā-ū 別人 hōo-ê 稱呼,mā-ū 對家己 ê 角度 ê 稱呼 ê 咱人話。客人sī叫鶴老話
---
## 台灣台語 kah 其他相關語言 ê 關係

<a href="https://commons.wikimedia.org/wiki/File:Banlamgu.svg">Luuva</a>, <a href="https://creativecommons.org/licenses/by-sa/3.0">CC BY-SA 3.0</a>, via Wikimedia Commons
Note:
除了臺灣人熟似 ê 臺灣台語 kah 福建 ê 閩南語以外,猶閣 ū 廣東 ê 潮汕話 kah 中山閩語,浙江 ê 蒼南閩語,ū 無仝程度 ê 互通性
---
## 台灣話 ê 定位-青盲摸象

<a href="https://commons.wikimedia.org/wiki/File:Illustrated_proverb-_Blind_men_and_an_elephant.jpg">Pawyi Lee</a>, Public domain, via Wikimedia Commons
Note:
逐家lóng知影青盲摸象ê故事,台灣話mā-ū相𫝛ê狀況,有人講台灣話sī古早ê漢語,嘛有人講幾若代 ê 官方 sī講台語 ê
敢有影?
---
## Wiki 頂懸 ê 臺灣台語內容
* [閩南語維基百科](https://nan.wikipedia.org/)
* [Wikidata](https://wikidata.org) nan/nan-hani 標籤、描述
* Wikidata [辭條](https://www.wikidata.org/wiki/Wikidata:Lexicographical_data) (Wikidata Lexeme)
* [維基辭典](https://www.wiktionary.org/)
---
## 是按怎 bô 臺灣話維基百科
* 臺灣臺語無獨立的 ISO 639-3 代碼
* 臺灣話 ê Wikipedia ài ū 家己 ê 代碼
* 關心ê臺灣人愛了解規則,愛家己tī-teh國際來爭取
* 家己mā ài ū共識
* 相𫝛語言無仝ê代碼例:
* 塞爾維亞語(srp)/克羅埃西亞語(hrv)
* 馬來西亞語(ms)/印尼語(id)
Note:
Ū真濟人無愛閩南語這个名號,就無愛插閩南語維基百科。這sī因為臺灣話sī無獨立ê ISO 639-3 ê 代碼
對語言學ê角度來講,ū兩組語言,Serbian/Croatia、Bahasa Melayu/Bahasa Indonesia sī真相𫝛,毋過 ū 無仝 ê 代碼,受著政治邊界 ê 影響
----
## 閩南語維基百科
[Tâi-tang-koān](https://nan.wikipedia.org/wiki/T%C3%A2i-tang-ko%C4%81n) án-ni niā-niā

Note:
ISO-639-3 hōo 閩南語 ū 獨立 ê 代碼sī teh 閩南語維基百科成立後tsiah-ū ê,所以後來 ū 對nan轉址到 zh-min-nan
社群 bô 活力,kah台灣相關ê條目,親像臺東縣無啥人tī-teh寫,敢若 ū 底下 ê 鄉鎮市 ê 連結
style="
---
## nan 百科問題
<div style="background-color: black;
color: white;display:inline-flex;align-items:center;gap:2rem;">
<div style="flex:1;text-align:left;font-size:110%;" left>
* 排斥漢字
* 傷濟行政區,欠缺科學相關 ê 條目
* 重疊條目無用重定向
* 濟條目無對應 Wikidata 連結
</div>
<div style="flex:1;text-align:left;font-size:110%;" left>
* 無使用永久重覆項處理無仝書寫方式
* 整體 nan 社群討論風氣無好,愛攻擊無仝主張 ê 人
</div>
</div>
Note:
咱來看 nan Wikipedia 問題,早期參與者ê決定,𪜶排斥(pâi-thik)漢字,無愛人來寫漢字
為著條目ê數量夠濟,大量用機器人加添無啥內容ê地號名
應對小數漢字版本ê條目,嘛無用永久重複項處理tī Wikidata ê 連結問題
---
## nan 百科問題2 - 站務怠惰

---
## 問題案例1:重覆匯入波蘭地號名

Note:
重複匯入資料,仝款ê波蘭地號名。臺灣遮嘛有人做佮Cebu仝款的代誌,大量機器人去創造條目,毋過後續無人來編輯
---
## 問題案例2:上千條無對應 Wikidata

Note:
無對著較新 ê Wikidata 計畫,zh-min-nan Wikipedia ū 上千ê條目無對應到Wikidata
---
## 問題案例3:重疊 ê 台北市 ê 里

Note:
進前兩冬有處理匯入臺灣村里到 Wikidata 遐,自本sī認為干焦ū兩三个人仝時做,無細膩重複。毋過代誌毋是咱想ê遐簡單
---
## 問題案例3:重疊 ê 台北市 ê 里

Note:
以早有人tī zh-min-nan 建立條目,干焦兩句話ê條目,毋過嘛hōo機器人建立對應 ê Wikidata 項目
---
## 問題案例3:重疊 ê 台北市 ê 里

Note:
後來匯入時無檢查到,煞重複增加ê里
---
## Wikidata
標籤(label)
描述(Description)
母語名稱([P1705](https://www.wikidata.org/wiki/Property:P1705))
官方名稱([P1448](https://www.wikidata.org/wiki/Property:P1448))
Note:
Wikidata 遮會當寫台語ê欄位(lân-uī):標籤,描述,母語名稱,官方名稱
---
## Wikidata ê 標籤

Note:
嘛 ē-tàng 寫台文漢字,毋是干焦 ū 白話字
---
## POJ kah 漢字共存 ê 可能-永久重覆項
* 客家話、閩東話有 buē-tsio 漢字 kah POJ ê 條目
* 予講仝一件代誌無仝ê書寫方式會當tī Wikidata 連結
Note:
因為長江南爿 ê 漢語族語言,比如講吳語、閩東話、客家話 ū 真深 ê 羅馬字拼寫傳統,佮官話系統音差真濟,所以仝款ê內容(luē-iông),ū 兩種無仝寫法ê頁面
tī Wikidata 遮就 hōo 其中一頁指定sī永久重覆頁面來處理,白話字kah漢字版本之間 iōng 永久重複項連結
----
## [永久重複項](https://www.wikidata.org/wiki/Property:P2959)(P2959)
> 此項對應的重複項,且兩者不能被合併,因為同一維基媒體項目中包含兩個頁面,例如使用不同字母或語言
Note:
仝內容,毋過用無仝書寫系統,親像無仝字母抑是語言。以早是因為閩東語關係有用漢字抑是白話字的條目,所以提這个屬性property
----
## [維基媒體永久重複頁面](https://www.wikidata.org/wiki/Q21286738)(Q21286738)
> 此項目與其他項目重複,但兩項不能被合併,因為某一維基媒體項目上有兩個條目描述同一事物,例如使用不同的文字或語言。增加屬性P2959(永久重複項)以及連結至對應語言版本wiki頁面的項目
Note:
說明是無法度合併,因為書寫系統無仝。
----
## Wikidata 頁面
[中華民國永久重覆頁面](https://www.wikidata.org/wiki/Q22337467)

Note:
來看覓咱國中華民國ê永久重複頁面,ū客家話、閩東話、zh min-nan,kah印度遐ê語言
----
## 永久重覆項關系
|| 主項目 | 永久重覆項 |
|------| -------- | -------- |
|Wikidata| [Q865](https://www.wikidata.org/wiki/Q865) | [Q22337467](https://www.wikidata.org/wiki/Q22337467) |
| zh-min-nan | [Tiong-hôa-bîn-kok](https://zh-min-nan.wikipedia.org/wiki/Tiong-ho%C3%A2_B%C3%AEn-kok) | [中華民國](https://zh-min-nan.wikipedia.org/wiki/Pang-chān:中華民國) |
| hak | [Chûng-fà Mìn-koet](https://hak.wikipedia.org/wiki/Ch%C3%BBng-f%C3%A0_M%C3%ACn-koet) | [中華民國](https://hak.wikipedia.org/wiki/中華民國) |
| cdo | [Dṳ̆ng-huà Mìng-guók](https://cdo.wikipedia.org/wiki/D%E1%B9%B3%CC%86ng-hu%C3%A0_M%C3%ACng-gu%C3%B3k) | [中華民國](https://cdo.wikipedia.org/wiki/中華民國) |
Note:
咱來直接看仝語言,用無仝書寫系統是啥意思,zh-min-nan維基百科的中華民國條目有白話字kah台文漢字的版本
---
## Wikidata 辭條
[Wikidata辭條:箸](https://www.wikidata.org/wiki/Lexeme:L305178)

Note:
Wikidataê辭條sī新ê物件,收語言資料
毋但主流ê語言,mā會當收小數語言
----
## Wikidata 辭條
意義 kah 翻譯

Note:
辭條會當寫字詞ê意義,猶閣ū翻譯,翻譯會當連到別ê語言ê辭條
----
## Wikidata 辭條
ū 各種方音變體 ê 處理方式

Note:
收無仝所在ê方音變體,台灣較ū聽著ê漳州腔,泉州腔,猶有鹿港仔腔(lo̍k-ka̋ng-á),安溪話,宜蘭腔,永靖腔(eng-tseng)
----
## Wikidata 辭條
例句

Note:
mā-ū收例句,主要iōng漢字kah羅馬字
----
## Lexeme Challenge

Note:
定期推出,鼓勵逐家一禮拜一禮拜來寫辭條,逐禮拜無仝主題
----
## Wikidata ê 優點
* 跨語言,會當直接對英文ê資料
** 擺脫台語倚佇華語底下ê情形
** 國際接軌
* 會當寫bô-kâng ê書寫方式
* 連接資料 (Linked Data)
Note:
Wikidata親像in-ê兄弟維基百科,Wikidata sī國際化ê,所以mā會當直接連結外國語言
你無滿意當前ê書寫方式,mā會當照這種書寫方式來累積(luí-tsik)資料
愛注意ū可能無啥人bueh照你ê書寫方式來參與,你家己ài出較濟力
上重要 ê 一部份 sī 遮 ê 資料 sī Linked Data
---
## 姊妹仔計畫 ê 狀況
* OpenStreetMap ū 收 name:nan
* Wikidata 有人寫台語的說明文件
* OpenStreetMap 嘛有人寫台語的文件
* Wikidata ū Label_nan,mā-ū 辭條
* 閩南語維基百科停滯不前
Note:
姊妹計畫ê狀況 sī ū 真濟計畫愈來愈重視本土語言,除了國際上時行ê語言,本地ê官方語言以外,在庄ê語言 mā ū 收錄
舉一个例,線頂共編 ê OpenStreetMap ū 收袂少 ê 台語地號名,相對之下閩南語維基百科無啥動能
----
## OSM 台語標示
[Overpass 檢索](https://overpass-turbo.eu/s/19i0)

Note:
咱親身看覓OpenStreetMap遮
用Overpass API來搜查(soo-tsa),大臺北尤其中永和ū真濟小地名,sī參照地方誌來標示。除了客家區,原住民區以外,真濟在庄小地名來源 sī 台語
----
## Wikimedia Map
Wikimedia Map [lang label nan 白話字](https://maps.wikimedia.org/?lang=nan#7/24.722/117.806)
OpenStreetMap ê 資料
[台文漢字](https://maps.wikimedia.org/?lang=nan-HJ#16/24.9725/121.5437)、[台羅](https://maps.wikimedia.org/?lang=nan-TL#16/24.9725/121.5437)

Note:
維基基金會 ê 地圖 Wikimedia Map,mā會當改代碼來即時變成你想欲 ê 語言,nan sī 代表閩南話,改做nan-TL變成台羅標示,tī OpenStreetMap 遐ū資料ê攏會使顯示
----
## 閩南語維基百科 ê 計畫
* 緊來寫,毋管 sī POJ ia̍h-sī 漢字攏來
* 漢字用教育部[規範漢字](https://zh.wikipedia.org/zh-tw/%E8%87%BA%E7%81%A3%E9%96%A9%E5%8D%97%E8%AA%9E%E6%8E%A8%E8%96%A6%E7%94%A8%E5%AD%97) ia̍h-sī 歌仔冊 ê 字
* 漢字-POJ版本佇Wikidata用永久重複項處理
Note:
講遐濟,我認為你真真正正關心台語,mā-ài開一寡時間貢獻台語ê書面化,會當貢獻tī線頂資料庫
趁著教育界統一用規範字,來閩南語維基百科用規範字來寫漢文版本,嘛是會當寫POJ內容,莫攏是機器人處理的地號名矣
---
## 閩南語維基百科 ê 計畫
* 閩南語維基百科大量建漢字版本
* 臺灣本地的內容:縣市、行政區
* 科學智識
* Wikidata建永久重覆項
Note:
所以 ài tī 閩南語維基百科遐建立基礎,kā基礎ê資料建漢文版本,親像縣市行政區
mā-ài建 Wikidata ê永久重複項hōo程式了解 in ê關係
---
## 台語腔口差 ê 處理
* 參與者寫啥就收
* 讀音的差異、字辭的差異
* 透過轉換系統來處理無仝的腔口差
* [中文維基百科的繁簡地區詞轉換系統](https://zh.wikipedia.org/wiki/Wikipedia:%E5%AD%97%E8%A9%9E%E8%BD%89%E6%8F%9B%E8%99%95%E7%90%86)

Note:
中文維基百科已經ū運作誠久ê轉換系統,處理ū規則ê kah 特殊 ê 地區用詞lóng會使
運作ê方式sī án-ni,ài先建腔口ê對照表,猶有用詞對照表
----
## 倡議之外多多來寫
* 莫閣冤家--ah
* 愛引進 Code of Code 規範傷譀 ê 言論
* ISO-639-3 新代碼若是成功,閣來才有機會成立台語ê百科
* 來寫 Wikidata nan/nan-hani 標籤、閩南語維基百科,抑是其他用臺灣台語的維基百科
* 來寫維基辭典
* 來寫Wikidata辭條
Note:
爭取ISO-693-3新代
學術ê成果hōo維基百科來當做文獻
ài-ū 人線頂協作參與共編ê計畫,多多來寫,寫啥物,來寫維基百科,維基辭典,Wikidata
---
## OSM x Wikidata 月聚
* 8/15 19:30 @摩茲工寮
* Facebook [OpenStreetMap台灣](https://www.facebook.com/groups/OpenStreetMap.TW/)
Note:
工商服務時間, 8月初9希望解封,防疫第二級會當佇 Moz 工寮聚會,毋過無法度就繼續線頂虛擬(hi-gí)聚會(tsū-huē)
---
## 謝謝! :sheep:
Q&A:
你會當佇紲來ê管道揣著我
- [GitHub](https://github.com/Supaplextw/)、[Wikidata](https://wikidata.org/wiki/User:Supaplex)、[OpenStreetMap](https://www.openstreetmap.org/user/Supaplex)
- 或是 [email](mailto:dennis@wikimedia.tw) 我
- 臉書 [Wikidata Taiwan](https://www.facebook.com/groups/2212207218990971/)、[OpenStreetMap台灣](https://www.facebook.com/groups/OpenStreetMap.TW/)
Note:
提供聯絡訊,歡迎來揣我
{"description":"View the slide with \"Slide Mode\".","slideOptions":"{\"spotlight\":{\"enabled\":true}}","title":"台灣台語/閩南語/福建話/咱人話 (nan) tī 維基媒體計畫 ê 過去 kah 未來","contributors":"[{\"id\":\"6d29f5f5-3da6-40f2-b920-e9a4cc2181dd\",\"add\":14105,\"del\":2846}]"}