# <font color="#000000">The Past and Future of Hokkien Languages (nan) on Wikimedia Projects </font>
<!-- Put the link to this slide here so people can follow -->
<div style="font-size:16px;display:flex;background-color:rgb(157 195 145/0.5);padding:32px;justify-content:flex-end;">
<div style="flex-direction:column; text-align:left">
<font color="#000000">slide: https://hackmd.io/@wikidata-tw/B1xgEtln2</font>
<!-- .slide: data-background="https://i.imgur.com/cOXo0Yj.jpg" -->
<font color="#000000">Wikimania 2023
Wikimedia Taiwan Tân Suī-lîm</font>
</div>
</div>
Note:
Hello ever逐家好,我sī陳瑞霖,sī OpenStreetMap kah Wikidata 社群ê參與者,
今仔日 bueh 繼續講臺灣台語 ê 話題,題目sī「台灣台語/閩南語/福建話/咱人話 (nan) tī 維基媒體計畫 ê 過去 kah 未來」
紹介台灣話欲按怎 tī 線頂 ê 百科全書來書寫臺灣話,猶閣 ū 拄著啥款 ê 問題
---
## Who am I?
- Supaplex
- [OpenStreetMap](https://www.openstreetmap.org/user/Supaplex) :heart: [Wikidata](https://www.wikidata.org/wiki/User:Supaplex) :heart:
- [Wikimedia Taiwan](https://meta.wikimedia.org/wiki/Wikimedia_Taiwan/zh) :cat:
Note:
阮網路上ê名號sī Supaplex,這馬 tī OpenStreetMap kah Wikidata 社群走傱
mā-sī 台灣維基協會 ê 理事
---
## Previous Speech
* The Numbers of Written Form Articles in Taiwan Taigi is quite weak, but it is improving in these years
* Emphasis you can write in Hokkien on Wikipedia too
* Main namespace on nan Wikipedia use POJ(Latinization form), also Possible to Write in Hanji Characters
* Manpower needed
Note:
最近學台語變時行,網路頂 ū 專門 ê 所在 tī-teh 寫台文。毋過無啥人欲來寫閩南語維基百科
你這馬拍開zh-min-nan Wikipedia,攏sī看著白話字,其實你嘛會當寫台文漢字
需要新ê人參與
---
## Introduction of Min Nan/Bân-lâm/Hokkien Language

<a href="https://commons.wikimedia.org/wiki/File:Banlamgu.svg">Luuva</a>, <a href="https://creativecommons.org/licenses/by-sa/3.0">CC BY-SA 3.0</a>, via Wikimedia Commons
Note:
除了臺灣人熟似 ê 臺灣台語 kah 福建 ê 閩南語以外,猶閣 ū 廣東 ê 潮汕話 kah 中山閩語,浙江 ê 蒼南閩語,ū 無仝程度 ê 互通性
---
## Introduction of Min Nan/Bân-lâm/Hokkien Language
* Total Speaking Population: 48 Millions
* One of the Main Languages: Taiwan, Fujian(Hokkien)
* Minority Languages: [The Phillippine](https://en.wikipedia.org/wiki/Philippine_Hokkien), Hong Kong, [Singapore](https://en.wikipedia.org/wiki/Singaporean_Hokkien), [Malaysia](https://en.wikipedia.org/wiki/Southern_Peninsular_Malaysian_Hokkien), [Indonesia](https://en.wikipedia.org/wiki/Medan_Hokkien), Thailand,
---
## The Past of Taiwanese Taigi
* One Language Policy
* Mandarin in Education System
* Entertainment: Taigi Songs, Drama
* Market language
Note:
過去因為政府消滅(siau-bia̍t)方言政策,台語 ê 發展受著限制,親像教育系統 kah 媒體圈 sī 國語為主。ū 一部份 ê 娛樂圈 ū 推出台語歌 kah 戲齣作品
koh-lâi sī 市場 ū 用台語來溝通交易(kau-i̍k)
---
## The Recent Developement of Taiwanese Taigi
* End of the One Language Policy in 1993 which Limited the Boardcasting time of Taigi or Hakka
* Taigi Language Test: Ministry of Education, National Chengchong Unversity
* Became one of the National Languages in 2017 after the Pass of [Development of National Languages Act](https://www.wikidata.org/wiki/Q9685196)
* POJ or Hanji
* Online Dictionary:
* [The 2023 New Version Taigi Dictionary](https://sutian.moe.edu.tw/zh-hant/)
* [ChhoeTaigi](https://chhoe.taigi.info/) Dictionary from [Tâibûn Kesimī](https://www.zeczec.com/projects/taibun-kesimi) Crowd-fund Project
Note:
對1993年廢除電視遐ê方言限制,教育系統遮 mā 開始 ū 本土語言 ê 教育。這馬台語ê語言檢定 ū 教育部 kah 成大 ê 系統,ū 正式教師 kah 支援教師。
欲選漢字ū本字之爭,POJ 抑是漢字ê問題
線頂辭典 ū 改版 ê 教育部辭典 kah 整理過往辭典資料 ê 台文雞絲麵計畫,上出名 sī 揣台語網站
---
## [PTS Taigi Station](https://www.taigitv.org.tw/)

---
## The Possible Split of nan
* Appeal for a (https://iso639-3.sil.org/request/2021-045) ISO 639-3 Code by ÌTHUÂN KHOKI (意傳科技) and other NGOs
* Taiwan Taigi: oan
* nan split into Eleven Codes: [Luezhou Min](https://en.wikipedia.org/wiki/Leizhou_Min), [Hainanese](https://en.wikipedia.org/wiki/Hainanese), [Haklau](https://zh.wikipedia.org/wiki/%E6%B5%B7%E4%B8%B0%E8%AF%9D), [Datian Min](https://en.wikipedia.org/wiki/Datian_Min), [Zhangzhou & Quanzhou](https://en.wikipedia.org/wiki/Hokkien), Zhenan Min, [Teo-Swa](https://en.wikipedia.org/wiki/Teo-Swa_Min), [Zhongshan Min](https://en.wikipedia.org/wiki/Zhongshan_Min) etc.
Note:
有人無佮意閩南語 ê 這个名號,所以2021年時 ū 提案,bueh kā 原來 nan 代碼分做 11 ê,臺灣話hōo 伊新ê代碼oan,其他原來tī nan 代碼下跤ê語言,親像雷州話、海南話、海陸話、浙南閩語、潮汕話、漳泉話、龍嚴話,ē ū 新 ê 代碼
---
## The Different Names and Varies of Hokkien
* Taiwan: Tâi-uân Bân-lâm-gú/Tâi-uân Bân-lâm-gí/Tâi-uân Bân-lâm-gír
* Historic Name: Tâi-oân-ōe, Tâi-gí
* New Official Name: Taiwanese Taigi(Proposed)
* South East Asia: Hokkian/Hokkien/福建話
* The Phillipine: Lan-lang-oe/咱人話/咱儂話
* Hakka's called Hoklo(鶴老話)
Note:
真濟人無愛閩南語這个名號,毋過臺灣閩南語sī目前ê官方名號
歷史上有人講叫做臺灣話,台語
官方ū拍算欲改做台灣台語這个名
福建話(Hok-kiàn-uē),sī 自稱 mā-ū 別人 hōo-ê 稱呼,mā-ū 對家己 ê 角度 ê 稱呼 ê 咱人話。客人sī叫鶴老話
---
## Wiki 頂懸 ê 臺灣台語內容
* [Min Nan Wikipedia](https://nan.wikipedia.org/)
* [Wikidata](https://wikidata.org) nan/nan-hani labels, description
* Wikidata [Lexeme](https://www.wikidata.org/wiki/Wikidata:Lexicographical_data) (Wikidata Lexeme)
* [Wiktionary](https://www.wiktionary.org/)
---
## Bân-lâm-gú(nan) Wikipedia
[Tâi-tang-koān](https://nan.wikipedia.org/wiki/T%C3%A2i-tang-ko%C4%81n) án-ni niā-niā

Note:
ISO-639-3 hōo 閩南語 ū 獨立 ê 代碼sī teh 閩南語維基百科成立後tsiah-ū ê,所以後來 ū 對nan轉址到 zh-min-nan
社群 bô 活力,kah台灣相關ê條目,親像臺東縣無啥人tī-teh寫,敢若 ū 底下 ê 鄉鎮市 ê 連結
style="
---
## The Problem of nan Wikipedia
<div style="background-color: black;
color: white;display:inline-flex;align-items:center;gap:2rem;">
<div style="flex:1;text-align:left;font-size:110%;" left>
* More Favor of POJ, lack of Hanji Content
* Too much Administrative Articles, not so many Scinece Articles
* Lack of Community
* Many Articles not linking to Wikidata
</div>
<div style="flex:1;text-align:left;font-size:110%;" left>
* 無使用永久重覆項處理無仝書寫方式
* 整體 nan 社群討論風氣無好,愛攻擊無仝主張 ê 人
</div>
</div>
Note:
咱來看 nan Wikipedia 問題,早期參與者ê決定,𪜶排斥(pâi-thik)漢字,無愛人來寫漢字
為著條目ê數量夠濟,大量用機器人加添無啥內容ê地號名
應對小數漢字版本ê條目,嘛無用永久重複項處理tī Wikidata ê 連結問題
---
## Problem of nan Wikipedia 2 - Spam

---
## Problem Case 1: Duplicated Poland Place

Note:
重複匯入資料,仝款ê波蘭地號名。臺灣遮嘛有人做佮Cebu仝款的代誌,大量機器人去創造條目,毋過後續無人來編輯
---
## Problem Case 2: Thousands of Non Wikidata-linked Articles

Note:
無對著較新 ê Wikidata 計畫,zh-min-nan Wikipedia ū 上千ê條目無對應到Wikidata
---
## Problem Case 3: Duplicated Villages in Taipei(Fixed)

Note:
進前兩冬有處理匯入臺灣村里到 Wikidata 遐,自本sī認為干焦ū兩三个人仝時做,無細膩重複。毋過代誌毋是咱想ê遐簡單
---
## Problem Case 3: Duplicated Villages in Taipei(Fixed)

Note:
以早有人tī zh-min-nan 建立條目,干焦兩句話ê條目,毋過嘛hōo機器人建立對應 ê Wikidata 項目
---
## Problem Case 3: Duplicated Villages in Taipei(Fixed)

Note:
後來匯入時無檢查到,煞重複增加ê里
---
## Wikidata Labels & Descritions: nan, nan-hani

Note:
嘛 ē-tàng 寫台文漢字,毋是干焦 ū 白話字
---
## POJ and Hanji: Permanent Duplicated Item
* 客家話、閩東話有 buē-tsio 漢字 kah POJ ê 條目
* 予講仝一件代誌無仝ê書寫方式會當tī Wikidata 連結
Note:
因為長江南爿 ê 漢語族語言,比如講吳語、閩東話、客家話 ū 真深 ê 羅馬字拼寫傳統,佮官話系統音差真濟,所以仝款ê內容(luē-iông),ū 兩種無仝寫法ê頁面
tī Wikidata 遮就 hōo 其中一頁指定sī永久重覆頁面來處理,白話字kah漢字版本之間 iōng 永久重複項連結
----
## [Permanent Duplicated Item](https://www.wikidata.org/wiki/Property:P2959)(P2959)
> this item duplicates another item and the two can't be merged, as one Wikimedia project includes two pages, e.g. in different scripts or languages (only applies to some wikis, e.g.: cdowiki, gomwiki, nanwiki). Use P31=Q17362920 for other wikis.
Note:
仝內容,毋過用無仝書寫系統,親像無仝字母抑是語言。以早是因為閩東語關係有用漢字抑是白話字的條目,所以提這个屬性property
----
## [Wikimedia Permanent Duplicated Page](https://www.wikidata.org/wiki/Q21286738)(Q21286738)
> this item duplicates another item and the two can't be merged, as one Wikimedia project includes two pages, e.g. in different scripts or languages (only applies to some wikis, e.g.: cdowiki, gomwiki, nanwiki). Use P31=Q17362920 for other wikis.
Note:
說明是無法度合併,因為書寫系統無仝。
----
## Example of Permanent Duplicated Item
[Taiwan Permanent Duplicated Item](https://www.wikidata.org/wiki/Q22337467)

Note:
來看覓咱國中華民國ê永久重複頁面,ū客家話、閩東話、zh min-nan,kah印度遐ê語言
----
## Relation between Permanent Duplicated Item
|| Main Item | Permanent Duplicated Item |
|------| -------- | -------- |
|Wikidata| [Q865](https://www.wikidata.org/wiki/Q865) | [Q22337467](https://www.wikidata.org/wiki/Q22337467) |
| zh-min-nan | [Tiong-hôa-bîn-kok](https://zh-min-nan.wikipedia.org/wiki/Tiong-ho%C3%A2_B%C3%AEn-kok) | [Taiwan](https://zh-min-nan.wikipedia.org/wiki/Pang-chān:中華民國) |
| hak | [Chûng-fà Mìn-koet](https://hak.wikipedia.org/wiki/Ch%C3%BBng-f%C3%A0_M%C3%ACn-koet) | [Taiwan](https://hak.wikipedia.org/wiki/中華民國) |
| cdo | [Dṳ̆ng-huà Mìng-guók](https://cdo.wikipedia.org/wiki/D%E1%B9%B3%CC%86ng-hu%C3%A0_M%C3%ACng-gu%C3%B3k) | [中Taiwan](https://cdo.wikipedia.org/wiki/中華民國) |
Note:
咱來直接看仝語言,用無仝書寫系統是啥意思,zh-min-nan維基百科的中華民國條目有白話字kah台文漢字的版本
---
## Wikidata Lexeme
[Wikidata辭條:箸](https://www.wikidata.org/wiki/Lexeme:L305178)

Note:
Wikidataê辭條sī新ê物件,收語言資料
毋但主流ê語言,mā會當收小數語言
----
## Wikidata Lexeme
Meaning and Translation

Note:
辭條會當寫字詞ê意義,猶閣ū翻譯,翻譯會當連到別ê語言ê辭條
----
## Wikidata Lexeme
Including Dialect and scripts(POJ, Tai-lo)

Note:
收無仝所在ê方音變體,台灣較ū聽著ê漳州腔,泉州腔,猶有鹿港仔腔(lo̍k-ka̋ng-á),安溪話,宜蘭腔,永靖腔(eng-tseng)
----
## Wikidata Lexeme
Example Sentence

Note:
mā-ū收例句,主要iōng漢字kah羅馬字
----
## Lexeme Challenge

Note:
定期推出,鼓勵逐家一禮拜一禮拜來寫辭條,逐禮拜無仝主題
----
## Merits of Writing Hokkien on Wikidata
* Using few Words of short Sentences filled in Description
* An already Existing Structure
** Use English as Reference to Write Hokkien
** No need to rely on Mandarin
* Writing form: POJ, nan-hani, or Mixed(漢羅濫)
* Linked Data
Note:
Wikidata親像in-ê兄弟維基百科,Wikidata sī國際化ê,所以mā會當直接連結外國語言
你無滿意當前ê書寫方式,mā會當照這種書寫方式來累積(luí-tsik)資料
愛注意ū可能無啥人bueh照你ê書寫方式來參與,你家己ài出較濟力
上重要 ê 一部份 sī 遮 ê 資料 sī Linked Data
---
## Sister's Project: nan name field on OSM
OpenStreetMap name:nan: [Overpass Query](https://overpass-turbo.eu/s/19i0)

Note:
姊妹計畫ê狀況 sī ū 真濟計畫愈來愈重視本土語言,除了國際上時行ê語言,本地ê官方語言以外,在庄ê語言 mā ū 收錄
舉一个例,線頂共編 ê OpenStreetMap ū 收袂少 ê 台語地號名,相對之下閩南語維基百科無啥動能
咱親身看覓OpenStreetMap遮
用Overpass API來搜查(soo-tsa),大臺北尤其中永和ū真濟小地名,sī參照地方誌來標示。除了客家區,原住民區以外,真濟在庄小地名來源 sī 台語
----
## Wikimedia Map by Wikimedia Foundation
Wikimedia Map [lang label nan POJ](https://maps.wikimedia.org/?lang=nan#7/24.722/117.806)
Powered by OpenStreetMap
[Taigi Hanji](https://maps.wikimedia.org/?lang=nan-HJ#16/24.9725/121.5437), [Tâi-lô](https://maps.wikimedia.org/?lang=nan-TL#16/24.9725/121.5437)

Note:
維基基金會 ê 地圖 Wikimedia Map,mā會當改代碼來即時變成你想欲 ê 語言,nan sī 代表閩南話,改做nan-TL變成台羅標示,tī OpenStreetMap 遐ū資料ê攏會使顯示
----
## Plan for nan Wikipedia
* Let's Start Contribution: POJ or Hanji
* Taiwan MOE [Recommend Hanji](https://zh.wikipedia.org/zh-tw/%E8%87%BA%E7%81%A3%E9%96%A9%E5%8D%97%E8%AA%9E%E6%8E%A8%E8%96%A6%E7%94%A8%E5%AD%97) or Koa-á-chheh Characters
* Hanji-POJ linked by Permanent Duplicated Items on Wikidata
Note:
講遐濟,我認為你真真正正關心台語,mā-ài開一寡時間貢獻台語ê書面化,會當貢獻tī線頂資料庫
趁著教育界統一用規範字,來閩南語維基百科用規範字來寫漢文版本,嘛是會當寫POJ內容,莫攏是機器人處理的地號名矣
---
## Plan for nan Wikipedia
* Establish Mass number of Hanji Articles
* Administraive units
* Science
* Establish the Correnspond Wikidata Permanent Duplicated Item
* Telegram Group: [Wikimedia-nan](https://t.me/Wikimedia_nan)
Note:
所以 ài tī 閩南語維基百科遐建立基礎,kā基礎ê資料建漢文版本,親像縣市行政區
mā-ài建 Wikidata ê永久重複項hōo程式了解 in ê關係
---
## The Possible way of Dealing with Dialect
* Depends on Editors Choose
* There are some Regional Words Difference or Pronunciation Difference
* Automatic Approach for Pronunciation Difference
* Example: [Chinese Wikipedia Language Conversion System](https://zh.wikipedia.org/wiki/Wikipedia:%E5%AD%97%E8%A9%9E%E8%BD%89%E6%8F%9B%E8%99%95%E7%90%86)

Note:
中文維基百科已經ū運作誠久ê轉換系統,處理ū規則ê kah 特殊 ê 地區用詞lóng會使
運作ê方式sī án-ni,ài先建腔口ê對照表,猶有用詞對照表
----
## Please Join the Writing Champion
* Stop the agurement
* Need Code of Code to Stop the Extreme or Unproduce Speech
* The Possible of the 11 ISO-639-3 code, might imclubated new Wikipedia Sites
* Edit nan/nan-hani Labels or Descriptions on WIkidata
* Wiktonary
* Wikidata Lexeme
Note:
爭取ISO-693-3新代
學術ê成果hōo維基百科來當做文獻
ài-ū 人線頂協作參與共編ê計畫,多多來寫,寫啥物,來寫維基百科,維基辭典,Wikidata
---
## [To-siā!](https://en.wiktionary.org/wiki/%E5%A4%9A%E8%AC%9D#Chinese) [sṳ̀n-mùng-ǹ!](https://en.wiktionary.org/wiki/%E6%89%BF%E8%92%99%E4%BD%A0) Thank you! :sheep:
Q&A:
Communication Channels
- [GitHub](https://github.com/Supaplextw/)、[Wikidata](https://wikidata.org/wiki/User:Supaplex)、[OpenStreetMap](https://www.openstreetmap.org/user/Supaplex)
- [email](mailto:dennis@wikimedia.tw)
- Facebook Group: [Wikidata Taiwan](https://www.facebook.com/groups/2212207218990971/)、[OpenStreetMap Taiwan](https://www.facebook.com/groups/OpenStreetMap.TW/)
Note:
提供聯絡訊,歡迎來揣我
{"breaks":true,"title":"<font color=\"#000000\">The Past and Future of Hokkien Languages (nan) on Wikimedia Projects </font>","description":"Note:逐家好,我sī陳瑞霖,sī OpenStreetMap kah Wikidata 社群ê參與者,今仔日 bueh 繼續講臺灣台語 ê 話題,題目sī「台灣台語/閩南語/福建話/咱人話 (nan) tī 維基媒體計畫 ê 過去 kah 未來」紹介台灣話欲按怎 tī 線頂 ê 百科全書來書寫臺灣話,猶閣 ū 拄著啥款 ê 問題","contributors":"[{\"id\":\"6d29f5f5-3da6-40f2-b920-e9a4cc2181dd\",\"add\":17287,\"del\":6034,\"latestUpdatedAt\":null}]"}