--- title: "從跨語言與機讀出發,連結性的 Wikidata 可以怎麼復興閩南語維基百科" tags: nan, 台灣閩南語, 倡議, 台灣話, 台灣台語, Wikidata Taiwan, Wikidata description: View the slide with "Slide Mode". --- # 從跨語言與機讀出發,連結性的 Wikidata 可以怎麼復興閩南語維基百科 閩南語維基百科(以下稱 nan Wikipedia)與整體維基百科差不多同時期發展,但整體風氣弱很多。一來是台灣本土語言教育是近年才開始,受過台語書寫教育的人相當少,二來是台語在文化、經濟上是弱勢語言,沒有太多誘因吸引人參與。再加上 nan Wikipedia 的社群選擇以白話字的書寫方式為主,與漢字圈子形成隔閡,阻絕習慣台文漢字書寫的貢獻者,nan Wikipedia 參與者少,無法形成有效的正向循環社群紛圍。 2012 年 Wikidata 計畫成立,語言中立的架構,輕易成為機讀與跨語言的新交流平台。Wikidata 對於維基百科社群的意義在處理跨語言連結,集中在 Wikidata 儲存。然而 nan Wikipeida 社群動能不足,本身內容生產部分不足,大量充斥匯入的地名條目,甚至還有多筆重覆建置更不用說顧及機讀以及跨語言為賣點的 Wikidata。顯見 nan Wikipedia 並沒有受益於 Wikidata 的發展,導致有大量條目並沒有連到對應的 Wikidata 項目,而且也無法糾錯重覆條目問題。 ## 行動方案 先行將 Wikidata 台灣相關項目的 nan 標籤與描述建置完成,再一步一步處理 nan Wikipeda 未連結至 Wikidata 的條目問題。而 Wikidata 屬性永久重覆項來解決同一語言,不同書寫方式的百科頁面連結方式。長期下來,希望能夠透過 Wikidata 這邊養成擴充 nan 貢獻社群,引流去書寫 nan Wikipedia 條目,不只是要有白話字書寫的版本,也能容納台文漢字書寫的版本。 字詞資料的部分有維基辭典計畫,在 Wikidata 上則有詞位這一資料類型,能夠儲存字詞資料,並且透過 Wikidata 的語意連結機制,連結 Wikidata QID。目前 nan 語言的資料有逐步累積,並且也連結到其他國際語言,並且透過 Lexeme Challenge 參與國際的每週活動。 ## 名稱由來 台語有不少自稱與他稱,也在台灣以外,也有在地的慣用稱呼。這裡用台灣話這一日本人給的稱呼,也不排斥其他族群的稱呼與在地台灣人的自稱,如台灣台語,Hokkien Language,福佬話、鶴佬話、河洛話。 由於歷史因素以及所屬地方不同,彼此有互相溝通性但又帶有所屬地區特色的語言,如台灣通行的台灣話/台灣閩南語/福佬話、廣東潮汕的潮州話、菲律賓的咱人話、馬來西亞新加坡的福建話、海南島的海南話,都歸在 ISO-639-3 nan 代碼下面。等待台灣政府官方正名,以及 ISO-639-3 的 nan 分拆案如果有結果,台灣話有獨立的代碼,可以試著申請獨立的台語維基百科。而在還沒有,實質上採用台灣優勢的台語書寫系統白話字與推薦漢字的 nan Wikipedia 是此時最合理的選擇。 | Column 1 | Column 2 | Column 3 | | -------- | -------- | -------- | | Text | Text | Text |