# 教典十作—教典應用工作坊 20241023 @ 師大臺語通論 :::info 這份講義文字內容以 [CC-BY 4.0](https://creativecommons.org/licenses/by/4.0/) 授權開放逐家利用 ::: ## 前言 逐家好 🙋‍♂️,今仔日的這門課會𤆬逐家**十个實作活動**,實際的共教典的文字資料 táng-lóo 落來用 Google sheet 做處理,共規本教典掀透透,揣出濟濟巷仔內才知影的教典祕密資料,順紲共教典的僻智識講予恁聽。 我自舊年九月佇面冊開始寫教典僻智識系列文章,目前已經 32 篇文章矣,攏有整理佇[教典僻智識系列分類索引](https://hackmd.io/@Q07_QXJ3TiO7QjkHkyOexA/B1boWP9r0)通好揀你有興趣的主題看喔。 ## 實作➊:名姓查詢系統 - [名姓查詢附錄](https://sutian.moe.edu.tw/und-hani/%E9%99%84%E9%8C%84/miasenn/) - [名姓查詢附錄發展過程 by 林佳怡](https://www.facebook.com/liz462/posts/pfbid0LuZrY8AgTpzmuUhXkyUAn6jxTb5zMctxCgwe2rcxdKGgxYT5D1Ad57K9EuXtB3uBl) - [實用工具——做一改講我的名(大量名姓讀音做一改查詢)](https://www.facebook.com/kiantiong7235/posts/pfbid0ydyfwcLuiVAErqURaxJTG6GVZRprxTxK5TgfaKy7FBhk8mKW8wT1rBJTrJB1Vx2Hl) >[!Note]重點筆記 > - iTaigi 先發起「你的名字」功能,後來教育部正式列計畫,2020 推出「講我的名」 > - 教典是**常用詞辭典**,毋是**大辭典**,嘛毋是**字典**,嘛毋是**腔口差研究典**,漢字音讀並袂全部攏收錄 > - 名姓查詢附錄以[甘字典](https://taigi.fhl.net/dick/)為基礎補字,加上名姓號名的原理,由許嘉勇先生整理漢字讀音佮排序 > - 2023 「講我的名」合併入去教典附錄 > - 教典僻智識提供表格程式會當批次處理大量名姓音讀 :::info #### 💁 來練習 分別用 [iTaigi 你的名字](https://itaigi.tw/name) 佮 [教典名姓查詢附錄](https://sutian.moe.edu.tw/und-hani/%E9%99%84%E9%8C%84/miasenn/),揣咱系主任 **莊佳穎**先生的名,想看覓: - 兩爿出來的結果敢相仝? - 是按怎會按呢? :::spoiler 參考解說 iTaigi 的結果並無正確,因為 iTaigi 的時代干焦是用教典有收錄的漢字讀音去鬥名姓的讀音。 咱系主任 **莊佳穎**先生的名的名愛唸 Tsng Ka-íng,毋是 Tsng Ka-ínn。 台語口語常用詞並無咧講「穎」的文讀音「íng」,干焦有白音「ínn」,像「發穎 \[huat-īnn\]」,所以教典就無收錄。 其他閣有真濟漢字讀音是教典詞目並無收錄的,像**劉珺瑤**同學的**珺\[kūn\]**、**潘奕安**同學的**奕\[i̍k\]** 毋過就算名姓查詢附錄已經有增補足濟足濟矣,名姓猶是充滿例外,猶是愛名從主人喔,像、**劉芸亘**同學的**亘\[suan\]**、**林欣安**同學的**欣\[sim\]** ::: ## 實作➋:教典詞目的身份證號碼 [教典相命術——揣著你的教典命運詞](https://www.facebook.com/kiantiong7235/posts/pfbid02vGvknRVGDgWx7B4fYWdDsSVEQcYtAAyj8rCS2pTcLRSCKMjcLaGgTunW2uHUnE4Bl) >[!Note]重點筆記 > - 教典的詞目攏有一个唯一的 ID,就是詞目網址後壁遐的數字 > - 教典攏總有 `27573` 个詞目、毋過 ID 上大有編甲 `29601` ,中央有閬縫 ![image](https://hackmd.io/_uploads/rkSBTxDC0.png) :::info #### 💁 來練習 - 揣看覓,家己生日、手機仔號碼後壁4碼、抑是任何對你有意義的數字對應教典啥物條目! ::: ## 實作➌:正規表達式基礎 - [正規表達式入門①——基礎概念、按怎揣漢字](https://www.facebook.com/kiantiong7235/posts/pfbid02CkJH2aos2XJAE4j9Qjjp5UBfqEKV3YgLeooKJZJNHoNF954tYghognTtz4nS155yl) - [正規表達式入門②——揣羅馬字的撇步](https://www.facebook.com/kiantiong7235/posts/pfbid02pK4PSaF252jR1v6vWSGBMT6dZfeJbgGQNTRcG2EQpLFaJocrJACz7y5AXPeB5wEfl) >[!Note]啥物是正規表達式? >- 正規表達式就是一種==揣規律==的技術 >- 只要文字有某乜規律會當描述出來,就會當揣著 >- 教典的「用臺灣台語查詞目」會當用正規表達式揣漢字佮羅馬字 ### 符號解說 - `^` 揣開頭 - `$` 揣結尾 - `.` 代表任何一个符號 - `+` 頭前的符號出現一改以上 - `[]` 中央的符號出現任何一个,像 `[有無會袂]` 就是揣 `有`、`無`、`會`、`袂` 任何一个。嘛會當寫範圍,寫 `[1-8]` 就代表 1~8 的數字 - `[^]` 非中央任何的符號,像 `[^a-z]` 就代表毋是 a~z 的任何一个符號 - `(.)(.)\1\2` 會當共幾若个符號用月眉號做標記,閣照順序用 `\1` `\2` 代表揣著的符號重複出現 >[!Tip] 撇步 >- 若欲限定字數,就用 `^` 佮 `$` 共頭尾包--起來 >- 無欲揣羅馬字,就用 `[^a-z]` 取代 `.` :::spoiler 咒語貧惰包 揣所有 4 字詞(數字會當換做其他的): `[^a-z]{4}` AA仔B: `^(.)\1仔.$` 有無四字詞: `^[有無].[有無].$` 色水ABB形容詞: `^[紅黃青綠藍紫烏白](.)\1$` 數字四字詞: `^[一二三四五六七八九].[一二三四五六七八九].$` A跤B手: `^.跤.手$` 會/袂環綴三字詞: `^[會袂].[得通過]$` AA疊詞: `^(.)\1$` AAB疊詞: `^([^a-z])\1.$` ABB疊詞: `^.(.)\1$` ABA疊詞: `^(.).\1$` AABB疊詞: `^(.)\1(.)\2$` ABBA疊詞: `^(.)(.)\2\1$` ABCA疊詞: `^(.)..\1$` ABAB疊詞: `^(.)(.)\1\2$` ABAC疊詞: `^([^a-z]).\1.$` ABCB疊詞: `^.(.).\1$` ::: :::info #### 💁 來練習 - 揣出所有的 `ABB` 格式的疊詞 - 揣出所有的 `有A無B` 格式的疊詞 - 揣出任何 `會……袂` 的詞目,中央**毋管有偌濟字攏共揣出來** :::spoiler 參考答案 - `.(.)\1` - `^有.無.$` - `會.+袂` ::: ## 實作➍:辭典資料下載 [教典>相關資源>辭典資料下載](https://sutian.moe.edu.tw/und-hani/siongkuantsuguan/) [舊教典資料檔(萌典 github)](https://github.com/g0v/moedict-data-twblg) 教典的原始資料才是教典上原初的形態,提遮的資料來看,會當看出真濟平常時仔掀教典袂觀察著的細節喔,今仔日後壁的內容攏會𤆬逐家耍教典原始資料,並且補充真濟教典的細節。以後同學嘛會當共類似的技巧提來處理其他有數位化的辭典抑是資料庫(像甘字典、台日大辭典、國教院臺灣台語語料庫……) :::info #### 💁 請綴我做 請共教典文字資料 táng-lóo -\-落來,用 google sheet 共拍予開(揤匯入、上傳檔案、共教典資料的 .ods 檔案拖入去) :::spoiler 圖解 先建立一个新的試算表,揤 `檔案`→`匯入` ![image](https://hackmd.io/_uploads/SJIatOvCR.png) 佇 `上傳` 遮共對教典táng-lóo的 kautian.ods 拖入去 ![image](https://hackmd.io/_uploads/Byc0YOPCC.png) 選 `取代試算表`,點 `匯入資料` ![image](https://hackmd.io/_uploads/r1sdqdwRC.png) ::: >[!Note] 辭典資料僻智識 >- 以早教典想欲提原始資料愛寄批共討 >- 萌典團隊有共寫批討著的資料整理過了後共用,公開佇 github,就按呢有共舊教典的資料留-\-落來,若是欲研究教典資料的變化就通好用遮的資料。 >- 這馬意傳做的新版教典有程式自動產生上新版本的文字資料表格,免閣寫批就通好直接看,而且以早干焦授權文字資料,這馬連音檔都有 CC-BY-ND 3.0 開放授權喔 >- 頂禮拜文字資料下載功能內容有更新(2024/9/16),文字資料的詞目佮例句增加一欄「對應音檔檔名」 :::spoiler 圖:舊教典版權頁說明 ![image](https://hackmd.io/_uploads/H1AuLZDA0.png) ::: :::spoiler 圖:9/16 系統維護公告 ![image](https://hackmd.io/_uploads/ByV1JxdCA.png) ::: ## 實作➎:篩選器、教典詞目五種類型 篩選器\[thai-suán-khì\] 是 Google Sheet 真實用的功能,會當建立一个方便篩選資料的介面,會當做排序、設條件揀家己欲愛的資料 ![image](https://hackmd.io/_uploads/r1k2BuP0C.png) :::info #### 💁 請綴我做 - 佇 `詞目` 工作表共篩選器開開,揀出無仝`詞目類型` 的詞目 - 佇 `義項` 工作表共篩選器開開,揀出無仝 `詞性` 的義項 #### 🤔 想看覓 - 啥物是「單字不成詞者」?啥物是「近反義詞不單列條目者」? - 啥物款的義項,`詞性` 欄位會無寫留空白? :::spoiler 參考解說 - 「單字不成詞者」就是這个字袂單獨使用的漢字 - 「近反義詞不單列條目者」就是這个詞條無單獨列出來的條目,干焦出現佇其他條目的「近義詞」抑是「反義詞」欄位,階級較低,較成是補充性質(補充:以早教典真濟近反義詞不單列條目者無寫羅馬字,這馬有沓沓仔咧補) - 通常是「附錄」、「見【~】條目」閣有「詞綴」的義項袂寫詞性 ::: ## 實作➏:共資料連起來 >[!Note]教典資料結構 >- 教典的資料是透過 ID 互相關連,一个`詞目`下底有幾若个義項 >- 表格的頭前幾欄攏有記錄一筆資料關連佗一个 ID,像每一條義項攏有寫伊對應的 ID。近反義詞的關係閣有另外的表格記錄 :::spoiler 圖:教典基本資料結構 ![image](https://hackmd.io/_uploads/r14FdTDRR.png) ::: ### 用 `CONCAT()` 共網址鬥出來 頭前咧講教典相命術的時陣有講著教典詞目攏有身份證號碼,而且網址後壁的數字就彼个詞目的 ID。 `CONCAT()` 函數是一个會當**共兩段文字連起來**的函數,用 `CONCAT()` 函數共教典網址佮詞目 ID 鬥做伙,咱就趁好佇咱的表格冬著連去詞目的網頁囉 >[!Tip]`CONCAT()` 函數語法規則 >`=CONCAT(文字1,文字2)` :::info #### 💁 請綴我做 佇 `詞目` 工作表增加一欄 `網址`,用 `CONCAT()` 函數共詞目網址 `https://sutian.moe.edu.tw/und-hani/su/` 佮 `詞目id` 鬥起來 ::: ### 用 `VLOOKUP()` 揣著對應的詞目漢字佮羅馬字 >[!Tip]`VLOOKUP()` 函數語法規則 >`=VLOOKUP(揣啥物內容,佇佗位揣,欲揣佗一欄的資料,false)` >第四的參數的功能今仔日用袂著,請固定寫一个 false 就好矣,莫插伊。 >舉例來講,寫 `VLOOKUP(9,'詞目'!A:F,3,false)`就是先佇 A 欄揣著ID是 `9` 的彼列,閣往正手爿行三步揣著伊彼列的漢字彼欄 `一半个仔` 就是函數運算的結果 >![image](https://hackmd.io/_uploads/BJv3WRvAR.png) `VLOOKUP()` 會當做垂直的搜揣,函數會當佇表格內底行一个 L 型的路徑揣著特定的資料,就按呢咱會當佇 `義項` 佮 `例句` 兩頁透過對應詞目ID揣著詞目的漢字佮羅馬字,處理了後咧看義項佮例句資料的時陣會閣較清楚這條屬於佗一个條目喔 :::info #### 💁 請綴我做 - 佇 `義項` 佮 `例句` 工作表增加兩欄 `對應詞目漢字` 佮 `對應詞目羅馬字`,用 `VLOOKUP()` 揣著 A 欄的詞目 ID 對應的漢字佮羅馬字 ::: ## 實作➐:近反義詞不單列條目者的又唸作 :::info #### 💁 請綴我做 - 佇 `又唸作` 工作表增加一欄 `詞目類型`,用 `VLOOKUP()` 揣著 A 欄詞目 ID 對應 `主詞目` 工作表的詞目類型 - 佇 `又唸作` 工作表增加一欄 `網址`,用 `CONCAT()` 共詞目網址 `https://sutian.moe.edu.tw/und-hani/su/` 佮 詞目id 鬥起來 - 拍開篩選器,共詞目類型是 `近反義詞不單列條目者` 的又唸作揀出來 ::: >[!Note]關係「近反義詞不單列條目者」的詞目網址僻智識 >- 「近反義詞不單列條目者」其實嘛有家己的網址通好入去,而且有的詞有「又唸作」屬性,平常時仔佇教典是看袂著的,算是教典隱形資料 >- 這个問題我捌寫批和教育部反應過,承辦人員講這是後續擴充事項,遮的詞以後嘛有可能有單獨的詞目 >:::spoiler 批信內容佮承辦人回批的截圖 >![image](https://hackmd.io/_uploads/SJTseTDRC.png) >::: ## 實作➑:教典祕密資料 ### 祕密詞彙比較表 [教典附錄/方言差/詞彙比較表](https://sutian.moe.edu.tw/und-hani/%E9%99%84%E9%8C%84/sutsha/) 教典的詞彙比較表攏總有收錄 1002 的無仝主題的表格,但是並毋是每一條攏有對應的詞目,有一寡干焦有表煞無詞目,以下的連結是教典附錄頁面的詞彙比較表清單,會當看著表格佮詞目的對應關係,其中詞目欄是空白的部份就是無對應詞目的,一般人揣教典是掀袂著的,一定愛下載辭典文字資料才看會著。 這款無對應詞目的攏總有 47 條,我另外有整理佇下跤的連結: [教典秘密詞彙比較表](https://docs.google.com/spreadsheets/d/1RSYbYOd0rgA3bpnjY15wk7F3nb7_tov1RpWsC-WfeoM/edit?usp=sharing) ![image](https://hackmd.io/_uploads/SJuDnGL1yx.png) ### 近反義詞表格內底的祕密資料 近反義詞的列表有六个表,分別是 `詞目tuì詞目`、`義項tuì詞目` 佮 `義項tuì義項` 的近義詞佮反義詞關係,其實表格內底有藏一寡詞目佮義項並無列佇 `詞目` 佮 `義項` 表格當中,咱會當用 `COUNTIF()` 函數配合篩選器共遮的詞揣出來。 遮的資料有一寡是 2023/2024 新收詞的近反義詞不單列條目者,其他推測可能是猶咧編輯猶未正式公佈的資料,這个問題我已經寫批共團隊反應矣,教育部有講後續會修改。 >[!Tip]`COUNTIF()` 函數語法規則 >`=COUNTIF(欲揣的範圍, 欲揣的物件)` >`COUNTIF()` 函數會當揣出範圍當中有偌濟符合條件的儲存格,並且共數量回傳。 :::info #### 💁 請綴我做 - 拍開 `義項tuì詞目近義` 工作表 - 增加一欄,用 `COUNTIF()` 揣 A 欄的義項 ID 敢有出現佇 `義項` 工作表內底 - 閣增加一欄,用 `COUNTIF()` 揣 D 欄的詞目 ID 敢有出現佇 `詞目` 工作表內底 - 拍開篩選器,共新增加的兩欄數量是 0 的資料撈出來觀察 ::: ## 實作❾:用正規表達式揣例句 教典無允准人佇「用臺灣台語查詞目」以外的功能拍正規表達式,毋過咱那共資料下載落來用表格軟體處理就無這个限制囉,佇 Google Sheet 揤 `Ctrl/Cmd` + `Alt/Option` + `h` 就通好拍開「搜尋並取代」,共「使用規則運算式進行搜尋」勾起來就通好輸入正規表達式做搜揣,提來揣例句就會當揣特定的句型抑是語法喔。 ![image](https://hackmd.io/_uploads/HyJyo-_C0.png) >[!Note]操作重點 >- 揤 `Ctrl/Cmd` + `Alt/Option` + `h` 拍開「搜尋並取代」 >- 共「使用規則運算式進行搜尋」勾起來 >- 會當揀「特定範圍」指定欲揣的範圍(先共欲揣的範圍箍起來才揤 `Ctrl/Cmd` + `Alt/Option` + `h` 嘛會自動限制範圍) :::info #### 💁 來練習 - 用正規表達式,揣著有「連……都……」句型的例句 >例: >921彼擺塗牛翻身,幌甲真嚴重,**連**臺北的大樓**都**搖甲倒去。 >921 hit pái thôo-gû-huan-sin, hàinn kah tsin giâm-tiōng, **liân** Tâi-pak ê tuā-lâu **to** iô kah tó--khì. - 用正規表達式,揣著佇句中疊詞連用的例句 >例: >伊做著**涼勢涼勢**,別人來做就無遐熟手! >I tsò tio̍h **liâng-sè-liâng-sè**, pa̍t-lâng lâi tsò tō bô hiah si̍k-tshiú! - 用正規表達式,揣著例句佇漢字欄濫寫羅馬字的例句 >例: >這台**oo-tóo-bái**的**ia̋n-jín**愛拆,你去共我遐的家私頭仔提來。 >Tsit tâi oo-tóo-bái ê ia̋n-jín ài thiah, lí khì kā guá hia-ê ke-si-thâu-á the̍h--lâi. - 用正規表達式,揣著頭字羅馬字大寫的詞目 >例: > 二九暝 **J**ī-káu-mê/**L**ī-káu-mî > 七娘媽 **T**shit-niû-má - 用正規表達式,揣著非頭音節羅馬字大寫的詞目 > 例: > 安太歲 an **T**hài-suè > 漳泉濫 Tsiang-**T**suân-lām > 王哥柳哥 Ông--ko-**L**iú--ko - 用正規表達式,揣著教典例句當中連續四音節輕聲的例 >例: >閣刣看會減淡薄仔無? >Koh thâi khuànn ē **kiám-\-tām-po̍h-á--bô** ? >糋的物件較厚油,食一半擺仔是無要緊,若傷捷食對健康會有影響喔! >Tsìnn ê mi̍h-kiānn khah kāu iû, **tsia̍h-\-tsi̍t-puànn-pái-á** sī bô iàu-kín, nā siunn tsia̍p tsia̍h tuì kiān-khong ē ū íng-hióng--ooh! :::spoiler 參考語法 - 連……都:`連.+都` - 疊詞連用:`(.)(.)\1\2` `(.)(.)(.)\1\2\3` `(.)(.)(.)(.)\1\2\3\4` - 漢字欄濫羅馬字:`[a-zA-Z]` - 頭字羅馬字大寫:`^[A-Z]` - 連續四音節輕聲:`--[^ -]+--?[^ -]+--?[^ -]+--?[^ -]+` ::: ## 實作➓:羅馬字清單、漢字羅馬字對應 `羅馬字清單` 佮 `漢字羅馬字對應` 兩个工作表是程式自動產生,有整理所有教典的羅馬字音節,閣有漢字羅馬字的對應關係。嘛有列出來源 透過觀察這兩个表,會當揣著真濟你以早毋捌注意過的教典特例,請先綴我操作,做伙來觀察羅馬字清單的機關。 :::info #### 💁 請綴我做 拍開 `羅馬字清單`,快速共規个清單巡過,觀察內底明顯毋是臺羅的物件,並討論以下的問題: 1. 出現佇 `釋義` 的白話字音節 `ōe` 是啥? 2. 出現佇 `詞彙比較` 的日文khá-nah `け` `じ` `ゃ` `ん` 是啥? 3. 出現佇 `詞彙比較` 的漢字像 `中` `大` `婆` 是啥? 4. 出現佇 `又唸作` 的漢字像 `下` `二` `冬` 是啥? :::spoiler 參考解說 1. 就是「[白話字 Pe̍h-uē-jī](https://sutian.moe.edu.tw/und-hani/su/13982/)」詞目解說內底寫著 「Pe̍h-ōe-jī」的 `ōe` 2. 詞彙比較表編號 968 「猜拳」表格的「三峽偏泉腔」毋知是按怎漢字佮羅馬字攏寫「じゃんけん」,致使遮有收錄著,毋過這條是頭前實作➑有講著的祕密資料,一般人佇教典掀袂著 3. 詞彙比較表有一寡詞有用括號註解一寡資訊,像編號 144 「梳子」的臺中偏漳腔有註明大細支的精差,標「捋仔 lua̍ih-á(小)」佮「柴梳 tshâ-se(大)」。編號 632 有標金門的「錢 tsînn」佮「鐳 lui」差佇「錢的中央愛有空」 4. 又唸作的漢字請看以下段落「以早舊教典地名附錄的特殊體例」的詳細解說 ::: ### 舊教典火車站地名附錄的特殊體例 以早舊教典的真濟附錄攏是獨立的表格,佮一般詞目的格式無啥仝,2023 改版才統一,結果就致使講一寡資料的轉換會出現一寡較歹處理的所在,就會造成特例。 以早的火車頭地號名表格毋是一般詞目的「主音讀/第二優勢腔」+「又唸作」。是像下面的圖按呢「站名」加上「讀音一」佮「讀音二」,其實原底按呢處理就免去改漢字,就是一个表予人知影華語寫遐的漢字站名的火車頭台語按怎稱呼。(會當對 [Web Archieve](https://web.archive.org/web/20180603094438/http://twblg.dict.edu.tw/holodict_new/index.html) 看舊教典附錄的格式) ![image](https://hackmd.io/_uploads/HycOa3811x.png) 「讀音二」內底有真濟資料是舊地名讀音,音節數嘛可能佮讀音一抑是站名會對袂起來,所以 2023 教典改版就共讀音二囥佇「又唸作」,並且佇後壁用括號註明對應的漢字。 ![image](https://hackmd.io/_uploads/rydszT8J1g.png) ## 總結 今仔日的十个實作活動,希望會當予逐家真濟新的想法,只要加觀察規律,斟酌去想教典的規則佮結構,善用表格抑是程式家私就會當發現真濟機關。逐家會當閣進一步想看覓,啥物款的資料是你想欲揣的?會當用啥物家私鬥揣出來? 希望遮的活動予逐家感覺心適,歡迎逐家共你的想法透過以下的表單共我分享: [表單連結](https://forms.gle/1XwgeK4SPWnJadN97) ## 補遺:一寡你可能閣會有興趣的主題 ### 其他字辭典的公開原始資料 毋但是教典,甘字典、台日大辭典佮一寡其他的字辭典的原始資料嘛會當提來處理,多數的這款公開資料攏會用得佇 ChhoeTaigi 字詞資料許揣著。 [ChhoeTaigi 找台語:台語字詞資料庫](https://github.com/ChhoeTaigi/ChhoeTaigiDatabase) [Kam Jī-tián Chu-liāu-khòo](https://github.com/fhl-net/Kam-Ui-lim_1913_Kam-Ji-tian) [《台日大辭典》台語譯本資料](https://github.com/fhl-net/Lim-Chun-iok_2008_Tai-jip-Tua-su-tian) ### 教典詞目詞性/音節數檢索 欲揣教典所有的 `量詞` 抑是 `擬態詞` 用這个表格會真方便 另外閣有提供照音節數索引的功能,只要你共教典所有的四字熟語攏背起來,逐家的台語攏是「高級班」! [教典詞目詞性/音節數索引-Google Sheet](https://docs.google.com/spreadsheets/d/195libam9WnRPbxHuSkIdbmWZFbzIShRENm4YK8saXqw/edit?usp=sharing) ### 電腦台語字有偌長? 咧用佮文字長度相關的功能的時陣,定定會有一寡違反直覺的狀況,像「台」佇多數程式環境當中算是「一个」字,「𠕇」煞會予認定做是「兩个」字,相關的特性佮原理請參考以下文章解說。 [電腦台語字有偌長?-陳建中](https://hackmd.io/@Q07_QXJ3TiO7QjkHkyOexA/r1WMAyynR) ### 教典台華/台台倒反詞 定定聽人講「台語喜歡和華語唱反調,華語`熱鬧`台語就要講`鬧熱`,颱風台語就要講`風颱`……」,你敢會好奇這類的詞教典有收偌濟?這个表格整理所有教典內底的台/華語序顛倒反的詞,閣有台語本身一寡有 AB|BA 閣有 ABC|BCA 關係的詞彙組! [教典倒反詞-Google Sheet](https://docs.google.com/spreadsheets/d/1x_8jrcWrIZeP8xfer0bToVyfEnzMbOvBtPRH_C1himQ/edit?gid=668365147#gid=668365147) ### 教典漢字詞目資料 教典文字資料其實嘛毋是完整的教典資料,內底並無提供漢字的「筆畫」、「部首」、「文/白/俗/替」的屬性,我有寫一个爬蟲程式共遮的資料攏揣出來佇下跤的表格予逐家參考。 (毋過教典的文白音區分其實有真濟烏白標,逐家莫傷相信;閣有俗音佮替代用字的認定嘛有受真濟批評) [教典漢字詞目-Google Sheet](https://docs.google.com/spreadsheets/d/1GKk2g-a7616BkNTjNvHwW_3lWJkXzZwqhD3MUmP3x1E/edit?usp=sharing) ### 2023/2024 教典新收詞 2023/2024 兩冬教典攏有大更新,攏總新收錄 550 條新的條目,這个 Notion 頁面共這兩冬新收錄的詞攏整理佇遮通好直接看喔。 [教典新收詞-Notion](https://www.notion.so/kiantiong/9a9ea381ad024ee398e35e3b68d53811?v=dd7a988f9ee3489081abd5fc72bfdbf5)