這份講義文字內容以 CC-BY 4.0 授權開放逐家利用
20250306@台中教育大學
2008年10月:臺灣學術網路試用版(截圖來源)
2011年7月:臺灣學術網路正式版
2023年6月:臺灣學術網路第二版(2024年8月26日改名做教育部臺灣台語常用詞辭典)
新版教典的幾若个重點更新內容
教典最近兩冬攏有增加新收錄的詞,有補充真濟捷講以早煞無收入去的詞,比論講「肉燥飯 bah-sò-pn̄g」、「臺票 Tâi-phiò」,所有這兩冬新收錄的詞我攏有整理佇頂面的 Notion 頁面,歡迎逐家罔參考
延伸閱讀:教典相命術——揣著你的教典命運詞
重點筆記
27573
个詞目、毋過 ID 上大有編甲 29601
,中央有閬縫揣看覓,家己生日、手機仔號碼後壁4碼、抑是任何對你有意義的數字對應教典啥物條目,佇 Padlet 分享你的人生代表詞。
- 名姓查詢附錄
- 延伸閱讀:名姓查詢附錄發展過程 by 林佳怡
- 延伸閱讀:實用工具——做一改講我的名(大量名姓讀音做一改查詢)
- 延伸閱讀:台語名姓音讀的原理原則—教典編輯說明
重點筆記
分別用 iTaigi 你的名字 佮 教典名姓查詢附錄,揣看覓野球 12 強冠軍投手 張奕先生的名,想看覓:
先莫偷看參考解說,共你的想法寫佇 Padlet。
iTaigi 的結果並無正確,因為 iTaigi 的時代干焦是用教典有收錄的漢字讀音去鬥名姓的讀音。
張奕先生的名應該是 Tiunn I̍k,毋是 Tiunn Ī。
教典定「奕」讀 ī 是用佇「奕牌仔」、「奕棋」的替代用字。「奕」這字的文讀音 i̍k 教典並無收錄。
新版教典搜揣使用者體驗改良
以早的教典咧搜揣進前愛先選「精確」抑是「模糊」,若是揀毋著閣愛揤頂一頁重來,揣例句嘛干焦通好用「全文」,閣愛一條一條點入去看。這馬的搜揣體驗誠實是進步足濟
舊教典搜揣體驗錄影
用羅馬字揣例句的時陣,隨在你輸入「臺羅」、「白話字」、「臺羅傳統版」、「數字式臺羅」、「數字式白話字」攏會使,濫做伙揣嘛無問題,就算你寫 ko͘ khut8 che̍h tsing2 嘛揣會著 孤𣮈絕種 koo-khu̍t-tse̍h-tsíng
詞目。
延伸閱讀:教典僻智識23:連字符入門1—「詞」內底的音節連寫
延伸閱讀:教典僻智識23:連字符入門2—「詞組」內底的詞佮詞「基本上」分寫
咧揣羅馬字的時陣連字符號有寫佮無寫是無影響的,無論是輸入 thâu-mn̂g
抑是 thâu mn̂g
攏揣會著 頭毛 thâu-mn̂g
。針對詞目佮例句無法度針對連字符號做搜揣,嘛袂使輸入 --
揣輕聲
-
會揣著啥?延伸閱讀:教典僻智識1:巷仔內才知影的外來語詞
有一種其實是例外,就是寫佇漢字欄位的連字符號,干焦外來語詞會佇漢字欄寫羅馬字,就按呢咱會當用 -
揣著所有兩音節以上的外來語詞,嘛會使共藏佇方言差表的外來語詞掠出來,下跤的十一條外來語詞是藏佇方言差表無單獨條目的外來語。
另外,若是怙例句搜揣功能「用臺灣台語查用例」查 -
,會揣著四句內底有包含外來語詞的例句。
。
會揣著啥?延伸閱讀:教典僻智識11:關係教典俗諺的一寡僻智識
俗諺語的詞目除了「仙人拍鼓有時錯,跤步踏差啥人無?」攏是以句號 。
做結尾,所以查 。
就通好揣著多數的俗諺語例句。
另外閣有一个特性,因為羅馬字的句號 .
有 REGEX 的功能,致使查 ah-á-thiann-luî
揣會著「鴨仔聽雷。 ah-á-thiann-luî.」 詞目,查 ah-á-thiann-luî.
顛倒揣無,因為系統會當做你咧用 REGEX 搜揣。這个問題已經寫批共教育部團隊講矣,承辦人有回覆講會加入後日功能更新的評估。
啥物是正規表達式?
^
揣開頭$
揣結尾.
代表任何一个符號+
頭前的符號出現一改以上[]
中央的符號出現任何一个,像 [有無會袂]
就是揣 有
、無
、會
、袂
任何一个。嘛會當寫範圍,寫 [1-8]
就代表 1~8 的數字[^]
非中央任何的符號,像 [^a-z]
就代表毋是 a~z 的任何一个符號(.)(.)\1\2
會當共幾若个符號用月眉號做標記,閣照順序用 \1
\2
代表揣著的符號重複出現撇步
^
佮 $
共頭尾包–起來[^a-z]
取代 .
揣所有 4 字詞(數字會當換做其他的):
[^a-z]{4}
AA仔B:
^(.)\1仔.$
有無四字詞:
^[有無].[有無].$
色水ABB形容詞:
^[紅黃青綠藍紫烏白](.)\1$
數字四字詞:
^[一二三四五六七八九].[一二三四五六七八九].$
A跤B手:
^.跤.手$
會/袂環綴三字詞:
^[會袂].[得通過]$
AA疊詞:
^(.)\1$
AAB疊詞:
^([^a-z])\1.$
ABB疊詞:
^.(.)\1$
ABA疊詞:
^(.).\1$
AABB疊詞:
^(.)\1(.)\2$
ABBA疊詞:
^(.)(.)\2\1$
ABCA疊詞:
^(.)..\1$
ABAB疊詞:
^(.)(.)\1\2$
ABAC疊詞:
^([^a-z]).\1.$
ABCB疊詞:
^.(.).\1$
ABB
格式的疊詞有A無B
格式的疊詞會……袂
的詞目,中央毋管有偌濟字攏共揣出來.(.)\1
^有.無.$
會.+袂
[鼠牛虎兔龍蛇馬羊猴雞狗豬].+。$
延伸閱讀:舊教典資料檔(萌典 github)
教典的原始資料才是教典較原始的形態,提遮的資料來分析,會當開發出閣較濟教典網頁無的功能,嘛會使觀察著閣較濟的趣味代。真濟教典的民間延伸專案(萌典、ChhoeTaigi、芋圓台語辭典)攏是對辭典文字資料來的。
辭典資料僻智識
只要善用一寡表格函數,就通好予教典文字資料的表格閣較好用,頂面的連結是是經過陳建中加工整理的教典文字資料,所有的「詞目」、「義項」、「例句」、「又唸作」等等的表格攏有共對應的詞目資料囥入去,嘛有教典的網址連結,予逐家看資料會閣較方便。另外閣有增加一寡功能佮資料表格,方便咱揣著特定的詞目佮資料。
請揤「檔案」→「建立副本」khóo-phih 一份到家己的 Google 口座利用,後壁的一寡活動嘛會佇這个表格進行。
篩選器[thai-suán-khì] 是 Google Sheet 真實用的功能,會當建立一个方便篩選資料的介面,會當做排序、設條件揀家己欲愛的資料
詞目
工作表共篩選器開開,揀出無仝詞目類型
的詞目義項
工作表共篩選器開開,揀出無仝 詞性
的義項下跤兩个問題請逐家想看覓,共你的想法寫佇 Padlet
詞性
欄位會無寫留空白?共欲揣教典所有的 量詞
抑是 擬態詞
用這个表格會真方便
另外閣有提供照音節數索引的功能,只要你共教典所有的四字熟語攏背起來,逐家的台語攏是「高級班」!
教典文字資料其實嘛毋是完整的教典資料,內底並無提供漢字的「筆畫」、「部首」、「文/白/俗/替」的屬性,我有寫一个爬蟲程式共遮的資料攏揣出來佇下跤的表格予逐家參考。
(毋過教典的文白音區分標準、俗音佮替代用字的認定有真濟爭議,請逐家罔參考就好)
教典網頁無允准人用 REGEX 揣例句,毋過用 Google Sheet 的搜揣功能(揤 Ctrl+Shift+H),抑是「活用教典 101」的「例句 REGEX 搜揣」工作表,就通好利用 REGEX 揣例句喔。
例:
921彼擺塗牛翻身,幌甲真嚴重,連臺北的大樓都搖甲倒去。
921 hit pái thôo-gû-huan-sin, hàinn kah tsin giâm-tiōng, liân Tâi-pak ê tuā-lâu to iô kah tó–khì.
例:
伊做著涼勢涼勢,別人來做就無遐熟手!
I tsò tio̍h liâng-sè-liâng-sè, pa̍t-lâng lâi tsò tō bô hiah si̍k-tshiú!
例:
這台oo-tóo-bái的ia̋n-jín愛拆,你去共我遐的家私頭仔提來。
Tsit tâi oo-tóo-bái ê ia̋n-jín ài thiah, lí khì kā guá hia-ê ke-si-thâu-á the̍h–lâi.
例:
二九暝 Jī-káu-mê/Lī-káu-mî
七娘媽 Tshit-niû-má
例:
安太歲 an Thài-suè
漳泉濫 Tsiang-Tsuân-lām
王哥柳哥 Ông–ko-Liú–ko
例:
閣刣看會減淡薄仔無?
Koh thâi khuànn ē kiám--tām-po̍h-á–bô ?
糋的物件較厚油,食一半擺仔是無要緊,若傷捷食對健康會有影響喔!
Tsìnn ê mi̍h-kiānn khah kāu iû, tsia̍h--tsi̍t-puànn-pái-á sī bô iàu-kín, nā siunn tsia̍p tsia̍h tuì kiān-khong ē ū íng-hióng–ooh!
連.+都
(.)(.)\1\2
(.)(.)(.)\1\2\3
(.)(.)(.)(.)\1\2\3\4
[a-zA-Z]
^[A-Z]
[ -][A-Z]
--[^ -]+--?[^ -]+--?[^ -]+--?[^ -]+
羅馬字清單
佮 漢字羅馬字對應
兩个工作表是程式自動產生,有整理所有教典的羅馬字音節,閣有漢字羅馬字的對應關係。嘛有列出來源
透過觀察這兩个表,會當揣著真濟你以早毋捌注意過的教典特例,請先綴我操作,做伙來觀察羅馬字清單的機關。
拍開 羅馬字清單
,快速共規个清單巡過,觀察內底明顯毋是臺羅的物件,並討論下跤四个問題,共你的想法寫佇 Padlet:
釋義
的白話字音節 ōe
是啥?詞彙比較
的日文khá-nah け
じ
ゃ
ん
是啥?詞彙比較
的漢字像 中
大
婆
是啥?又唸作
的漢字像 下
二
冬
是啥?ōe
以早舊教典的真濟附錄攏是獨立的表格,佮一般詞目的格式無啥仝,2023 改版才統一,結果就致使講一寡資料的轉換會出現一寡較歹處理的所在,就會造成特例。
以早的火車頭地號名表格毋是一般詞目的「主音讀/第二優勢腔」+「又唸作」。是像下跤的圖按呢「站名」加上「讀音一」佮「讀音二」,其實原底按呢處理就免去改漢字,就是一个表予人知影華語寫遐的漢字站名的火車頭台語按怎稱呼。(會當對 Web Archieve 看舊教典附錄的格式)
「讀音二」內底有真濟資料是舊地名讀音,音節數嘛可能佮讀音一抑是站名會對袂起來,所以 2023 教典改版就共讀音二囥佇「又唸作」,並且佇後壁用括號註明對應的漢字。
教典的詞彙比較表攏總有收錄 1002 的無仝主題的表格,但是並毋是每一條攏有對應的詞目,有一寡干焦有表煞無詞目,下跤的連結是教典附錄頁面的詞彙比較表清單,會當看著表格佮詞目的對應關係,其中詞目欄是空白的部份就是無對應詞目的,一般人揣教典是掀袂著的,一定愛下載辭典文字資料才看會著。
這款無對應詞目的攏總有 47 條,我另外有整理佇下跤的連結:
教典秘密詞彙比較表
近反義詞不單列條目者
的又唸作揀出來關係「近反義詞不單列條目者」的詞目網址僻智識
義項tuì詞目近義
工作表,用篩選器共「詞目」欄的「#NA」揀出來近反義詞的列表有六个表,分別是 詞目tuì詞目
、義項tuì詞目
佮 義項tuì義項
的近義詞佮反義詞關係,其實表格內底有藏一寡詞目佮義項並無列佇 詞目
佮 義項
表格當中。
遮的資料有一寡是 2023/2024 新收詞的近反義詞不單列條目者,其他推測可能是猶咧編輯猶未正式公佈的資料,這个問題已經寫批共團隊反應矣,教育部有講後續會修改。