# 英文ASR ###### tags: `英語ASR` # 11/04 進度 - [ ] 周一 把語料放入148 `熙堃` * 路徑為:148: ~/kaldi/COMMON_VOICE_CORPUS/ ==資料結構為以下:== :::success > wav > clean.csv > clean2.csv > EN111 >> wav >> trn >> README.txt ::: * 利用英文cluster 的方法來對英文音節進行切割 - [ ] 利用大量語料進行訓練 100 小時,與en_test1 比較 (原本的方法) - [ ] 錯誤分析,先測試語料中 20句 ==只能測試一次==,再測20句自己生成的句子==由3個字的短句子到10個字的長句子不等==,最後紀錄在 excel中,然後利用[這個工具](https://www.amberscript.com/en/wer-tool/)就可以把WER報給老師聽了。 `11/9 報告進度時解釋第三行phoneme的切法 以及WER 這次先用沅漢的方法切`