Paintakotako
交接問題紀錄
Try
HackMD
Paintakotako
·
Follow
Last edited by
Paintakotako
on
Aug 23, 2023
Linked with GitHub
Contributed by
Edit
交接問題紀錄
Model
Finetune
Pretrianed
語速增加問題: 客語加速問題已解決 (使用 streaming)
印尼語語速以及流暢度
英文語者語速問題 (除了英文以外都過快)
考慮到訓練時英文語者原本語速就很快,可以考慮以下方法:
以一個語者為標準 ( 如台語語者 ),合成一段 utterance,以 秒數/音素 算出一秒多少音素,以此為基準,記做
d
u
r
1
再來對英文語者做同樣的事情,以 秒數/音素 算出一秒多少音素,記做
d
u
r
2
用
d
u
r
1
/
d
u
r
2
來算出修正 inference 速率比例
如果 CTL 出現標音錯誤或者需要修正,需要去哪裡更改?
例子:
我想
吃
泡麵
[['uoo12', 'sc1', 'iang13', 'tsc1', 'i12', 'ph1', 'au14', 'm1', 'ieen14']]
這裡吃發成雞
Finetune
兩者 F0 即便差值小,但合成出來有可能效果不如差值大的 ( e.g. 差值第二名 ),這種時候是不是只能人工聽而已 ?
加入 mfcc 作為評斷標準後,仍然會出現上述情況
Finetune 後有出現 duration 不穩的情況是否代表 over fitting 需要降低 iteration 數 ?
如果怎麼試都不像該怎麼辦 ?
幾句夠 ? 一次 finetune 一人是否最為準確 ?
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up
Comment