# Common Voice in g0v33
###### tags: `Common Voice`
migrated from https://moztw.hackpad.tw/Common-Voice-g0v33#Common-Voice-in-g0v33
---
t.me/moztwCV
slack @irvin
line.me/ti/g/GXvGlgG0As/
## intro
* (坑主時差中)
* Mozilla
* Firefox
* 不同裝置的瀏覽器
* 智慧音箱
* VR
* 電視
* 語音輸入
* AI 工程師
* 一百多種語言
* 沒有錢
* 沒有資料
* 自己收集
* 總語言 1300 h
* 18 語言
* CC0
台灣
* 句庫:三千句CC0日常對話
* https://github.com/mozilla/voice-web/tree/master/server/data/zh-TW
* double in H1
* 52h / 已釋出 30h
* https://voice.mozilla.org/zh-TW/datasets
* ~700人參與錄音
BTW
* 其他 Mozilla 相關的坑也可以找我
* moztw.org / mozilla products
* 摩茲工寮場地免費提供開放xx專案使用
* moztw.org/space
https://voice.mozilla.org/zh-TW
https://github.com/mozilla/voice-web/
1. 語言學
2. AI 背景 (deep speech or voice recognize)
3. 對語音庫運用有興趣 (語音合成 or other)
4. 想推動台語 / 其他本地語言語音收集 (整理 CC0 無版權句庫)
5. 建立 CC0 句庫
https://github.com/irvin/voice-text-tools
node text-tools.js -c all.txt CnsPhonetic2016-08v2.cin
Total numbers of phonetic in CnsPhonetic2016-08v2.cin are 1567
Numbers of phonetic from 2015 characters in all.txt are 861
We have cover 54.95% of the pronunciations.
裡面有許多參考資料 >
[Common Voice 句庫松 II (2019/2/23)](https://hackmd.io/@moztw/rk4Ah7WdF)
其他許多資料
* Common Voice Meetup 會後信
* Common Voice Sprint 1
* Common Voice Sprint in Taipei (2018 May 12)
* News about Common Voice (in zh-tw)