# Common Voice in g0v33 ###### tags: `Common Voice` migrated from https://moztw.hackpad.tw/Common-Voice-g0v33#Common-Voice-in-g0v33 --- t.me/moztwCV slack @irvin line.me/ti/g/GXvGlgG0As/ ## intro * (坑主時差中) * Mozilla * Firefox * 不同裝置的瀏覽器 * 智慧音箱 * VR * 電視 * 語音輸入 * AI 工程師 * 一百多種語言 * 沒有錢 * 沒有資料 * 自己收集 * 總語言 1300 h * 18 語言 * CC0 台灣 * 句庫:三千句CC0日常對話 * https://github.com/mozilla/voice-web/tree/master/server/data/zh-TW * double in H1 * 52h / 已釋出 30h * https://voice.mozilla.org/zh-TW/datasets * ~700人參與錄音 BTW * 其他 Mozilla 相關的坑也可以找我 * moztw.org / mozilla products * 摩茲工寮場地免費提供開放xx專案使用 * moztw.org/space https://voice.mozilla.org/zh-TW https://github.com/mozilla/voice-web/ 1. 語言學 2. AI 背景 (deep speech or voice recognize) 3. 對語音庫運用有興趣 (語音合成 or other) 4. 想推動台語 / 其他本地語言語音收集 (整理 CC0 無版權句庫) 5. 建立 CC0 句庫 https://github.com/irvin/voice-text-tools node text-tools.js -c all.txt CnsPhonetic2016-08v2.cin Total numbers of phonetic in CnsPhonetic2016-08v2.cin are 1567 Numbers of phonetic from 2015 characters in all.txt are 861 We have cover 54.95% of the pronunciations. 裡面有許多參考資料 > [Common Voice 句庫松 II (2019/2/23)](https://hackmd.io/@moztw/rk4Ah7WdF) 其他許多資料 * Common Voice Meetup 會後信 * Common Voice Sprint 1 * Common Voice Sprint in Taipei (2018 May 12) * News about Common Voice (in zh-tw)