VoiceBank 語音銀行 - 錄音指引

您好，很感謝您參與「VoiceBank 語音銀行」的使用，網址為：https://voicebank.ce.ntpu.edu.tw ，您可以在 VoiceBank 網站上錄製自己的語音，VoiceBank 團隊將使用您錄製的語音，建立具有您語音音色的客製化文字轉語音系統。請參考以下目錄開始使用 VoiceBank。 # 目錄 [TOC] # 使用簡介請依照以下圖 (圖 1) 所示的 5 步驟使用「VoiceBank 語言銀行」。 ```mermaid flowchart TD st([開始]) --> op9[步驟 1. 錄音前準備] --> op1[步驟 2. 註冊] --> op2[步驟 3. fa:fa-microphone 錄音 < 2小時] --> op3[步驟 4. 等候「語音系統」建置完成 < 24小時] --> op4[步驟 5. 使用語音系統] op4 --> op4 ``` <center> 圖 1：VoiceBank 語音銀行使用流程 </center> <br> 5 步驟簡述如下： * **步驟 1：錄音前準備**：使用者先自備電腦、麥克風、以及選擇錄音地點。 * **步驟 2：註冊**：使用者先至 [VoiceBank](https://voicebank.ce.ntpu.edu.tw) 網站上進行「註冊」。 * **步驟 3：錄音**：註冊成功後，使用者可以隨時進入系統開始「錄音」，當錄音感到疲憊時，可隨時登出，想要在錄音時，可再登入系統繼續錄音。 * **步驟 4：等候「語音系統」建置完成**：若使用者已經「錄音」達到足以建立「語音系統」的語音數量時，系統便會開始建立使者的「語音系統」，從開始建立「語音系統」到完成，可在 24 小時內完成。 * **步驟 5：使用語音系統**：建立好「語音系統」之後，使用者可以登入 [VoiceBank](https://voicebank.ce.ntpu.edu.tw) 開始線上使用。 # 步驟 1: 錄音前準備 ## 1-1: 準備電腦請準備桌上型個人電腦（桌電）或是筆記型電腦（筆電），目前 VoiceBank 網站**不支援**行動裝置（平板 or 手機）。桌電一般來講可能會有風扇的噪音，而筆電大多在使用時已經沒有明顯噪音，所以比較推薦使用筆電來進行錄音。 ## 1-2: 準備麥克風請使用 USB 端子的麥克風，USB 端子的麥克風使用起來方便，僅需要將麥克風的 USB 端子插入電腦，即可使用。相較於傳統音源線，USB 端子的麥克風通常可以有較高音質的錄音。大約新台幣 1,500 元以上的 USB 端子麥克風就可以有接近網路直播或是 Podcast 的錄音品質。 ## 1-3: 選擇錄音地點或控制錄音環境盡量找安靜、無明顯干擾的空間，常見干擾如空間回音、風扇噪音、冷氣運轉聲 (調低溫度及風量可有效改善) 及敲擊聲等，皆應盡量減少。 ## 1-4：下載 [Mozilla FireFox](https://moztw.org/firefox/) 瀏覽器「VoiceBank 語音銀行網站」需要使用網頁瀏覽器登入使用，雖然目前世界上最流行使用的網頁瀏覽器是 Google Chrome，然而 Google Chrome 會使用一些演算法將您的語音進行處理，反而破壞音質，<font color="#f00">所以請不要使用 Google Chrome，請至 Mozilla FireFox 的繁體中文官網 (https://moztw.org/firefox/) 下載 Mozilla FireFox 瀏覽器。</font> # 步驟 2: 註冊如果您已有帳號請直接跳到「[步驟 3：錄音](#%E6%AD%A5%E9%A9%9F-3%EF%BC%9A%E9%8C%84%E9%9F%B3)」。 ## 2-1：打開 FireFox 瀏覽器 1. 按下「啟動台」 ![](https://hackmd.io/_uploads/BJcivnsGa.png) 2. 搜尋「Firefox」 ![](https://hackmd.io/_uploads/SkHid2iz6.png) 3. 開啟「Firefox」 ![](https://hackmd.io/_uploads/SJa5K3jza.png) 4. 如果您平常是使用其他瀏覽器，請選擇「現在不要」設定 Firefox 為主要瀏覽器。 ![](https://hackmd.io/_uploads/SylAohofa.png) ## 2-2：進入 VoiceBank 網站 1. 鍵入 VoiceBank 網址 https://voicebank.ce.ntpu.edu.tw ，並前往。 ![](https://hackmd.io/_uploads/rk8DanjfT.png) 2. VoiceBank 網站 https://voicebank.ce.ntpu.edu.tw 首頁顯示如下圖： ![](https://hackmd.io/_uploads/r1j81asGp.png) ## 2-3：進入 VoiceBank 註冊頁面填寫資料 1. 點擊「註冊帳號」進入註冊頁面。 ![](https://hackmd.io/_uploads/rkPIe6jzp.png) 2. 填寫「註冊頁面資料」，請依序輸入帳號、密碼、E-mail、選擇性別和母語，輸入隨機產生驗證碼，註冊前請按底下連結進入使用條款，閱讀完後打勾，按下進行「註冊帳號」按鈕。 ![](https://hackmd.io/_uploads/BkZbLpizT.png) 3. 註冊成功後，需要先認證信箱，會寄一封認證信到剛剛輸入的 E-mail，如果未收到，請點選按鈕「重寄驗證信」。 ![](https://hackmd.io/_uploads/SJQgw6sfa.png) ## 2-4：進入 E-mail 系統進行認證信點擊 1. 這邊以『帳號 : chenyuchiang800309』為例子，進入 E-mail 系統收信，打開「臺北大學-漸凍人協會回聲計畫」的信件。信件後點擊底下連結，完成認證即可登入使用。 ![](https://hackmd.io/_uploads/B1dVqpjMa.png) 2. 點擊信件中連結，即完成認證，即可登入 VoiceBank (https://voicebank.ce.ntpu.edu.tw) 使用。 ![](https://hackmd.io/_uploads/rkHYFTiGT.png) 點擊後得到以下回應，按下「確定」按鍵即可。 ![](https://hackmd.io/_uploads/HySb26ifp.png) ## 2-5：登入 VoiceBank 系統 1. 進入「登入頁面」 ![](https://hackmd.io/_uploads/HyAzp6ifa.png) 2. 填入登入資訊，包含「帳號」、「密碼」、以及「認證碼」，並按下「登入開始錄音」。 ![](https://hackmd.io/_uploads/HkNmCasGa.png) 4. 登入後，首頁會有兩個系統按鈕「開始錄音」(即錄音系統)、「語音系統」，右上角會顯示帳號名稱和按鈕「登出」 ![](https://hackmd.io/_uploads/BkypApsza.png) # 步驟 3：錄音 ## 3-1：進入「錄音頁面」 1. 如下圖請按「開始錄音」進入錄音頁面。 ![](https://hackmd.io/_uploads/SkMfL4TGa.png) 2. 錄音頁面進入後如下圖所示。可以看到介面左側有很多語料庫，依照不同類型語料做分類，以下為各個語料庫的說明： * 語料庫(一)：短文，包含 16 個段落，每個段落有 3 到 4 句語音需要錄音。語料庫(ㄧ)若錄製完成，便可以建立音質尚可以具有使用者音色的語音系統。 * 語料庫(二)：短文，包含 12 個段落，每個段落有 6 到 7 句語音需要錄音。若語料庫(ㄧ)以及語料庫(二)都錄製完成，便可以建立音質較好的語音系統。 * 語料庫(三)：一字常用語。 * 語料庫(四)：二字常用語。 * 語料庫(五)：三字常用語。 * 語料庫(六)：四字常用語。 * 語料庫(七)：五字常用語。 * 語料庫(八)：六字或長於六字常用語。 ![](https://hackmd.io/_uploads/HyWhL4Tf6.png) ## 3-2：錄製「語料庫(ㄧ)」請儘量至少錄製完「語料庫(一)」，這樣至少可以讓您建立出來的個人化文字轉語音系統能以您的音色正確發音。 1. 請點選介面左側的「語料庫(ㄧ)」，如下圖顯示。 ![](https://hackmd.io/_uploads/HkvY7H6Ma.png) 2. 點選後介面左側便展開段落，共有 16 個段落，也就是「段落ㄧ」....「段落十六」，如下圖顯示。 ![](https://hackmd.io/_uploads/r1JgESpfT.png) 3. 請依序由「段落一」開始點選。 ![](https://hackmd.io/_uploads/H1NvrH6zT.png) 4. 點選後如下圖所示，可以看到介面右側會彈出「語料庫(一): 段落一」的「第 1 句」，「語料庫(一): 段落一」裡面「共4句」要請使用者錄音完成。中間紅色的是波形視覺框，未錄製沒有紀錄所以會是空的。 ![](https://hackmd.io/_uploads/SJa2BH6fT.png) 4. 您可以按下介面右側文字下方綠色的「●」開始錄音，在音效視覺框會顯示當前的波形。建議您在按下「●」之後一下子再開始發音，這樣才不會讓您一開始說的話沒有被 VoiceBank 錄製到。 ![圖片.png](https://hackmd.io/_uploads/r1b1-Izma.png) <br> 如果您是第一次使用 Firefox 瀏覽器進行錄音，會跳出如下圖的「允許使用麥克風」的對話框，對話框內也會有下拉式的「選擇麥克風」選項，您可以在選擇中找到您插入電腦 USB 孔的 USB 端子麥克風，如圖中顯示，錄音者是使用「AT2020USB+」這一支 USB 端子麥克風。 ![圖片.png](https://hackmd.io/_uploads/SyjhrR4XT.png) 5. 如果您按下「●」開始錄音，並且有在成功收音，就會如下圖動畫中的顯示。 ![ezgif.com-optimize拷貝.gif](https://hackmd.io/_uploads/rkI-JySX6.gif) 7. 錄完後按下「■」停止錄音，在音效視覺框可以看到剛剛錄音的波形 ![圖片.png](https://hackmd.io/_uploads/Hy9VjCVm6.png) 8. 點擊音效視覺框即可播放剛才的錄音，點擊一下暫停再點擊一下繼續播放，播放過的內容會呈現紫色，如下方動畫顯示： ![ezgif.com-optimize(1).gif](https://hackmd.io/_uploads/r1qhW1BXp.gif) 10. 如果您不滿意剛才錄好的音，您只需要按下「●」即可重新錄音，介面的右下會有「>」按鈕，是前往下一句的按鈕，就可以繼續重複原本錄製「第1句」的動作。到第二句之後左下會有「<」按鈕，是回到上一句的按鈕，如果是此段落的最後一句，就不會有「>」按鈕，如以下動畫所示。 ![ezgif.com-resize.gif](https://hackmd.io/_uploads/r1_3rfBQT.gif) ## 3-3：繼續錄製其他段落以及語料庫在錄製完「段落一」之後，可以繼續相同於以上方法繼續錄製其他段落，如果「語料庫(ㄧ)」的段落錄製好了，可以再使用相同錄音方法錄製錄製其他語料庫。建議就照順序將「語料庫(二)」、「語料庫(三)\~(八)」錄製完成。注意！因為「語料庫(三)~(八)」皆是常用短語，所以錄製難度和時間減少許多。 # 步驟 4：等候「語音系統」建置完成若使用者已經「錄音」達到足以建立「語音系統」的語音數量時，也就是至少完成「語料庫(一)」的錄音，系統便會開始建立使者的「語音系統」，從開始建立「語音系統」到完成，可在 24 小時內完成，並通知使用者。若等待多時沒有接到通知，請 email 給信箱 voicebank.ce.ntpu.edu.tw@gmail.com 訊問。 # 步驟 5：使用語音系統 ## 5-1：進入「語音系統」 1. 請在首頁點選「語音系統」。 ![圖片.png](https://hackmd.io/_uploads/S1HveGrX6.png) 2. 若您的「語音系統」仍尚在建立，或因為您錄製的語料不夠所以「語音系統」無法被建立，就會顯示如下圖，您可以點選「回首頁」，再繼續錄音或是等待「語音系統」建立完成。 ![圖片.png](https://hackmd.io/_uploads/ByPXWfBmT.png) ## 5-2：使用「文字輸入區」 1. 若您的「語音系統」已經建立好了，就會進入如下圖的頁面顯示，左邊為「文字輸入區」，右邊為「歷史區」。 ![圖片.png](https://hackmd.io/_uploads/By2emfBm6.png) 2. 使用左邊的「文字輸入區」 * 在文字輸入區輸入文字後 * 合成按鈕「+3」~「-3」，依照想要的語速選擇送出，其中「+3」最快，通常是按「0」即可。 * 如果打錯字可以按下「清除重設」。 * 合成後可以按下「播放」，播放剛才合成的語音。 * 「喇叭符號」拉霸可以調整合成語音後播放的音量。動作如下圖所示。 ![ezgif.com-optimize-3.gif](https://hackmd.io/_uploads/ry4Z0mr7T.gif) ## 5-3：使用「歷史區」 1. 使用右邊的「歷史區」 * 合成後會產生歷史紀錄，按下「播放」，會把文字內容匯入到文字輸入區並且播放語音。 * 匯入後一樣可以用左邊區塊的「播放」按鈕播放和「喇叭符號」拉霸調整音量。 * 歷史紀錄可以依照「建立日期」、「點擊次數」排序。 * 按下「刪除」可以刪除該筆歷史紀錄，也可以點選「清除全部」將整頁的紀錄刪除。 ![ezgif.com-crop.gif](https://hackmd.io/_uploads/BksDdXBmp.gif) * 歷史播放資料查詢輸入區，輸入可以搜尋歷史紀錄，可以搜尋的相關信息包括：文字內容、建立日期、播放日期、點擊次數，可利用空格隔開進行搜尋可以一次輸入多個相關信息，需要注意的是輸入日期時必須要將年、月、日單獨用空格隔開。 ![ezgif.com-crop-2.gif](https://hackmd.io/_uploads/Bk2Dj7BXT.gif) ## 5-4：版面設定 1. 按下「版面鎖定」可以依照自己得需求調整區塊的大小和位置以後，再按一下「版面鎖定」即可。 ![ezgif.com-optimize-4.gif](https://hackmd.io/_uploads/Skg5fESQ6.gif) 2. 按鈕型態的「大型」、「中型」、「小型」，可以調整按鈕的大小 ![ezgif.com-video-to-gif.gif](https://hackmd.io/_uploads/S1mLB4r7T.gif) --- # 聯絡如有任何問題，請聯絡：計畫主持人：江振宇副教授/國立臺北大學通訊工程學系 webpage: https://web.ntpu.edu.tw/~cychiang/ email-1(主要): voicebank.ce.ntpu.edu.tw@gmail.com email-1(次要): cychiang@mail.ntpu.edu.tw