Try   HackMD

訊號與系統第三組(利用 google 工具做語音輸入)

contribute by <李東霖,張文瑋,江家銘,趙韓信>

github

demo

題目

  • 使用 google 工具做語音輸入

發想

  • google voice kit
    • 只有在5月號的MagPi雜誌有附送,還沒有正式開賣
    • 且還需要一塊 pi 覺得不夠好入門
  • google assissant
    • 用 gRPC(google Retome Procedure Call) 去使用
    • 本來想朝這個方向前進,但是 SDK 實在太難弄起來
    • 另外,我們發現這個是助理功能,也就是像 Siri 的存在,不太符合我們的題目方向
  • google cloud speech API
    • 用 REST 跟 gRPC(google Retome Procedure Call)去使用
    • 能夠上傳音訊檔或進行即時串流辨識
    • 非常符合我們的需求,但使用需要啟用計費功能
  • google Web Speech API
    • 後來發現到 google chrome 上有這樣的語音辨識工具
    • 是使用 javascript
    • 決定朝這個方向前進

利用

我們使用了這一套 API 製作了一些應用
這邊可以看到我們的 demo1

demo

demo1 顯示波形與辨識結果

因為好奇我們說話的波形,與辨識結果的相關
所以將收到的聲音在時域下的波形顯示出來
並且也在下面放入辨識結果

demo2 你我他小遊戲

想說可以做到語音辨識,我們就讓電腦當裁判
去抓大家有沒有不小心說出你我他
也可以測驗語音辨識的靈敏度

參考資料