# AI 語音助理比較 ## 摘要 : 語音助理已是現在手機必備的功能,但究竟google、siri、bixby,誰更加聰明人性化,是我想探討的重點,我會以生活上常會使用的指令做測試。 ### 介紹:在中文中的語音辨識,主要系統會把字分為聲母語與韻母,而在發音的過程之中,聲母轉變至韻母是一個漸進而非瞬間的改變,因此使用相關聲韻母圖形作為分析方法,可以更精準的辨識出正確的音節。而根據聲母的不同特徵,又可以將聲母分為下面四類: ***1.爆破音(Plosive):** 發音時嘴唇緊閉後,吐出氣流製造出類似爆破的聲音。其聲音震幅變化會先降至極小值後(代表嘴唇緊閉)後在急劇上升,而端視是否有持續送氣,倘若有持續送氣,則震幅可能會有另一個波峰,若無(un-aspirated )則在波峰之後,震幅將有所下降。如:ㄆ與ㄅ便是前述的關係,ㄆ有持續送氣,而ㄅ則無。(左圖為ㄅ右為ㄆ) ![](https://i.imgur.com/HniDGHu.png) ***2.摩擦音(Fricative):** 發音時,舌頭緊貼硬腭,形成狹窄的通道,氣流通過時造成湍流發生摩擦,由此發出聲響。由於摩擦音是透過穩定輸出氣流,使得聲音震幅變化相較於爆破音變化振幅較小。如ㄏ、ㄒ 等皆為摩擦音。 ***3.爆擦音(Affricate):** 此類型的發聲模型兼具爆破音與摩擦音的發聲特性。其主要發聲構造如同摩擦音是由舌頭緊貼硬腭使氣流通過時產生摩擦的聲音。而其通道更加緊密,使得氣流會在瞬間衝出,產生出如同爆破音般的特徵。如:ㄑ 、ㄔ等。 ***4.鼻音(Nasal):** 發音時,軟腭會下壓,下壓後,由氣管吐出的氣流被阻塞,無法進入口腔,因而轉往鼻腔。下圖便為鼻音ㄋ之特徵,其中紅點便為零點。 ![](https://i.imgur.com/9xBujr7.png) 而韻母又有雙母音、單母音之分,端視再發生時是否有音調的改變。而根據聲帶振動與否,又分為清音(unvoiced:聲帶不震動)等差異,**以上發音時不同的方式,在時頻圖上大多可以找到相對應的特徵,透過處理二維的時頻圖,藉由傳統影像處理的方式,達到語音辨識的目的**。 --- ### 比較分析 **天氣測試:指令為中國文化大學氣象。** 1.bixby ![](https://i.imgur.com/sZCihmF.jpg) 2.google ![](https://i.imgur.com/rycwrOw.jpg) 3.siri ![](https://i.imgur.com/ioI4P4D.jpg) **4.小結:推測bixby應該只支援中國地區,台灣並不適用,所以才會導致找到中國老人文化大學;siri則是找到文化大學附近的天氣預報稍嫌不精確;至於google則是精確達成我的指令,為該項目最優秀者。** **地圖測試:指令為如何到達台北101。** 1.bxiby ![](https://i.imgur.com/U7SqoXW.jpg) 2.google ![](https://i.imgur.com/qPC9OMK.jpg) 3.siri ![](https://i.imgur.com/3ft3FB7.jpg) **小結:bixby宣告失敗;google路線較長但時間最短,較符合一般人習慣;siri路線最短,但時間較長,預估是將路線長短擺在第一順位。** 尋找音樂測試:指令為youtube播放(如果可以)並同時尋找。 1.bixby ![](https://i.imgur.com/m4inI0h.jpg) 2.google ![](https://i.imgur.com/seAnhQG.jpg) 3.siri ![](https://i.imgur.com/ePFBGAa.jpg) 小結:bixby失敗,google尋找速度快速精確,且可直接在youtube播放;siri辨識較慢,但可以精確偵測。 聊天測試:指令你聲音怎麼這麼好聽? 1.bixby ![](https://i.imgur.com/TTV1eEF.jpg) 2.google ![](https://i.imgur.com/pxrcnoN.jpg) 3.siri ![](https://i.imgur.com/MjnSP7V.jpg) 小結:出乎意料的,bixby是三者中最親切的;siri則是最幽默的;google則是把我聊天的內容拿去google真令我哭笑不得。 ## 結論:就整體測試下來,我認為siri是三者中最完整的,雖然不是各個都很強,但至少他都能夠完成,google則是三者中最強大的,因為它整合了許多的app,使其能夠相互連動,以致在生態系與判讀上,能夠更加快速,能夠查閱的資料量也較大,bixby則是令我最失望的,不只不支援繁體中文,在判讀上常常失誤,並且無法完成指令,就結果來看,siri與google都相當優秀,在生活中都有出智慧音箱,間接可以遙控燈具、電視、冷氣、電扇、窗簾等,可所謂將ai語音辨識運用到極致。