ML Lecture 11 - HackMD

# ML Lecture 11 ## Modularization * Deep -> Modularization ![](https://i.imgur.com/bqCKnap.png) * 因為長髮男 data比較少，所以長髮男的預測可能就不太準 * 所以使用模組化的概念 * 把問題切成小問題 * 分成 1.是男是女 2.長髮還是短髮 * 最後下決定的classifier 會參考前面模組化的classifier * 這樣後面的classifier用比較少的training data 就把model train 好 ![](https://i.imgur.com/wi79qwE.png) -- #### deep learning 跟 modularization扯上關係在deep learning ,機器會自己學習如何做modularization，利用deep learning 可以用較少的 training data，因為有模組化的關係。為何做deep learnin…，一大部分的原因是因為training data不夠。 #### Modularization - Speech * phoneme 的發音會因為前後的phoneme 而有所不同 * Therarchical structure of human languages ![](https://i.imgur.com/CnZWEkg.png) * The first stage of speech recognition * classification: input -> acoustic feature, output -> state ![](https://i.imgur.com/6JaeW22.png) 把state 轉成phoneme ，再從phoneme轉成文字，還要考慮同音不同字的問題。 ##### Each state has a stationary distribution for acoustic features * 每個state 都可以用一個"Gaussian Mixture Model (GMM) * 一般語言都大概有30種phoneme那每種÷phoneme隨著context的不同也要用不同的model * 所以有30^3的try for ，資料量太多了 * 所以不同state的名稱可能會指向相同的distribution。 ![](https://i.imgur.com/qonyPS7.png) 在deep learning提出前：先把GMM的pool做出來，從pool選出要用的GMM，要選哪些GMM是機器可以學的。 --- ![](https://i.imgur.com/H2u97rP.png) [rest at 22:03](https://youtu.be/XsC9byQkUH8?t=1323) ###### tags: `mllearning2020`