# ML Lecture 11 ## Modularization * Deep -> Modularization  * 因為長髮男 data比較少,所以長髮男的預測可能就不太準 * 所以使用模組化的概念 * 把問題切成小問題 * 分成 1.是男是女 2.長髮還是短髮 * 最後下決定的classifier 會參考前面模組化的classifier * 這樣後面的classifier用比較少的training data 就把model train 好  -- #### deep learning 跟 modularization扯上關係 在deep learning ,機器會自己學習如何做modularization,利用deep learning 可以用較少的 training data,因為有模組化的關係。 為何做deep learnin…,一大部分的原因是因為training data不夠。 #### Modularization - Speech * phoneme 的發音會因為前後的phoneme 而有所不同 * Therarchical structure of human languages  * The first stage of speech recognition * classification: input -> acoustic feature, output -> state  把state 轉成phoneme ,再從phoneme轉成文字,還要考慮同音不同字的問題。 ##### Each state has a stationary distribution for acoustic features * 每個state 都可以用一個"Gaussian Mixture Model (GMM) * 一般語言都大概有30種phoneme那每種÷phoneme隨著context的不同也要用不同的model * 所以有30^3的try for ,資料量太多了 * 所以不同state的名稱可能會指向相同的distribution。  在deep learning提出前: 先把GMM的pool做出來,從pool選出要用的GMM,要選哪些GMM是機器可以學的。 ---  [rest at 22:03](https://youtu.be/XsC9byQkUH8?t=1323) ###### tags: `mllearning2020`
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up