ADL Lecture 3.2: Language Modeling 筆記

# ADL Lecture 3.2: Language Modeling 筆記 ###### tags: `NLP` {%youtube [p2e_riORjuU](https://www.youtube.com/watch?v=LheoxKjeop8&list=PLOAQYZPRn2V5_9qzD7_1TzADthNSBf8_z&index=10&ab_channel=VivianNTUMiuLab) %} ## :memo: Language Modeling - Goal: 估算一個句子每一個word出現的機率。 ![](https://i.imgur.com/32dGmrS.png) ### N-Gram Language Modeling - 將一句話切成好幾個windows，去估算每個windows的機率。 ![](https://i.imgur.com/U6eTwKc.png) ![](https://i.imgur.com/e8vVPsu.png) - 問題:若training data沒出現過，那此機率會變成0。 - 解法: 給予極小機率 ![](https://i.imgur.com/Q0OBgGb.png) :rocket: ### Neural Language Modeling ![](https://i.imgur.com/RyrLOcg.png) ![](https://i.imgur.com/HcYN4dM.png) - 希望概念相似的word的vector越近越好。 ![](https://i.imgur.com/thqbhPw.png) > 問題: windows大小只能固定，跟真實狀況有差距。 ### Recurrent Neural Network * 想法: 考慮前面全部的字，並有時間順序。 ![](https://i.imgur.com/osIJzob.png) > 所有前面出現過的word，都可以model進去。 --- ## :memo: Recurrent Neural Network ## :memo: RNN Applications