--- title: '自然語言' tags: NLP --- 自然語言 === ## Table of Contents [TOC] ## 學習目標 * What's 自然語言? * 自然語言 是如何形成的? --- 語言 --- * 定義: * Oxford Dictionary * The method of human communication. * 強調用來==溝通== * 教育部國語辭典 * 人類用嘴說出來的話,由語音、語彙和語法所組成,是表達情意、傳遞思想的重要工具。 * 不是用嘴說出來的話,就不是語言?!手語 * ==溝通==特色: * 透過書寫(`自然語言處理`)、口說(`語音辨識`)、肢體(`電腦視覺`) * 包含用字 * 有結構性、常約定成俗 * ==溝通==的常見問題(雞同鴨講): * Claude Shannon (1916-2001)提出==資訊理論(Information Theory)==,專講`溝通`。 > [資訊理論之父——香農的數學與理工之戀](https://kknews.cc/zh-tw/news/y8amepg.html) > [資訊理論](http://boson4.phys.tku.edu.tw/thermodynamics/Ch-15_Information_theory.html) * 電腦如果要了解"我們所做一些不同的表達"的時候,要用機器語言(0/1)來表示。 * 提出的起源:因為戰爭需要傳遞密碼。 * A加密,傳到B解密。B要能知道A在講什麼。 * 透過網路通訊設備溝通,只能讓B收到,且原封不動地==重建完整訊息==。 * Reproducing at one point either exactly or approximately a message selected at another point * (將某方的訊息原封不動或近似的重建在另一方) * 溝通元件:(單一語言) :::danger 1. 解碼`斷詞` * B收到訊息後,透過`動詞`進行解碼。 * Ex: A say "這真是我人生中最棒的事情" B 解碼 "這 == 最棒的事情(在我人生中)" 2. 語意`semantic`+推理 * 根據解碼出來的訊息,再做語意的推理。 * Ex: 根據過去的經驗,推測這句話所代表的涵義 (他很開心) ==若要讓電腦理解人類的語言,以中文來說,分成兩步驟: 第一步是`斷詞`、理解詞;第二步則是分析句子,包含語法及`語義`的自動解析。== ::: 3. 產生 * 產生想法,思考如何回覆。 * Ex: 思考如何回覆 (需要表示我們是夥伴) 4. 編碼 * 將想法透過編碼器轉成另一個語言,再回覆給對方。 * Ex: B say "我真為你開心" * 多語言溝通: * 講中文,但中間穿插英文。 1. 【解碼器】解碼 * (2套:中/英) 2. 【理解器】語意+推理 * (1套)某些時刻,可透過翻譯(Transfer Learning) * Ex: 溝通 => communication * 利用==字典==翻譯 * (2套)當中文裡有一些字,英文裡卻沒有的時候。反之亦然。 * Ex: assumption(不需要證明) vs. hypothesis(需要證明) * 不見得能用原來母語的語意+推理,可能需要再做==內建==。 3. 【產生器】產生 * (1套) 4. 【編碼器】編碼 * (2套:中/英) ```gherkin= # 這份筆記 說明:自然語言的"概念" # Next Lesson 如何"分析"自然語言? ``` --- * ##### tags: `自然語言` * [搞深度學習,香農的資訊理論須略知一二!](https://kknews.cc/zh-tw/science/qnk2rnr.html)