# AI+NLP Giant? still a Baby? ###### tags: `20200829` 高宏宇 教授 國立成功大學 資訊工程系 ## AI-enhanced Natural Language Procressing Data processing 語言學 斷句、分析語意 早期 比對文字、搜尋引擎 現在Word2Vec, ELMo, BERT ect.都可以重新做 model building 例如 建立摘要 application ## Search vs Discover search -> 是data retrieval discover ->是一種data mining/text mining ## IBM debater 辯論機器人 要能夠辨認題目、辨認對方說的話 能夠總結資料、產生有邏輯、有目的的句子 然後再寫出來 ## Google Talk to Book 目前可以做到把電子化的書做搜尋 並且依據QA提出相關的書中的文字 ## 問題 ## contex ambiguity 文字有很多的模糊性(如果文字太短的話) ## WordtoVactor 透過word to vactor的方式或是embedding的方式,就可以讓文字跟文字之間的關係被找出來 ## 在醫學報告的應用 要判斷paper中的特定專業文字 ## Factor detecter 找出文字中的邏輯 判斷對或不對 訓練電腦理解人類的邏輯 ## short text matching 文字很少 最常見的就是客服機器人 FAQ 一般的作法事作關鍵字 例如 文章中性別歧視的問題 ## Generation & Summerization ## conclustion 大部分的NLP都還是要有前後文 大部分都沒有SOP 不要太迷信新的技術,有時候要回頭看舊的技術 要了解overfitting才知道怎樣才部會overfitting
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up