Beyond Word Embedding : Keyword and BERT - JerryWu

歡迎來到 https://hackmd.io/@coscup/2020 共筆
點擊本頁上方的開始用 Markdown 一起寫筆記！
手機版請點選上方按鈕展開議程列表。

請從這裡開始

今天主要分享BERT的演進。

只用keyword判斷：會有誤差。只用句向量和詞向量時，句子和詞都會變成向量。認識字之後就可以直接回答，但是遇到不認識的字就無法回答。

BERT事先train超過3億筆data，比只用Keyword識別能力更強。

懷孕可以吃藥嗎？/生小孩可以吃藥嗎？
人類定義：懷孕=生小孩
Keyword：不認為懷孕=生小孩，無法分辨

Model Architecture - Encoder from Transformer

一句話：具有權重的向量，訓練模型有更強能力。
Next Sentence Prediction(NSP) 後期被BERT拿掉囉

Select a repo