NLP 陪聊 AI 培育法 - 怡升 Eason

想要自己打造聊天機器人(Chatbot)來陪你聊天嗎?

在此演講中,講者將介紹最新最火的 AI NLP 技術原理與應用,並說明如何透過文字生成模型打造可以陪你聊天的 AI 聊天機器人。

講者也將分享在設計聊天機器人系統時的心路歷程,與從中發現的秘訣、巧思、與地雷。

希望聽完演講的你,可以對 NLP 相關知識有更多的了解,且能從講者的聊天機器人系統中得到啟發,設計出好用的服務。

目標聽眾

  1. 對 AI, NLP, Chatbot, Python 有興趣、想了解相關主題是在做什麼的高中、大學生。
  2. 想要尋找專題或 Side Project 靈感的研究生、大學生、工程師。
  3. 有在看動漫、漫畫、輕小說的人。

先備知識

本演講對不同的受眾準備不同的知識點與吸引元素。

舉例來說:原理說明時會提到 NLP 的相關技術,需要些許先備知識,如神經機率語言模型部分會講到條件機率、特徵向量機制會講到線性代數,不僅幫助專業人士理解原理,也有助資工相關科系學生明白該二科目的應用場景,以致於提高學習動機。

而設計巧思段落,則是給對 UX/UI 感興趣的聽眾聽的,內含心理學與認知科學的觀點。

對於不懂或不感興趣的人,較專業的段落都只有一小段,前後都是笑話與故事襯托,聽的一知半解也不影響後續的理解,甚至有助於提高未來學習相關知識的動機。因此聽此演講無須先備知識。

歡迎大家來到SITCON 2021 ヽ(✿゚▽゚)ノ
共筆入口:https://hackmd.io/@SITCON/2021
手機版請點選上方 按鈕展開議程列表。

sli.do NLP 陪聊 AI 培育法
#SITCON21-T02

投影片連結: https://tg.pe/x3PL
講者臉書(歡迎聯絡): https://www.facebook.com/EasonC13/
Demo 平台: https://chatbot.eason.tw

算機率的連結: https://demo.allennlp.org/next-token-lm

QNA (可寫在 Slido 也可寫在這

Q: 特徵向量機制能處理一字多義的情況嗎
A: 可以但不是用我剛剛說的方法,會用神經網路參考前後文去生成 Embedding,詳細可以看李鴻毅老師的影片,有一部在講這個(連結一時找不到,只記得他玩了尼祿的梗)

Q: 網路聊天時會時常省略標點符號,那在用網路上的資料集訓練出的模型是否能夠正確的應對網路上的這種聊天方式?
A: 可用資料增強,把原本有標點符號的資料,改成沒標點符號的來 Train,或者就拿網路聊天的資料來用

Q: 在模型架構中只有看到用 bert 增進 coherence, 但並沒有加強使用產生增進陪聊機器人所需的特質, 如 empathy, emotion expression 等
A: 特質部分是由 Flag 去做調整的

Q:但根據投影片,預測時也需輸入FLAG,我的理解是 FLAG 是預先設定的,這個陪聊機器人沒有能自己理解使用者言語所要表達的情緒的機能嗎?
A: 沒有,這要另外套一個情緒分類模型

Q: 在代名詞的識別上模型是否能夠正確的預測? 例如那個、這個、上一個這樣

A: 有專門的工具庫可以視覺化神經網路的注意力情況,可透過注意力強度,判斷模型是否有正確的偵測代名詞 https://github.com/jessevig/bertviz

Select a repo