# Retrieval & Generation
## Week 20
----
## 前言
這是今天鐵人賽分享的內容
結合資訊檢索與 LLM 的技術
達到更精準的知識問答
----
## 生成式 IR
分成封閉式與開放式
----
## 封閉式 Close Domain
通常將資料全部訓練進模型裡面
只能回答該領域的問題
不好除錯
----
## 開放式 Open Domain
可以回答任何領域的問題
需要結合搜尋引擎
可解釋性佳
----
## Latex 論文問答機器人
在 ArXiv 上有很多論文的 Latex 文件
可以直接下載下來看
----
## 索引階段 Index Phase
將論文切成一個個 Chunks
取得各 Chunk 的 Embedding
將 Chunk 與 Embedding 存起來
----
## 查詢階段 Query Phase
將使用者的 Query 變成 Embedding
計算 Chunk Embedding 的相似度
取前五名放在 Prompt 裡面
與 Query 一同送入 ChatGPT 得到答案
----
## Demo!
可以參考 [GitHub](https://github.com/penut85420/LatexPaperQA)
{"image":"https://hackmd.io/_uploads/rkDqeInJp.png","slideOptions":"{\"transition\":\"slide\"}","title":"Week 20 - Retrieval & Generation","description":"地獄貓旅行團第 32 週心得分享","contributors":"[{\"id\":\"c7cbb212-2c41-4dfa-8d85-f8e7fa769bf1\",\"add\":587,\"del\":0}]"}