# Retrieval & Generation ## Week 20 ---- ## 前言 這是今天鐵人賽分享的內容 結合資訊檢索與 LLM 的技術 達到更精準的知識問答 ---- ## 生成式 IR 分成封閉式與開放式 ---- ## 封閉式 Close Domain 通常將資料全部訓練進模型裡面 只能回答該領域的問題 不好除錯 ---- ## 開放式 Open Domain 可以回答任何領域的問題 需要結合搜尋引擎 可解釋性佳 ---- ## Latex 論文問答機器人 在 ArXiv 上有很多論文的 Latex 文件 可以直接下載下來看 ---- ## 索引階段 Index Phase 將論文切成一個個 Chunks 取得各 Chunk 的 Embedding 將 Chunk 與 Embedding 存起來 ---- ## 查詢階段 Query Phase 將使用者的 Query 變成 Embedding 計算 Chunk Embedding 的相似度 取前五名放在 Prompt 裡面 與 Query 一同送入 ChatGPT 得到答案 ---- ## Demo! 可以參考 [GitHub](https://github.com/penut85420/LatexPaperQA)
{"image":"https://hackmd.io/_uploads/rkDqeInJp.png","slideOptions":"{\"transition\":\"slide\"}","title":"Week 20 - Retrieval & Generation","description":"地獄貓旅行團第 32 週心得分享","contributors":"[{\"id\":\"c7cbb212-2c41-4dfa-8d85-f8e7fa769bf1\",\"add\":587,\"del\":0}]"}
    258 views
   Owned this note