or
or
By clicking below, you agree to our terms of service.
New to HackMD? Sign up
| Syntax | Example | Reference | |
|---|---|---|---|
| # Header | Header | 基本排版 | |
| - Unordered List |
|
||
| 1. Ordered List |
|
||
| - [ ] Todo List |
|
||
| > Blockquote | Blockquote |
||
| **Bold font** | Bold font | ||
| *Italics font* | Italics font | ||
| ~~Strikethrough~~ | |||
| 19^th^ | 19th | ||
| H~2~O | H2O | ||
| ++Inserted text++ | Inserted text | ||
| ==Marked text== | Marked text | ||
| [link text](https:// "title") | Link | ||
|  | Image | ||
| `Code` | Code |
在筆記中貼入程式碼 | |
| ```javascript var i = 0; ``` |
|
||
| :smile: | ![]() |
Emoji list | |
| {%youtube youtube_id %} | Externals | ||
| $L^aT_eX$ | LaTeX | ||
| :::info This is a alert area. ::: |
This is a alert area. |
On a scale of 0-10, how likely is it that you would recommend HackMD to your friends, family or business associates?
Please give us some advice and help us improve HackMD.
Do you want to remove this version name and description?
Syncing
xxxxxxxxxx-
Any changes
Be notified of any changes
-
Mention me
Be notified of mention me
-
Unsubscribe
Subscribe設計可靠的AI知識庫
Hi 我是June
今天聽完分享會得到的內容
什麼是RAG
RAG就是LLM可以參考的一本筆記本。當我們跟GPT或其他LLM交談時,提高回答的表現。
問題1:
筆記怎麼寫的
aka. RAG怎麼將知識擷取到知識庫
Embedding

圖片和表格會發生什麼事?
以Ollama和大多RAG工具來看,會直接被忽略掉

但並不是完全沒辦法處理,例如我們可以用多模態模型來處理圖片

一個常見迷思: RAG的嵌入也來自GPT4等大語言模型

實際上,我們只是需要內容與嵌入互相對應,所以用相對簡單的Bert等就可以了。但確實可以用GPT或其他LLM來進行,並獲得語意上更可靠的嵌入(但會貴的嚇人)。或者針對圖像型資料,才特別選擇用GPT4o來產生嵌入。
問題2
怎麼找到相關內容?
aka. RAG怎麼從知識庫中找到相關資料
這個問題有關檢索方法,也就是到底怎麼找到想要的資料
問題3
如何利用搜索到的相關內容?
aka. RAG怎麼幫助LLM回答問題
如何利用搜索到的相關內容 ?

把搜索到的內容整合到用戶訊息裡面,一起送給LLM做回答。
RAG的效果
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
RAG就是創建數位化的第二大腦
Review
如何設計謹慎的AI知識庫
Garbage in Garbage out
準則
最大挑戰
範疇與審核標準定義
挑戰1: 關鍵資訊萃取
混合結構和非結構化資料
用以產生結構化資料的AI - LayoutLM家族

使用LLM Agent從資料庫中存取準確無誤的資訊
LLM Agent還是LLM,但他透過跟運算環境連結,並多上了任務規劃和任務執行的能力。簡單的說,他現在不只能建議你做什麼,還能直接幫你做!
挑戰2: 圖文混合
如何解決圖文混合問題
挑戰3: 正規化回應
Layout Parser
挑戰4: 持續更新
對RAG知識庫來說,必要且最大的支出就是更新知識庫。特別是在專業領域,或需要語言工程師參與的場景,例如建立Question-Answer的對應,或是醫療或法律相關知識是涉及到案例或臨床資料。
如何將使用者的問題與回應收入知識庫
No-code 關鍵知識管理知識庫
謝謝聆聽!