【生成式AI導論 2024】第5講：訓練不了人工智慧？你可以訓練你自己 (下) — 讓語言彼此合作，把一個人活成一個團隊

# 【生成式AI導論 2024】第5講：訓練不了人工智慧？你可以訓練你自己 (下) — 讓語言彼此合作，把一個人活成一個團隊 ## 模型之間可以合作嗎？（LLM Collaboration） ### 芙莉蓮的啟示：合作比單打獨鬥強 * 故事情節：芙莉蓮與徒弟費倫挑戰迷宮，對抗自己強大的複製體。 * 重點：再強的個體也會有破綻，合作可以克服個人極限。 * 對應語言模型：單一模型如 GPT-4 再強，也可能比不上多個模型合作。 --- ### 模型合作的動機 * 問題背景 * 各種語言模型能力、成本不同（如 GPT-3.5 vs GPT-4）。 * 動機：用便宜模型處理簡單任務、用強模型處理複雜任務，降低整體成本。 * 解法構想 * 訓練一個任務分配模型（dispatcher）來選擇適合的模型處理任務。 --- ### 模型之間如何討論？（Model Discussion） * Demo 展示 * 問題：「葬送的芙莉蓮」該如何翻譯成英文？ * 模型參與者：Claude 3 vs GPT-3.5 * 透過輪流回應彼此翻譯提案，最終收斂到「Flürien’s Redemption」作為共識。 * Prompt 技巧 * 必須明確告知模型「不需完全同意前一個模型的觀點」，否則討論會很快結束。 * 強迫模型「反對為了反對」也不好，適度鼓勵自主思考最有效。 --- ### 自我反省 vs 模型互相討論 | 方法 | 結果 | |--------------------|------------------------------------------------------------| | 自我反省（Self-reflection） | 比較少推翻自己先前答案（因為認同自己） | | 模型間討論（Inter-model debate） | 更容易推翻錯誤答案，激發新見解 --- ### 角色分工式的模型合作（Role-based LLM Cooperation） * 類比 RPG 勇者隊伍：法師、坦克、劍士、奶媽 → 各司其職。 * 在專案中可以讓模型扮演不同角色，如： * Project Manager * Engineer * Tester * 可搭配專長模型（如 Code Llama）或直接用 prompt 指定角色身份。 --- ### 語言模型組成的虛擬團隊 * 任務流程示意： * PM 分配任務 → Engineer 開發程式 → Tester 測試 → PM 收集結果做規劃 * 可使用開源專案如 MetaGPT、ChatDev 來實驗模擬這種團隊流程。 * 團隊優化：打考績 * 每次任務後，每個模型給其他模型打分。 * 表現差者淘汰，建立 Dynamic Agent Network。 --- ### 相關論文與資源 * [FrugalGPT: How to Efficiently Allocate Tasks to LLMs](https://arxiv.org/abs/2305.05176) * [Exchange of Thought: LLM Dialogue Mechanisms](https://arxiv.org/abs/2310.00365) * [Dynamic LLM Agent Network](https://arxiv.org/abs/2310.01980) * [Stanford Smallville Simulation](https://arxiv.org/abs/2304.03442)