# 【生成式AI導論 2024】第5講:訓練不了人工智慧?你可以訓練你自己 (下) — 讓語言彼此合作,把一個人活成一個團隊 ## 模型之間可以合作嗎?(LLM Collaboration) ### 芙莉蓮的啟示:合作比單打獨鬥強 * 故事情節:芙莉蓮與徒弟費倫挑戰迷宮,對抗自己強大的複製體。 * 重點:再強的個體也會有破綻,合作可以克服個人極限。 * 對應語言模型:單一模型如 GPT-4 再強,也可能比不上多個模型合作。 --- ### 模型合作的動機 * 問題背景 * 各種語言模型能力、成本不同(如 GPT-3.5 vs GPT-4)。 * 動機:用便宜模型處理簡單任務、用強模型處理複雜任務,降低整體成本。 * 解法構想 * 訓練一個任務分配模型(dispatcher)來選擇適合的模型處理任務。 --- ### 模型之間如何討論?(Model Discussion) * Demo 展示 * 問題:「葬送的芙莉蓮」該如何翻譯成英文? * 模型參與者:Claude 3 vs GPT-3.5 * 透過輪流回應彼此翻譯提案,最終收斂到「Flürien’s Redemption」作為共識。 * Prompt 技巧 * 必須明確告知模型「不需完全同意前一個模型的觀點」,否則討論會很快結束。 * 強迫模型「反對為了反對」也不好,適度鼓勵自主思考最有效。 --- ### 自我反省 vs 模型互相討論 | 方法 | 結果 | |--------------------|------------------------------------------------------------| | 自我反省(Self-reflection) | 比較少推翻自己先前答案(因為認同自己) | | 模型間討論(Inter-model debate) | 更容易推翻錯誤答案,激發新見解 --- ### 角色分工式的模型合作(Role-based LLM Cooperation) * 類比 RPG 勇者隊伍:法師、坦克、劍士、奶媽 → 各司其職。 * 在專案中可以讓模型扮演不同角色,如: * Project Manager * Engineer * Tester * 可搭配專長模型(如 Code Llama)或直接用 prompt 指定角色身份。 --- ### 語言模型組成的虛擬團隊 * 任務流程示意: * PM 分配任務 → Engineer 開發程式 → Tester 測試 → PM 收集結果做規劃 * 可使用開源專案如 MetaGPT、ChatDev 來實驗模擬這種團隊流程。 * 團隊優化:打考績 * 每次任務後,每個模型給其他模型打分。 * 表現差者淘汰,建立 Dynamic Agent Network。 --- ### 相關論文與資源 * [FrugalGPT: How to Efficiently Allocate Tasks to LLMs](https://arxiv.org/abs/2305.05176) * [Exchange of Thought: LLM Dialogue Mechanisms](https://arxiv.org/abs/2310.00365) * [Dynamic LLM Agent Network](https://arxiv.org/abs/2310.01980) * [Stanford Smallville Simulation](https://arxiv.org/abs/2304.03442)