---
# System prepended metadata

title: 2025 年 LLM Agent 開發框架完整指南：AutoGen、CrewAI、LangGraph 到底該選哪個？

---


# 2025 年 LLM Agent 開發框架完整指南：AutoGen、CrewAI、LangGraph 到底該選哪個？

![llm-agent-framework-cover](https://hackmd.io/_uploads/SyZiTkx4Wg.jpg)

三個月前，我在 Reddit 上看到一個帖子：「What's going on with AutoGen and AG2?」

帖子底下吵成一團。有人說 AutoGen 被微軟放棄了，有人說要趕快遷移到 AG2，還有人困惑地問：「我上週才開始學 AutoGen，現在該怎麼辦？」

說實話，那時候我也一頭霧水。

我正在評估要用哪個框架來建立公司的多代理人客服系統，結果發現這個領域在 2024 年底發生了翻天覆地的變化。AutoGen 分裂了、OpenAI 把 Swarm 升級成正式 SDK、Anthropic 推出了 MCP 協議還捐給了 Linux Foundation...

如果你也正在選擇 LLM Agent 框架，這篇文章應該能幫你省下不少冤枉路。

---

## 先搞清楚：什麼是 LLM Agent？

在深入比較框架之前，我們得先對齊一下概念。

你可以把 LLM Agent 想像成一個超級聰明的助理。這個助理不只會回答問題，還能主動規劃任務、使用各種工具、甚至自己判斷下一步該做什麼。

傳統的 LLM 應用是這樣的：你問一個問題，它給你一個答案。結束。

但 Agent 不一樣。你給它一個目標，比如「幫我研究這家公司然後寫一份報告」，它會：

1. 先規劃需要哪些步驟
2. 上網搜尋公司資訊
3. 讀取財報 PDF
4. 分析數據
5. 撰寫報告
6. 如果發現資訊不足，自己決定要不要再查更多

這種「自主決策 + 工具使用 + 多步驟執行」的能力，就是 Agent 的核心。

那什麼是「多代理人系統」呢？

想像你要做一個複雜的專案，不可能一個人包辦所有事。你會組建團隊：有人負責研究、有人負責寫程式、有人負責測試、有人負責專案管理。

多代理人系統就是這個概念。不同的 Agent 扮演不同角色，互相協作完成任務。一個 Agent 可能專門負責寫程式，另一個專門負責 code review，第三個負責執行測試...

聽起來很美好對吧？問題是，怎麼讓這些 Agent 順暢協作、不會互相打架、還能可靠地完成任務？

這就是為什麼我們需要框架。

---

## 2024 年底發生了什麼事？

如果你在 2024 年中開始學 AutoGen，恭喜你，你選了當時最熱門的框架。

微軟研究院開發的 AutoGen 是多代理人領域的先驅，GitHub 上有超過 4 萬顆星。文件完整、社群活躍、企業級支援。

然後，2024 年 11 月，事情變得複雜了。

### AutoGen 分裂事件

簡單來說，AutoGen 的核心貢獻者和微軟產生了分歧。一群人離開微軟，創建了新的組織 AG2AI，fork 了 AutoGen 並改名為 AG2。

現在的狀況是這樣的：

**AG2（社群版）**
- 由原始核心開發者維護
- 繼承了 `pyautogen` 和 `autogen` 套件名稱
- Apache 2.0 開源授權
- 保持向後相容，你的舊程式碼可以直接跑
- 持續在 0.3.x 版本上開發新功能

**Microsoft AutoGen 0.4（微軟版）**
- 微軟進行的完全重寫
- 新的 API 設計，不向後相容
- 可能會與 Semantic Kernel 整合
- 更注重企業級功能

怎麼說呢，這有點像 Node.js 和 io.js 當年的分裂，或是 MySQL 和 MariaDB。

對開發者來說，這意味著你需要做選擇：

- 如果你重視穩定性和向後相容 → 跟著 AG2
- 如果你已經深度使用微軟生態系統 → 考慮等 AutoGen 0.4 穩定
- 如果你還沒開始 → 可能值得考慮其他框架

這件事也讓我意識到，選擇開源框架時，專案的治理結構和社群健康度有多重要。

---

## 六大主流框架深度比較

好，現在來看看 2025 年你有哪些選擇。

### LangGraph：給需要精確控制的人

如果你用過 LangChain，對 LangGraph 應該不陌生。它是 LangChain 團隊開發的圖結構編排框架。

核心概念很直接：把工作流程想像成一張圖，節點是操作，邊是流程。你可以精確控制狀態、設定條件分支、處理重試邏輯。

```python
from langgraph.graph import StateGraph

# 定義狀態和節點
workflow = StateGraph(State)
workflow.add_node("research", research_agent)
workflow.add_node("write", writing_agent)
workflow.add_edge("research", "write")
```

**優點**：
- 精確的狀態控制
- 內建斷點和人工介入機制
- 平行執行支援
- 可視化工作流程

**缺點**：
- 學習曲線陡峭，你需要習慣「用圖思考」
- 對簡單任務來說可能過度設計

**適合場景**：複雜的多步驟工作流程、需要條件分支和重試邏輯、已經在用 LangChain 生態系統。

有個 Reddit 用戶說得很傳神：「LangGraph feels like writing a state machine with GPT agents.」

### CrewAI：角色扮演的直覺設計

CrewAI 的設計哲學完全不同。它把 Agent 想像成團隊成員，每個成員有自己的角色、目標和工具。

```python
from crewai import Agent, Task, Crew

researcher = Agent(
    role="Research Analyst",
    goal="Find comprehensive information",
    tools=[search_tool]
)

writer = Agent(
    role="Content Writer",
    goal="Create engaging articles"
)

crew = Crew(agents=[researcher, writer], tasks=[...])
crew.kickoff()
```

看到了嗎？這個 API 設計就是在模擬真實的團隊協作。

**優點**：
- API 直覺，學習曲線平緩
- 快速原型開發
- 角色定義清晰
- 文件和範例豐富

**缺點**：
- 當需求變複雜時，會撞到設計的天花板
- 客製化程度有限
- 有團隊反映，用了 6-12 個月後不得不改用其他框架

**適合場景**：快速原型、團隊協作模型契合業務邏輯、初學者入門。

說實話，如果你只是想快速驗證一個想法，CrewAI 可能是最快的選擇。但如果你知道這個專案會長期發展，可能要三思。

### AutoGen/AG2：對話式的靈活彈性

即使經歷了分裂，AutoGen 的核心設計理念依然有價值。它強調的是「對話式」的多代理人協作。

```python
from autogen import AssistantAgent, UserProxyAgent

assistant = AssistantAgent("assistant", llm_config=llm_config)
user_proxy = UserProxyAgent("user_proxy", code_execution_config={"work_dir": "coding"})

user_proxy.initiate_chat(assistant, message="Write a Python function to...")
```

Agent 之間透過對話來協作，就像真人在聊天室裡討論問題一樣。

**優點**：
- 極高的靈活性
- 強大的程式碼執行能力
- 適合複雜的對話式問題解決
- 企業級的錯誤處理

**缺點**：
- 目前的分裂狀況造成困惑
- 需要花時間理解該跟哪個版本

**適合場景**：需要複雜對話邏輯、程式碼生成和執行、企業環境。

### MetaGPT：模擬軟體公司

MetaGPT 的野心很大：它想模擬一整間軟體公司的運作方式。

你給它一個需求，它會自動分配角色：產品經理、架構師、工程師、測試人員... 然後這些「虛擬員工」會協作完成整個軟體開發流程。

```python
from metagpt.software_company import generate_repo

repo = generate_repo("Create a 2048 game")
print(repo)  # 輸出完整的專案結構和程式碼
```

這聽起來很科幻，但確實可以產出可運行的程式碼。

**優點**：
- 端到端的軟體開發自動化
- 結構化的角色分工
- 適合程式碼生成任務

**缺點**：
- 應用場景相對侷限
- 對非軟體開發任務支援有限

**適合場景**：自動化程式碼生成、軟體開發任務。

### OpenAI Agents SDK：官方的優雅設計

還記得 OpenAI 在 2024 年發布的 Swarm 嗎？那是一個實驗性的多代理人框架。

現在 Swarm 已經進化成正式的 OpenAI Agents SDK，成為生產就緒的解決方案。

```python
from openai import Agent, Swarm

agent = Agent(
    name="Assistant",
    instructions="You are a helpful assistant",
    tools=[...]
)

client = Swarm()
response = client.run(agent=agent, messages=[...])
```

Reddit 上有人這樣評價：「Agents SDK is designed in such an elegant way that it SEEMS lightweight and under-featured. But it's actually quite powerful.」

**優點**：
- API 設計優雅簡潔
- 與 OpenAI 生態系統無縫整合
- 生產就緒
- 快速部署

**缺點**：
- 綁定 OpenAI 模型
- 相對其他框架功能較少

**適合場景**：主要使用 OpenAI 模型、快速開發、偏好簡潔設計。

### Claude Agent SDK：安全優先的選擇

Anthropic 不只推出了 Claude Agent SDK，還創造了可能改變整個產業的 MCP 協議。

```python
from claude_agent_sdk import Agent

agent = Agent(
    model="claude-3-opus",
    tools=[...],  # MCP 原生支援
)
```

因為 MCP 是 Anthropic 開發的，Claude Agent SDK 自然有最好的 MCP 支援。

**優點**：
- MCP 協議原生支援
- 安全性設計優先
- Claude 模型的能力
- 簡潔的 API

**缺點**：
- 生態系統相對較新
- 綁定 Anthropic 模型

**適合場景**：重視安全性、使用 Anthropic 模型、需要 MCP 整合。

---

## MCP 協議：不得不提的遊戲規則改變者

講到這裡，我必須特別談談 Model Context Protocol（MCP）。

MCP 是 Anthropic 在 2024 年底推出的開放標準，目的是解決一個根本問題：如何讓 AI 模型安全、標準化地連接外部服務和資料？

你可以把 MCP 想像成 AI 世界的 USB-C。不管你是什麼設備，只要支援 USB-C，就能互通。同樣的，不管你用什麼 AI 模型或框架，只要支援 MCP，就能使用相同的工具和資料來源。

2025 年 12 月，Anthropic 把 MCP 捐贈給了 Linux Foundation 下的 Agentic AI Foundation。這意味著 MCP 已經不再是某一家公司的東西，而是整個產業的標準。

目前支援 MCP 的框架包括：
- Claude Agent SDK（原生支援）
- PydanticAI
- LangChain/LangGraph（透過整合）
- 越來越多的框架正在加入

為什麼這很重要？

因為你寫的 MCP 工具可以跨框架使用。今天你用 CrewAI 開發，明天想換成 LangGraph，那些 MCP 工具不用重寫。

這對整個生態系統的標準化有重大意義。

```mermaid
flowchart LR
    subgraph "AI 模型"
        A[Claude]
        B[GPT-4]
        C[其他 LLM]
    end

    subgraph "MCP 協議層"
        D[標準化介面]
    end

    subgraph "外部服務"
        E[資料庫]
        F[API]
        G[檔案系統]
        H[其他工具]
    end

    A --> D
    B --> D
    C --> D
    D --> E
    D --> F
    D --> G
    D --> H
```

---

## 如何選擇？一個實用的決策框架

說了這麼多，你可能還是想問：「那我到底該選哪個？」

這裡有一個決策流程供你參考：

```mermaid
flowchart TD
    A[開始選擇框架] --> B{主要需求是什麼？}

    B -->|快速原型驗證| C[CrewAI]
    B -->|複雜工作流程控制| D[LangGraph]
    B -->|對話式問題解決| E{生態系統偏好？}
    B -->|軟體開發自動化| F[MetaGPT]

    E -->|Microsoft 生態| G[AutoGen 0.4 / Semantic Kernel]
    E -->|社群版本 / 穩定性| H[AG2]
    E -->|OpenAI 生態| I[OpenAI Agents SDK]
    E -->|安全優先 / Anthropic| J[Claude Agent SDK]

    C --> K[開始開發]
    D --> K
    F --> K
    G --> K
    H --> K
    I --> K
    J --> K
```

更具體一點：

**選 CrewAI 如果**：
- 你需要快速驗證想法
- 團隊協作的比喻符合你的業務邏輯
- 你是 AI Agent 新手

**選 LangGraph 如果**：
- 你需要精確控制工作流程
- 有複雜的條件分支和重試邏輯
- 你已經在用 LangChain

**選 AG2 如果**：
- 你之前用 AutoGen，想要穩定的遷移路徑
- 需要複雜的對話式協作
- 重視社群治理

**選 Microsoft AutoGen 0.4 如果**：
- 你深度整合 Microsoft 生態系統
- 願意接受新 API 的學習成本
- 考慮未來與 Semantic Kernel 整合

**選 OpenAI Agents SDK 如果**：
- 你主要用 OpenAI 模型
- 偏好簡潔的 API 設計
- 需要快速部署到生產

**選 Claude Agent SDK 如果**：
- 安全性是首要考量
- 你想充分利用 MCP 協議
- 使用 Anthropic 模型

還有一個選項越來越多團隊在採用：**混合使用**。

比如用 LangGraph 做主要的工作流程編排，但在某些子任務中使用 CrewAI 的角色定義。或者用 OpenAI Agents SDK 做主要開發，但透過 MCP 連接各種工具。

---

## 生產環境的真實考量

選好框架只是開始。真正的挑戰是讓它在生產環境中穩定運行。

Anthropic 的工程團隊有一個很好的建議：**從簡單開始**。

很多模式其實只需要幾行程式碼就能實現，不一定需要複雜的框架。他們特別強調：「如果你用框架，確保你理解底層程式碼。錯誤的假設是客戶最常見的問題來源。」

這句話值得反覆咀嚼。

### 成本控制

LLM 調用不便宜。一個多代理人系統可能在一個任務中呼叫十幾次 LLM，費用很快就會累積。

建議：
- 設定預算上限和監控
- 考慮哪些步驟真的需要用大模型
- 快取可重複使用的結果
- 評估是否某些任務可以用小模型處理

### 延遲管理

多代理人系統的延遲是個大問題。Agent A 呼叫 LLM，等回應，然後 Agent B 再呼叫，再等回應... 串聯起來可能要等很久。

建議：
- 盡可能平行化
- 考慮使用串流
- 設定合理的 timeout
- 讓用戶知道系統在做什麼（進度指示）

### 可觀察性

當系統出問題時，你需要知道是哪個 Agent 在哪個步驟做了什麼決定。

推薦工具：
- Langfuse
- LangWatch
- Phoenix (Arize)
- Weights & Biases

### 安全性

Agent 可以執行程式碼、存取外部 API、處理敏感資料。這些能力也帶來風險。

注意事項：
- 沙盒化程式碼執行
- 限制 Agent 的權限範圍
- 提示注入防護
- 敏感資料處理策略

---

## 寫在最後

2025 年的 LLM Agent 框架領域，說實話，還是有點混亂。

AutoGen 分裂了、新框架不斷冒出來、MCP 正在成為標準、每隔幾週就有重大更新...

但混亂也意味著機會。這個領域還在快速演進，現在入場的人有機會影響未來的發展方向。

我的建議是：

1. **不要追逐最新最熱門的**。選一個適合你需求的框架，深入學習。
2. **理解底層原理**。框架只是工具，理解 Agent 的設計模式更重要。
3. **關注 MCP**。這可能是未來幾年最重要的標準化趨勢。
4. **從簡單開始**。不要一開始就設計複雜的多代理人系統。先用單一 Agent 驗證價值，再逐步擴展。
5. **投資可觀察性**。當系統變複雜時，你會慶幸自己早早建立了監控。

最後，如果你問我會選哪個？

我目前的專案選了 LangGraph 搭配 MCP。學習曲線確實陡峭，但精確的控制能力在生產環境中很有價值。

但這只是我的選擇。你的情況可能完全不同。

希望這篇文章能幫你在這個快速變化的領域中找到方向。如果你有任何問題或想分享你的經驗，歡迎交流。

---

## 參考資料

| 來源 | 標題 | |
|------|------|--------|
| [GitHub](https://github.com/ag2ai/ag2) | AG2 (formerly AutoGen) Repository | ⭐⭐⭐⭐⭐ |
| [Microsoft](https://microsoft.github.io/autogen/stable/) | AutoGen 0.4 Documentation | ⭐⭐⭐⭐⭐ |
| [Anthropic](https://www.anthropic.com/engineering/building-effective-agents) | Building Effective Agents | ⭐⭐⭐⭐⭐ |
| [Anthropic](https://www.anthropic.com/news/model-context-protocol) | Introducing the Model Context Protocol | ⭐⭐⭐⭐⭐ |
| [DataCamp](https://www.datacamp.com/tutorial/crewai-vs-langgraph-vs-autogen) | CrewAI vs LangGraph vs AutoGen | ⭐⭐⭐⭐ |
| [Datagrom](https://www.datagrom.com/data-science-machine-learning-ai-blog/langgraph-vs-autogen-vs-crewai-comparison-agentic-ai-frameworks) | Top 3 Trending Agentic AI Frameworks | ⭐⭐⭐⭐ |
| [ZenML](https://www.zenml.io/blog/llm-agents-in-production-architectures-challenges-and-best-practices) | LLM Agents in Production | ⭐⭐⭐⭐ |
| [ClickHouse](https://clickhouse.com/blog/how-to-build-ai-agents-mcp-12-frameworks) | How to build AI agents with MCP | ⭐⭐⭐⭐ |