養龍蝦不用傾家蕩產：OpenClaw 模型選擇與成本控制實戰指南

# 養龍蝦不用傾家蕩產：OpenClaw 模型選擇與成本控制實戰指南 ![openclaw-lobster-cover](https://hackmd.io/_uploads/SJS4iTY_bl.jpg) 上個月我的 API 帳單跳出來的瞬間，我整個人是愣住的。不是那種「哦好像有點多」的驚訝，是那種「我是不是不小心把 key 洩漏了被人刷爆」的恐慌。然後我仔細看了一下用量明細——沒有，全部都是我自己用的。就是日常寫 code、debug、重構，正常的開發節奏。但一天下來，光 API 費用就逼近 10 美金。一個月三百美金，只為了讓 AI 幫我寫程式。這就是我開始認真研究 [OpenClaw](https://github.com/openclaw/openclaw) 模型選擇的起點。 ## 為什麼你需要在意 OpenClaw 用哪個模型先講個背景。OpenClaw 截至今天已經累積超過 [20 萬顆 GitHub stars](https://buttondown.com/openclaw-newsletter/archive/openclaw-newsletter-2026-02-18/)，是目前最熱門的開源 AI 助手專案。它最核心的價值很簡單：**你可以自己選模型**。 Claude Code 只能用 Anthropic 的 API，一天重度使用下來 [大概 3 到 7 美金](https://www.thecaio.ai/blog/claude-code-pricing-guide)，如果你是那種把 AI 當 pair programming partner 整天掛著的人，月底帳單輕鬆破百美金。而 OpenClaw 讓你接任何 LLM provider——從 Google 到 xAI 到 MiniMax，選擇權在你手上。但選擇多了反而更焦慮。到底哪個模型的 CP 值最高？哪個看起來便宜實際上是個坑？而且在你開始挑模型之前，有一件事必須先講清楚—— ## 先別急：OAuth 與 Google 服務的封號地雷這段我放在最前面講，因為比省錢更重要的是**不要把帳號搞丟**。 OpenClaw 社群裡三不五時就有人哀嚎帳號被封。原因通常集中在兩個地方： **Claude Code OAuth 轉接的風險。** 有些人想省事，透過 Claude Code 的 OAuth token 來讓 OpenClaw 存取 Anthropic API。這個操作在技術上可行，但 Anthropic 的 ToS 明確不允許第三方工具使用 OAuth token 做非官方用途。一旦被偵測到異常的 API 呼叫模式——比如 token 來自 Claude Code OAuth 但行為明顯是 agent 在跑——帳號可能直接被停權，連帶你的 Claude Pro/Max 訂閱都會受影響。 **Google 系模型的灰色地帶。** Gemini API 的免費額度和低價方案，Google 對於「自動化大量呼叫」的容忍度比你想像的低。特別是如果你透過 Google AI Studio 的 API key 來接 OpenClaw，跑起來一整天不停歇，Google 有可能判定你違反公平使用政策。輕則限速，重則直接停用你的 Google Cloud 帳號——這可不只是 Gemini API 的事，你的 Gmail、Google Drive、整個 Google 生態系都綁在上面。 **我的建議很簡單：用官方 API key，走正規付費管道，別貪小便宜。** MiniMax、xAI、Moonshot 這些獨立 provider 的 API 就是專門給開發者用的，不存在這種灰色地帶問題。你花的每一分錢都是明碼標價，不用提心吊膽哪天醒來發現帳號沒了。我花了兩週時間，把市面上五個主流模型都接上 OpenClaw 跑了一輪真實開發場景。以下是我的血淚報告。 ![openclaw-model-cost-compare](https://hackmd.io/_uploads/HknVs6K_bl.jpg) ## 五大模型實測成本：誰在燒你的錢先上結論表格，後面再逐一拆解。 | 模型 | Input 費用 ($/1M tokens) | Output 費用 ($/1M tokens) | 實測每日成本 | 體感評價 | |------|-------------------------|--------------------------|-------------|---------| | **MiniMax M2.5** | $0.30 | $1.20 | ~$0.50-1.50 | 省到哭，能力不打折 | | **Gemini 2.5 Flash** | $0.30 | $2.50 | ~$1.00-2.50 | 均衡之選，穩定可靠 | | **Grok 4.1 Fast** | $0.20 | $0.50 | ~$3.00-5.00 | 看似便宜，tool call 是坑 | | **Kimi K2.5** | $0.60 | $2.50 | ~$2.00-4.00 | thinking 模式吃 token | | **GPT-5.2** | $1.75 | $14.00 | ~$5.00-10.00+ | 品質頂尖，低頻使用 | 接下來一個一個講我踩過的坑。 ### GPT-5.2：品質無話說，但請低頻使用這裡要特別強調一點——**建議選 GPT-5.2 而不是 Codex 系列的 coder 模型**。為什麼？因為 Codex coder 模型雖然是專門為程式碼優化的，但它在 OpenClaw 這種 agentic 場景下的 tool calling 和多輪對話表現反而不如通用的 [GPT-5.2](https://platform.openai.com/docs/models/gpt-5.2)。GPT-5.2 作為 OpenAI 的旗艦模型，指令遵循能力更強，處理複雜 agent workflow 更穩定。定價是 $1.75/M input、$14.00/M output。沒錯，output 每百萬 token 要 14 美金——這是 MiniMax M2.5 的 **將近 12 倍**。 OpenClaw 的 agentic workflow 是高度迭代的。它不是問一個問題就結束，而是會不斷 tool call、讀檔案、修改、再驗證，一個任務跑下來可能經歷十幾輪 LLM 呼叫。每一輪都把之前的 context 全部送進去，token 用量像滾雪球一樣膨脹。更要命的是，GPT-5.2 有 Thinking 模式，內部推理 token 也是按 output 價格計費——你看不到這些 token，但帳單上看得到。我實測一個下午重構一個中等複雜度的 TypeScript 模組，GPT-5.2 吃掉了將近 8 美金。**一天正常開發下來，10 美金起跳。** 話說回來，GPT-5.2 不是不能用——關鍵在於**使用頻率**。如果你不是每天都掛著 OpenClaw 寫 code，而是一週只用個兩三次、每次處理一個特定的高難度任務，GPT-5.2 的品質確實是頂級的。它的推理深度、程式碼品質、對複雜需求的理解力都是目前最好的一檔。偶爾用一下，帳單不會太誇張。但如果你是那種整天開著 AI pair programming 的重度用戶？天天餵 GPT-5.2 就是在幫 OpenAI 燒錢。 **簡單記一個原則：低頻用 GPT-5.2 享受頂級品質，高頻日常開發用 M2.5 控制成本。** ### Grok 4.1 Fast：token 便宜但 tool call 要你命 [Grok 4.1 Fast](https://artificialanalysis.ai/models/grok-4-1-fast) 的 token 定價看起來超級甜——$0.20/M input、$0.50/M output，這不是白菜價嗎？ **才怪。** xAI 的 tool invocation 是另外收費的。每 1,000 次 tool call 收 $2.50 到 $5.00，取決於 tool 類型。而 OpenClaw 是什麼？是一個 **重度依賴 tool call 的 agent**。讀檔案是 tool call，寫檔案是 tool call，跑指令是 tool call，搜尋是 tool call。一個稍微複雜的任務跑下來，光 tool call 就可能幾百次。所以實際用下來，**一天大概 5 美金**，跟 token 價格給你的預期完全不同。這是我踩過最深的坑——看定價表以為撿到寶，結果帳單出來才知道自己是大怨種。 2M 的 context window 確實是業界最大，處理大型 codebase 很方便。但如果你的使用場景不需要一次塞這麼多 context，這個優勢就沒那麼關鍵了。 ### Kimi K2.5：兩輪深度對話 12 塊人民幣的真相 ![openclaw-bill-shock](https://hackmd.io/_uploads/SJmUsptdZg.jpg) Moonshot AI 的 [Kimi K2.5](https://openrouter.ai/moonshotai/kimi-k2.5) 定價是 $0.60/M input、$2.50/M output，比 MiniMax 貴一點但也不算離譜。問題出在它的 **thinking mode**。 K2.5 是一個 1 兆參數的 MoE 模型，原生支援 thinking 模式。當你用 OpenClaw 讓它處理複雜任務時，它會在回覆前先跑一大段內部推理，這些 thinking tokens 全部算在 output 裡面。一個需要深度分析的任務，thinking tokens 可能比實際回覆還多好幾倍。我做過一次測試：讓 K2.5 分析一個 React 元件的效能問題並提供重構方案。兩輪對話下來，output tokens 爆到 15 萬。算一下大概 12 塊人民幣。 **兩輪對話，12 塊。** K2.5 的能力毫無疑問是頂級的，[SWE-Bench 表現直追 Opus 級別](https://venturebeat.com/orchestration/moonshot-ai-debuts-kimi-k2-5-most-powerful-open-source-llm-beating-opus-4-5)。但如果你打算拿它當日常的 coding companion，荷包會哭。比較適合的用法是：平時用便宜模型處理日常任務，遇到真正棘手的架構問題時才切到 K2.5 放大招。 ### Gemini 2.5 Flash：什麼都不極端的平衡之選 Google 的 [Gemini 2.5 Flash](https://ai.google.dev/gemini-api/docs/pricing) 定價 $0.30/M input、$2.50/M output，1M token 的 context window。說實話，寫到 Gemini 我反而沒什麼戲劇性的故事可以講。它就是⋯⋯穩。token 價格合理，速度夠快，能力也到位。沒有 Grok 那種 tool call 的隱藏費用，也沒有 Kimi 那種 thinking token 的爆量問題。每日成本大概 1 到 2.5 美金，取決於你的使用強度。一個月下來 30 到 75 美金，對於專業開發者來說是可以接受的範圍。如果你懶得折騰、不想踩坑、就想要一個用起來不會太心痛的選項，Gemini 2.5 Flash 是安全牌。但安全牌不是最佳牌。 ### MiniMax M2.5：養龍蝦的終極答案終於講到主角了。 [MiniMax M2.5](https://platform.minimax.io/docs/pricing/overview) 的定價是 **$0.30/M input、$1.20/M output**。沒有隱藏費用，沒有 tool call 額外收費，就是這麼直白。讓我把這個數字放進脈絡裡：它的 output 費用是 Claude Opus 4.6 的 **1/21**，是 GPT-5.2 的 **1/12**，甚至比 Gemini 2.5 Flash 還便宜一半。但便宜不代表弱。MiniMax M2.5 在 [SWE-Bench Verified 拿到 80.2%](https://www.minimax.io/news/minimax-m25)，Multi-SWE-Bench 51.3% 排名第一。這是什麼概念？這是跟 Claude Opus 系列同一個級別的 coding 能力，但成本只有人家的零頭。我實測了一整天的正常開發——寫新功能、修 bug、重構、寫測試——總共花了不到 1.5 美金。 **一天 1.5 美金養一隻能力 Opus 級別的龍蝦。** 這就是為什麼我說 MiniMax M2.5 是養龍蝦的終極答案。 ## 怎麼設定 OpenClaw 使用 MiniMax M2.5 講了這麼多，來點實際的。根據 [OpenClaw 官方文件](https://docs.openclaw.ai/providers/minimax)，設定 MiniMax 只需要幾步： ```bash # 方法一：互動式設定（推薦） openclaw configure # 選擇 MiniMax 作為 provider # 輸入你的 MiniMax API key ``` 或者直接改設定檔： ```json { "provider": "minimax", "model": "minimax-m2.5", "apiKey": "${MINIMAX_API_KEY}" } ``` 如果你想要更快的回應速度，可以選 M2.5-Lightning 版本（100 tokens/s），但 output 費用會翻倍到 $2.40/M。我個人覺得標準版的 50 tokens/s 已經夠用了，省下來的錢更實在。也可以搭配 [Ollama 本地部署](https://ollama.com/library/minimax-m2.5) 做離線使用，但那是另一個話題了。 ## 場景化模型搭配：省錢的最高境界 ![openclaw-smart-lobster](https://hackmd.io/_uploads/H11Djpt_-x.jpg) 真正會養龍蝦的人，不會只用一個模型。OpenClaw 支援動態切換 provider，善用這個功能可以把成本壓到最低： | 使用場景 | 推薦模型 | 原因 | | ------------------- | ---------------- | --------------------- | | 日常高頻 coding / debug | MiniMax M2.5 | CP 值之王，整天開著也不心疼 | | 快速原型 / 簡單任務 | Gemini 2.5 Flash | 穩定快速，但注意 Google 帳號風險 | | 低頻精準任務 | GPT-5.2 | 偶爾用品質頂尖，天天用會破產 | | 大型 codebase 分析 | Grok 4.1 Fast | 2M context window 的優勢 | | 架構設計 / 困難問題 | Kimi K2.5 | thinking 模式的深度推理值得付費 | > **封號風險提醒：** 透過 Claude Code OAuth 間接存取或使用 Google 免費/低價額度大量跑 OpenClaw，都有帳號被停權的風險。建議一律使用獨立 API provider（MiniMax、xAI、Moonshot）的正規付費 key。我自己的日常配置是 **80% MiniMax M2.5 + 15% Gemini 2.5 Flash + 5% Kimi K2.5**。一個月下來大概 40-60 美金，比起純用 Claude Code API 的 100-200 美金，省了至少一半。 ## 幾個省錢的實戰技巧最後分享幾個我摸索出來的省錢心得： **善用 prompt caching。** 大部分 provider 都支援 prompt caching，重複的 system prompt 和 context 不需要每次都算錢。MiniMax 和 Grok 都有自動 caching 機制，但你的 system prompt 越穩定，cache 命中率越高。 **控制 context 長度。** OpenClaw 預設會把很多歷史訊息塞進 context，但你可以在設定裡調低 `maxContextTokens`。大部分日常任務根本不需要 100K 的 context，把它壓到 30-50K 可以顯著降低每次 API call 的成本。 **區分任務等級。** 不是每個任務都值得用最強的模型。寫一個簡單的 utility function，用 MiniMax M2.5 綽綽有餘。只有遇到跨模組的複雜重構或架構決策，才需要切到 K2.5 這種重砲。 **設定每日預算上限。** OpenClaw 支援設定 spending limit，建議設在 3-5 美金。超過就停下來，強迫自己用更高效的方式跟 AI 溝通，而不是無腦丟 context。 **遠離灰色操作。** 不要用 Claude Code OAuth token 轉接、不要拿 Google AI Studio 的免費額度當主力。省下來的那點錢，跟帳號被封的風險比起來根本不值得。用獨立 provider 的 API key 最安心——MiniMax 本身就夠便宜了，沒必要為了再省幾毛錢去冒險。 ## 養龍蝦的正確姿勢回到最開頭的問題——AI 輔助開發到底值不值得花錢？答案是：值得，但你得選對飼料。 OpenClaw 給了你選擇的自由，而 MiniMax M2.5 是目前這個時間點上，CP 值最高的選擇。Opus 級別的 coding 能力，1/20 的價格。一天不到 2 美金，就能有一個隨時待命的 AI pair programmer。養龍蝦不用傾家蕩產。選對模型，你的龍蝦一樣能長得又大又壯。 --- **延伸閱讀：** - [OpenClaw vs Claude Code 完整比較 - DataCamp](https://www.datacamp.com/blog/openclaw-vs-claude-code) - [MiniMax M2.5 官方介紹](https://www.minimax.io/news/minimax-m25) - [OpenClaw 模型設定指南](https://docs.openclaw.ai/providers/minimax) - [AI API 定價比較 2026 - IntuitionLabs](https://intuitionlabs.ai/articles/ai-api-pricing-comparison-grok-gemini-openai-claude) - [OpenClaw MiniMax 設定教學 - Boxmining](https://www.boxmining.com/openclaw-setup-guide-minimax/)