# 養龍蝦不用傾家蕩產:OpenClaw 模型選擇與成本控制實戰指南 ![openclaw-lobster-cover](https://hackmd.io/_uploads/SJS4iTY_bl.jpg) 上個月我的 API 帳單跳出來的瞬間,我整個人是愣住的。 不是那種「哦好像有點多」的驚訝,是那種「我是不是不小心把 key 洩漏了被人刷爆」的恐慌。然後我仔細看了一下用量明細——沒有,全部都是我自己用的。就是日常寫 code、debug、重構,正常的開發節奏。但一天下來,光 API 費用就逼近 10 美金。 一個月三百美金,只為了讓 AI 幫我寫程式。 這就是我開始認真研究 [OpenClaw](https://github.com/openclaw/openclaw) 模型選擇的起點。 ## 為什麼你需要在意 OpenClaw 用哪個模型 先講個背景。OpenClaw 截至今天已經累積超過 [20 萬顆 GitHub stars](https://buttondown.com/openclaw-newsletter/archive/openclaw-newsletter-2026-02-18/),是目前最熱門的開源 AI 助手專案。它最核心的價值很簡單:**你可以自己選模型**。 Claude Code 只能用 Anthropic 的 API,一天重度使用下來 [大概 3 到 7 美金](https://www.thecaio.ai/blog/claude-code-pricing-guide),如果你是那種把 AI 當 pair programming partner 整天掛著的人,月底帳單輕鬆破百美金。而 OpenClaw 讓你接任何 LLM provider——從 Google 到 xAI 到 MiniMax,選擇權在你手上。 但選擇多了反而更焦慮。到底哪個模型的 CP 值最高?哪個看起來便宜實際上是個坑? 而且在你開始挑模型之前,有一件事必須先講清楚—— ## 先別急:OAuth 與 Google 服務的封號地雷 這段我放在最前面講,因為比省錢更重要的是**不要把帳號搞丟**。 OpenClaw 社群裡三不五時就有人哀嚎帳號被封。原因通常集中在兩個地方: **Claude Code OAuth 轉接的風險。** 有些人想省事,透過 Claude Code 的 OAuth token 來讓 OpenClaw 存取 Anthropic API。這個操作在技術上可行,但 Anthropic 的 ToS 明確不允許第三方工具使用 OAuth token 做非官方用途。一旦被偵測到異常的 API 呼叫模式——比如 token 來自 Claude Code OAuth 但行為明顯是 agent 在跑——帳號可能直接被停權,連帶你的 Claude Pro/Max 訂閱都會受影響。 **Google 系模型的灰色地帶。** Gemini API 的免費額度和低價方案,Google 對於「自動化大量呼叫」的容忍度比你想像的低。特別是如果你透過 Google AI Studio 的 API key 來接 OpenClaw,跑起來一整天不停歇,Google 有可能判定你違反公平使用政策。輕則限速,重則直接停用你的 Google Cloud 帳號——這可不只是 Gemini API 的事,你的 Gmail、Google Drive、整個 Google 生態系都綁在上面。 **我的建議很簡單:用官方 API key,走正規付費管道,別貪小便宜。** MiniMax、xAI、Moonshot 這些獨立 provider 的 API 就是專門給開發者用的,不存在這種灰色地帶問題。你花的每一分錢都是明碼標價,不用提心吊膽哪天醒來發現帳號沒了。 我花了兩週時間,把市面上五個主流模型都接上 OpenClaw 跑了一輪真實開發場景。以下是我的血淚報告。 ![openclaw-model-cost-compare](https://hackmd.io/_uploads/HknVs6K_bl.jpg) ## 五大模型實測成本:誰在燒你的錢 先上結論表格,後面再逐一拆解。 | 模型 | Input 費用 ($/1M tokens) | Output 費用 ($/1M tokens) | 實測每日成本 | 體感評價 | |------|-------------------------|--------------------------|-------------|---------| | **MiniMax M2.5** | $0.30 | $1.20 | ~$0.50-1.50 | 省到哭,能力不打折 | | **Gemini 2.5 Flash** | $0.30 | $2.50 | ~$1.00-2.50 | 均衡之選,穩定可靠 | | **Grok 4.1 Fast** | $0.20 | $0.50 | ~$3.00-5.00 | 看似便宜,tool call 是坑 | | **Kimi K2.5** | $0.60 | $2.50 | ~$2.00-4.00 | thinking 模式吃 token | | **GPT-5.2** | $1.75 | $14.00 | ~$5.00-10.00+ | 品質頂尖,低頻使用 | 接下來一個一個講我踩過的坑。 ### GPT-5.2:品質無話說,但請低頻使用 這裡要特別強調一點——**建議選 GPT-5.2 而不是 Codex 系列的 coder 模型**。為什麼?因為 Codex coder 模型雖然是專門為程式碼優化的,但它在 OpenClaw 這種 agentic 場景下的 tool calling 和多輪對話表現反而不如通用的 [GPT-5.2](https://platform.openai.com/docs/models/gpt-5.2)。GPT-5.2 作為 OpenAI 的旗艦模型,指令遵循能力更強,處理複雜 agent workflow 更穩定。 定價是 $1.75/M input、$14.00/M output。沒錯,output 每百萬 token 要 14 美金——這是 MiniMax M2.5 的 **將近 12 倍**。 OpenClaw 的 agentic workflow 是高度迭代的。它不是問一個問題就結束,而是會不斷 tool call、讀檔案、修改、再驗證,一個任務跑下來可能經歷十幾輪 LLM 呼叫。每一輪都把之前的 context 全部送進去,token 用量像滾雪球一樣膨脹。更要命的是,GPT-5.2 有 Thinking 模式,內部推理 token 也是按 output 價格計費——你看不到這些 token,但帳單上看得到。 我實測一個下午重構一個中等複雜度的 TypeScript 模組,GPT-5.2 吃掉了將近 8 美金。**一天正常開發下來,10 美金起跳。** 話說回來,GPT-5.2 不是不能用——關鍵在於**使用頻率**。如果你不是每天都掛著 OpenClaw 寫 code,而是一週只用個兩三次、每次處理一個特定的高難度任務,GPT-5.2 的品質確實是頂級的。它的推理深度、程式碼品質、對複雜需求的理解力都是目前最好的一檔。偶爾用一下,帳單不會太誇張。但如果你是那種整天開著 AI pair programming 的重度用戶?天天餵 GPT-5.2 就是在幫 OpenAI 燒錢。 **簡單記一個原則:低頻用 GPT-5.2 享受頂級品質,高頻日常開發用 M2.5 控制成本。** ### Grok 4.1 Fast:token 便宜但 tool call 要你命 [Grok 4.1 Fast](https://artificialanalysis.ai/models/grok-4-1-fast) 的 token 定價看起來超級甜——$0.20/M input、$0.50/M output,這不是白菜價嗎? **才怪。** xAI 的 tool invocation 是另外收費的。每 1,000 次 tool call 收 $2.50 到 $5.00,取決於 tool 類型。而 OpenClaw 是什麼?是一個 **重度依賴 tool call 的 agent**。讀檔案是 tool call,寫檔案是 tool call,跑指令是 tool call,搜尋是 tool call。一個稍微複雜的任務跑下來,光 tool call 就可能幾百次。 所以實際用下來,**一天大概 5 美金**,跟 token 價格給你的預期完全不同。這是我踩過最深的坑——看定價表以為撿到寶,結果帳單出來才知道自己是大怨種。 2M 的 context window 確實是業界最大,處理大型 codebase 很方便。但如果你的使用場景不需要一次塞這麼多 context,這個優勢就沒那麼關鍵了。 ### Kimi K2.5:兩輪深度對話 12 塊人民幣的真相 ![openclaw-bill-shock](https://hackmd.io/_uploads/SJmUsptdZg.jpg) Moonshot AI 的 [Kimi K2.5](https://openrouter.ai/moonshotai/kimi-k2.5) 定價是 $0.60/M input、$2.50/M output,比 MiniMax 貴一點但也不算離譜。問題出在它的 **thinking mode**。 K2.5 是一個 1 兆參數的 MoE 模型,原生支援 thinking 模式。當你用 OpenClaw 讓它處理複雜任務時,它會在回覆前先跑一大段內部推理,這些 thinking tokens 全部算在 output 裡面。一個需要深度分析的任務,thinking tokens 可能比實際回覆還多好幾倍。 我做過一次測試:讓 K2.5 分析一個 React 元件的效能問題並提供重構方案。兩輪對話下來,output tokens 爆到 15 萬。算一下大概 12 塊人民幣。 **兩輪對話,12 塊。** K2.5 的能力毫無疑問是頂級的,[SWE-Bench 表現直追 Opus 級別](https://venturebeat.com/orchestration/moonshot-ai-debuts-kimi-k2-5-most-powerful-open-source-llm-beating-opus-4-5)。但如果你打算拿它當日常的 coding companion,荷包會哭。 比較適合的用法是:平時用便宜模型處理日常任務,遇到真正棘手的架構問題時才切到 K2.5 放大招。 ### Gemini 2.5 Flash:什麼都不極端的平衡之選 Google 的 [Gemini 2.5 Flash](https://ai.google.dev/gemini-api/docs/pricing) 定價 $0.30/M input、$2.50/M output,1M token 的 context window。 說實話,寫到 Gemini 我反而沒什麼戲劇性的故事可以講。它就是⋯⋯穩。token 價格合理,速度夠快,能力也到位。沒有 Grok 那種 tool call 的隱藏費用,也沒有 Kimi 那種 thinking token 的爆量問題。 每日成本大概 1 到 2.5 美金,取決於你的使用強度。一個月下來 30 到 75 美金,對於專業開發者來說是可以接受的範圍。 如果你懶得折騰、不想踩坑、就想要一個用起來不會太心痛的選項,Gemini 2.5 Flash 是安全牌。 但安全牌不是最佳牌。 ### MiniMax M2.5:養龍蝦的終極答案 終於講到主角了。 [MiniMax M2.5](https://platform.minimax.io/docs/pricing/overview) 的定價是 **$0.30/M input、$1.20/M output**。沒有隱藏費用,沒有 tool call 額外收費,就是這麼直白。 讓我把這個數字放進脈絡裡:它的 output 費用是 Claude Opus 4.6 的 **1/21**,是 GPT-5.2 的 **1/12**,甚至比 Gemini 2.5 Flash 還便宜一半。 但便宜不代表弱。MiniMax M2.5 在 [SWE-Bench Verified 拿到 80.2%](https://www.minimax.io/news/minimax-m25),Multi-SWE-Bench 51.3% 排名第一。這是什麼概念?這是跟 Claude Opus 系列同一個級別的 coding 能力,但成本只有人家的零頭。 我實測了一整天的正常開發——寫新功能、修 bug、重構、寫測試——總共花了不到 1.5 美金。 **一天 1.5 美金養一隻能力 Opus 級別的龍蝦。** 這就是為什麼我說 MiniMax M2.5 是養龍蝦的終極答案。 ## 怎麼設定 OpenClaw 使用 MiniMax M2.5 講了這麼多,來點實際的。根據 [OpenClaw 官方文件](https://docs.openclaw.ai/providers/minimax),設定 MiniMax 只需要幾步: ```bash # 方法一:互動式設定(推薦) openclaw configure # 選擇 MiniMax 作為 provider # 輸入你的 MiniMax API key ``` 或者直接改設定檔: ```json { "provider": "minimax", "model": "minimax-m2.5", "apiKey": "${MINIMAX_API_KEY}" } ``` 如果你想要更快的回應速度,可以選 M2.5-Lightning 版本(100 tokens/s),但 output 費用會翻倍到 $2.40/M。我個人覺得標準版的 50 tokens/s 已經夠用了,省下來的錢更實在。 也可以搭配 [Ollama 本地部署](https://ollama.com/library/minimax-m2.5) 做離線使用,但那是另一個話題了。 ## 場景化模型搭配:省錢的最高境界 ![openclaw-smart-lobster](https://hackmd.io/_uploads/H11Djpt_-x.jpg) 真正會養龍蝦的人,不會只用一個模型。OpenClaw 支援動態切換 provider,善用這個功能可以把成本壓到最低: | 使用場景 | 推薦模型 | 原因 | | ------------------- | ---------------- | --------------------- | | 日常高頻 coding / debug | MiniMax M2.5 | CP 值之王,整天開著也不心疼 | | 快速原型 / 簡單任務 | Gemini 2.5 Flash | 穩定快速,但注意 Google 帳號風險 | | 低頻精準任務 | GPT-5.2 | 偶爾用品質頂尖,天天用會破產 | | 大型 codebase 分析 | Grok 4.1 Fast | 2M context window 的優勢 | | 架構設計 / 困難問題 | Kimi K2.5 | thinking 模式的深度推理值得付費 | > **封號風險提醒:** 透過 Claude Code OAuth 間接存取或使用 Google 免費/低價額度大量跑 OpenClaw,都有帳號被停權的風險。建議一律使用獨立 API provider(MiniMax、xAI、Moonshot)的正規付費 key。 我自己的日常配置是 **80% MiniMax M2.5 + 15% Gemini 2.5 Flash + 5% Kimi K2.5**。一個月下來大概 40-60 美金,比起純用 Claude Code API 的 100-200 美金,省了至少一半。 ## 幾個省錢的實戰技巧 最後分享幾個我摸索出來的省錢心得: **善用 prompt caching。** 大部分 provider 都支援 prompt caching,重複的 system prompt 和 context 不需要每次都算錢。MiniMax 和 Grok 都有自動 caching 機制,但你的 system prompt 越穩定,cache 命中率越高。 **控制 context 長度。** OpenClaw 預設會把很多歷史訊息塞進 context,但你可以在設定裡調低 `maxContextTokens`。大部分日常任務根本不需要 100K 的 context,把它壓到 30-50K 可以顯著降低每次 API call 的成本。 **區分任務等級。** 不是每個任務都值得用最強的模型。寫一個簡單的 utility function,用 MiniMax M2.5 綽綽有餘。只有遇到跨模組的複雜重構或架構決策,才需要切到 K2.5 這種重砲。 **設定每日預算上限。** OpenClaw 支援設定 spending limit,建議設在 3-5 美金。超過就停下來,強迫自己用更高效的方式跟 AI 溝通,而不是無腦丟 context。 **遠離灰色操作。** 不要用 Claude Code OAuth token 轉接、不要拿 Google AI Studio 的免費額度當主力。省下來的那點錢,跟帳號被封的風險比起來根本不值得。用獨立 provider 的 API key 最安心——MiniMax 本身就夠便宜了,沒必要為了再省幾毛錢去冒險。 ## 養龍蝦的正確姿勢 回到最開頭的問題——AI 輔助開發到底值不值得花錢? 答案是:值得,但你得選對飼料。 OpenClaw 給了你選擇的自由,而 MiniMax M2.5 是目前這個時間點上,CP 值最高的選擇。Opus 級別的 coding 能力,1/20 的價格。一天不到 2 美金,就能有一個隨時待命的 AI pair programmer。 養龍蝦不用傾家蕩產。選對模型,你的龍蝦一樣能長得又大又壯。 --- **延伸閱讀:** - [OpenClaw vs Claude Code 完整比較 - DataCamp](https://www.datacamp.com/blog/openclaw-vs-claude-code) - [MiniMax M2.5 官方介紹](https://www.minimax.io/news/minimax-m25) - [OpenClaw 模型設定指南](https://docs.openclaw.ai/providers/minimax) - [AI API 定價比較 2026 - IntuitionLabs](https://intuitionlabs.ai/articles/ai-api-pricing-comparison-grok-gemini-openai-claude) - [OpenClaw MiniMax 設定教學 - Boxmining](https://www.boxmining.com/openclaw-setup-guide-minimax/)