Dylan Patel：AI tokens 的供需失衡與 SemiAnalysis 的年化 700 萬支出

# Dylan Patel：AI tokens 的供需失衡與 SemiAnalysis 的年化 700 萬支出 > 原始影片：[The Supply and Demand of AI Tokens | Dylan Patel Interview](https://www.youtube.com/watch?v=LF3aUIM57uw) | Invest Like The Best | 2026-04-23 ## 導言 Dylan Patel 是 SemiAnalysis 的創辦人，這家半導體與 AI 基礎設施分析公司在業界公認是第一手情報來源。SemiAnalysis 自己本身，就是這場 AI 熱潮最直接的寫照：他們的 token 支出從去年的數萬美元，飆到今年年化 700 萬美元，還在持續加速。他在訪談裡給出一個重要診斷：AI tokens 的供需失衡不是景氣循環，而是結構性產能瓶頸。需求端企業對 tokens 的消耗難以預測地飆升，供給端 GPU、記憶體、先進封裝、電力基礎設施全都嚴重短缺，這種狀態預計會撐到 2028 年甚至更久。以下整理 Dylan 對 AI 供需動態、模型能力、供應鏈瓶頸，以及 token 採用策略的看法。 ## SemiAnalysis 的 token 支出爆炸：從 500 萬到 700 萬只隔一週「去年我們自認為是 heavy user，所有人都用 ChatGPT，所有人都用雲端，每個人想要什麼訂閱服務我都提供，那時候公司花費大概在數萬美元等級。今年支出直接沖天，從 12 月底 Opus 4 發布開始就不斷飆升。」 Dylan 透露，SemiAnalysis 的 Anthropic 企業合約已達到年化 700 萬美元，而公司薪資費用大約 2,500 萬美元。Claude Code 支出已超過薪資的 25%，按這個速度到年底會超過 100%。真正驚人的是增速。訪談中 Dylan 提到：「上週跟你聊的時候是 500 萬，現在已經是 700 萬。」一週 200 萬美元的 annual run rate 增量。驅動這個增量的，是公司內部從非技術人員到工程師全面擁抱 AI 的過程。他提到一位同事 Doug 是關鍵角色，在公司內推動非技術人員用 AI 寫程式碼，讓整間公司逐步轉型。「工程師本來就會用，但 1 月開始支出開始出現拐點，一路飆升。」 ## 從「執行困難」到「想法廉價」：商業邏輯翻轉 Dylan 的核心論點是商業邏輯的倒轉：「過去，執行是非常困難的，而想法很昂貴。現在，想法便宜且充沛，執行非常容易。所以真正值得做的，只有那些能證明值得在超便宜的執行成本上花費的好想法。」後果延伸出兩件事：過濾想法成為新的稀缺能力；速度成為生死線。不採用 AI 的公司會被採用 AI 的競爭對手碾壓。他分享了兩個內部案例。第一個：SemiAnalysis 在 Oregon 有個 reverse engineering lab，配備高階電子顯微鏡分析晶片架構與材料，過去非常耗時。團隊裡一位 Intel 背景的同事，用幾千美元的 Claude Code tokens，做出一個 GPU 加速的應用程式，能分析晶片圖片、標示各區域材料（銅、鉭、鍺、鈷），並對整個晶片堆疊跑有限元素分析。「他說過去這是整個團隊的工作，需要漫長的時間建立和維護。現在，幾千美元就能做到。」第二個案例是 Malcolm，曾任職於一家大銀行的經濟學家。他用 AI 串接所有資料（Fed 數據、就業報告等）跑經濟影響回歸分析，並對 BLS（美國勞工統計局）的 2,000 項任務逐一評估哪些現在可以被 AI 完成。「目前大約 3% 的任務可以透過 AI 完成。他創造了這個指標，並稱之為『Phantom GDP』——隨著 AI 執行這些任務，成本暴跌，GDP 在理論上反而會萎縮。」案例的驚人之處：「這一切都是他一個人做的。放到以前，整個 200 人經濟學團隊需要一年的時間才能完成。」 ## Anthropic 的 72% 毛利率與需求嚴重超載 Anthropic 的營收從 90 億飆到 350-400 億美元，但算力並沒有同步成長。Dylan 的測算：就算所有增量算力全部用於 inference，Anthropic 的毛利率下限是 72%。「年初有文件洩露，顯示他們的毛利率約在 30% 多。但現在需求高到什麼程度？他們能夠收緊使用限制、rate limits，所有這些措施。」關鍵在於：「token 最終是極度稀缺的。無論是誰付得起錢，Anthropic 的問題是——token 需求遠超供給。企業必須擁有 Anthropic 的企業合約，拿到 rate limit increase，否則就拿不到 token。」「人們願意支付 400 億 ARR 的 tokens，但這些 tokens 創造的價值遠超 400 億美元。不同的商業模式從每個 token 獲得的價值不同，但當模型越來越聰明，真正重要的就是：獲得最聰明的 tokens 並有效利用它們。」 ## Opus 4.7 與 Mythos：從 L4 到 L6 工程師的能力跳躍訪談錄製時 Opus 4.7 剛發布。Dylan 講了一段 Opus 4 發布時的場景：「我和朋友 Leopold 跪在 Anthropic 聯合創辦人面前求 Mythos 的 access。我們知道它存在，但只能假裝不知道。」 Anthropic 2025 年的目標是讓模型達到 L4 軟體工程師的水準，Opus 4 基本上做到了。但 Mythos 是 L6——「L4 是菜鳥，L6 是經驗豐富的資深工程師。Anthropic 說這個模型 2 月就內部可用了。也就是說，兩個月內他們從 L4 到 L6。」 Mythos 的定價是 Opus 4.7 的 5 到 10 倍，但效率高到大多數任務反而更便宜：「Mythos 每個 token 更聰明，但完成任務所需的 token 數量大幅減少，所以實際成本反而更低。」 Dylan 直言：「看著 benchmark，Mythos 可能是 2 年來最大的模型能力跳躍。這是他們不想發布的原因——他們擔心對世界的影響。他們選擇性地發布給網路安全公司，且定價昂貴。他們在 model card 裡明確說了：我們刻意讓它在網路安全方面表現較差。」對投資人的意義很直接：誰有管道存取最新模型，誰就能碾壓競爭對手。 ## 「軟體奇點」之後：機器人的下一步對於 AI 的下一步，Dylan 提出「Software Only Singularity」的概念：「軟體領域已經達到奇點，但實體世界呢？世界上絕大部分仍是物理的。當軟體變得超級容易，什麼讓機器人很難？就是 programming 微控制器、致動器、控制所有這些東西。」「現在模型在學習上其實非常沒效率。我們能餵給它們海量資料，讓它們在某些方面超越人類。但機器人的 VLA（Vision Language Action）模型在資料上沒效率，我們無法快速擴展它們的資料。」關鍵突破是樣本效率（sample efficiency）。人類靠少數例子就能學習，機器人模型也會朝這個方向演進。「軟體奇點之後，執行變得超便宜，任何人都能開始建立這些東西。我認為在接下來 6 到 18 個月，我們會開始看到機器人的真正突破——few-shot learning。有一個預訓練的機器人模型，你給它展示幾個例子，它就能學會。」結果就是：「物理商品的巨大加速和通縮效應，token 需求將持續狂熱。」 ## 供給側瓶頸：記憶體、TSMC 與供應鏈的長期短缺供給端是 Dylan 的專場。 ### GPU 生命週期大幅延長「有人說 GPU 的完整生命不到 5 年。完全是胡說。現在有叢集在續約 3、4 年的舊 Hopper 叢集，準備再用 3 到 4 年。A100 叢集也在續約。生命週期顯然不是 5 年，可能甚至是 7、8 年。」實質影響：「一個叢集的毛利率不是 35%，而是更高。雲端層的毛利率在擴張，硬體層也超級健康。」 ### 記憶體的產能剛性「記憶體的產能每年只能成長低雙位數百分比（約 20-30%）。NAND 更少，DRAM 好一點。2025 年底的強勁需求信號出現後，記憶體公司立即開始反應，但真正的增量供應要等到 2028 年，最快也是 2027 年底。」因此價格會繼續漲：「記憶體價格已經飆漲，而且會繼續翻倍、再翻倍。DRAM 起碼會從現在的位置再漲 2 到 3 倍，因為需求信號太強，必須透過更高定價來造成需求破壞。」 ### TSMC 的 capex 暴增「TSMC 今年說 capex 是 560 億美元。我們從 1 月以來追蹤到 574 億美元。他們可能還會稍微增加。但人們沒注意的是：三年後 TSMC 會在 capex 上花費 1,000 億美元。可能 2028 年就會達到這個數字。這個數字對下游供應鏈意味著什麼？Lam Research、Applied Materials、ASML，以及更下游的 MKSI 等公司，都會感受到巨大的連鎖效應。」 ### 被忽視的 CPU 需求「每個新一代 AI rack 有 120 個 FPGA。還有所有這些 reinforcement learning 環境，以及我們所有人產生的大量程式碼——現在都跑在 Vercel 實例、AWS 或某個雲端上。這些統統需要 CPU。所以 CPU 也是完全賣光，需求在暴漲。」 CPU 需求暴漲有兩個來源。一是 Reinforcement Learning 環境——模型需要在一個環境中嘗試各種做法，由環境給出評分反饋再迭代。「這些環境可以很簡單，也可以非常複雜——比如打開一個 Siemens 的物理模擬、編輯一個 CAD 模型。這些環境都跑在 CPU 上，不是 GPU。」二是部署環節，模型產出的程式碼和有用輸出最終都跑在 CPU 上，不是直接從 GPU 送到人類大腦。 ## 供給為什麼這麼難快速反應「供給鏈通常反應很快。但這次的獨特之處在於：我們現在的供給鏈比以前任何時候都更複雜，我們建造的東西比以前任何時候都更複雜，所以 lead time 比以前更長。」「記憶體只是其中一個例子。即使記憶體公司想建多快就建多快，真正的增量供應也要等到 2028 年。這是非常獨特的情況。」 ## Anthropic 與 OpenAI 的算力戰略分歧 Dylan 也分析了 Anthropic 與 OpenAI 的差異：「Anthropic 的算力有上限，生長速度有限。回想起來，Anthropic 的 Dario 以前嘲笑 OpenAI 在算力上太激進，說 Anthropic 更保守。現在 Anthropic 後悔了——『我們應該有更多算力的。』」「OpenAI 方面，他們從 Oracle、Coreweave、SoftBank、Microsoft 拿了大量算力，加上 AMD 的 Tranium。現在他們燒錢的狀況良好，帳單付得出來。但他們也需要更多。」投資啟示：「Anthropic 現在可能毛利率 70%+，但如果 OpenAI 達到同樣的能力水準，他們可能只收 50% 毛利率，但仍然拿走所有增量需求。他們的算力也不足以服務所有用戶。所以 Tier 2 的實驗室也會賣光，Tier 3 可能也接近。」 ## 誰能負擔得起算力的悖論 Dylan 點出一個讓人不安的趨勢：「模型會越來越少地廣泛部署。Anthropic 不會發布 Mythos 給大眾。他們只發布給特定網路安全公司。這種趨勢會持續。」「模型會變得更貴，誰來支付萬億美元的基礎設施？是有錢的人、能用 AI 建造有用東西的人。你不希望別人蒸餾你的模型，所以你不會廣泛發布。你只會發布給越來越少的客戶。」「假設有一天，頂級銀行有 Mythos access，只用於網路安全。但未來某個時候，也許因為你有 Anthropic 企業合約，而且 Anthropic 的人喜歡你，他們願意給你稍微早一點的 access 或稍微高一點的 rate limit。而你的競爭對手沒有，你就碾壓了他們。」 ## Phantom GDP：測量不了的價值創造 Dylan 指出 AI 經濟分析中最難的地方：「很難的部分在於 token 經濟學。我們對運行基礎設施的成本、token 成本、模型成本、這些實驗室的毛利率有很好的掌握，但使用和採用是最難建模的部分。」「1 月時我們對 2 月有瘋狂的預測，結果 Anthropic 遠超。2 月時我們對 3 月有瘋狂假設，又遠超。大家都看到 100 億這個數字，問『他們怎麼增加了 100 億營收？誰在用這些 tokens？他們用它們在建造什麼？更重要的是，這些 tokens 建造出來的東西如何擴散到經濟中？如何衡量創造的價值？』」「GDP 統計根本無法捕捉這些。我用 tokens 創造的所有價值都轉化成了更好的資訊，我用比別人過去出售資訊更低的價格出售這些資訊，這些資訊現在正在滲透整個經濟，讓人們做出更好的投資決策或更好的商業決策。這種價值如何衡量？」「如果有人問 Dylan Patel 創造了多少 GDP？數字很小。但我相信創造的價值遠超這個。這就是 Phantom GDP 的謎題。」 ## 三個月後的世界：對 AI 產業的預測訪談尾聲 Dylan 預測了三個月後（訪談於 2026 年 4 月錄製）可能發生的事：「大規模抗議，反對 Anthropic 和 OpenAI。」「人們討厭 AI。AI 比 ICE、政治人物更不受歡迎。隨著 Anthropic 收入暴增，這將開始造成下游的商業變化。人們會越來越害怕 AI，開始把自己所有的問題——這些長期根深蒂固的全球性問題——都怪到 AI 頭上。」「你看看新聞文章下面的留言。Sam Altman 的房子兩週內被扔了兩次燃燒彈，留言區的人們在歡呼。這只是開始。」 ## 對 AI 產業的公關建議 Dylan 給 OpenAI 和 Anthropic 的 CEO 的建議，聽起來很直接：第一，Sam Altman 和 Dario 必須停止接受訪談。「他們太沒有魅力了。每次受訪，一般民眾只會更討厭他們。Sam 上 Tucker Carlson 可能讓所有共和黨人討厭 OpenAI。Dario 也是，完全沒有魅力。」第二，開始展示 AI 能帶來的好事。讓普通人看到 AI 能做什麼好事。第三，停止不斷談論能力將如何改變世界。「人們對能力感到恐懼，是因為他們不知道如何使用它，也沒有任何連結。普通人不知道 Anthropic 的員工是誰，不知道 OpenAI 的員工是誰，不知道這些公司在追求什麼目標。他們只看到這 5,000 人的公司要改變世界、自動化所有工作、摧毀社會。資助建設所有這些資料中心和發電廠的人——他們不理解正在發生的事。」「這需要一次大規模的重組和重新品牌。」 ## 結語：permanent underclass 的威脅 Dylan 訪談最後丟出一句重話：「如果你不使用更多 tokens，你就永遠無法逃離 permanent underclass。」「你可以用一種無聊的方式：用 AI 做一小時工作代替八小時工作，繼續懶惰地混日子。但更聰明的方式是：仍然工作八小時，但做 8 倍的工作，賺 5 倍的錢。」「還有人同時做多份工作，有人創建公司開始銷售產品。趁 AI 還不是每個人的標配之前，趕快用 AI 獲取經濟價值。」「這有三個不同的問題：使用更多 tokens、從這些 tokens 產生價值、以及捕捉價值。如果你不做這三件事，就會隨著模型能力持續飆升、資源持續集中，而永遠處於底層。」對我來說，這整篇訪談最值得細想的不是算力數字，而是兩個事實的並列：一家幾百人的半導體分析公司一年燒掉 700 萬美元在 Claude 上、而且這個數字每週還在跳，同時 Anthropic 正在用 rate limit 把大多數中小企業擋在門外。這代表生產力工具的「取得權」正在快速集中，而不是像過去幾輪科技革命那樣逐步民主化。如果 Dylan 對 Mythos 的描述是準的——L6 資深工程師、比上一代跳兩級、只賣給少數網路安全公司——那麼接下來兩三年，「有沒有存取權」對企業競爭力的影響，可能比「選哪個工具」大得多。這不是買 GPU 或租雲端就能解決的事，是跟 Anthropic、OpenAI 的企業關係問題。 --- *本文由 AI 根據 YouTube 影片內容生成，僅供參考。*