# Dylan Patel:AI tokens 的供需失衡與 SemiAnalysis 的年化 700 萬支出
> 原始影片:[The Supply and Demand of AI Tokens | Dylan Patel Interview](https://www.youtube.com/watch?v=LF3aUIM57uw) | Invest Like The Best | 2026-04-23
## 導言
Dylan Patel 是 SemiAnalysis 的創辦人,這家半導體與 AI 基礎設施分析公司在業界公認是第一手情報來源。SemiAnalysis 自己本身,就是這場 AI 熱潮最直接的寫照:他們的 token 支出從去年的數萬美元,飆到今年年化 700 萬美元,還在持續加速。
他在訪談裡給出一個重要診斷:AI tokens 的供需失衡不是景氣循環,而是結構性產能瓶頸。需求端企業對 tokens 的消耗難以預測地飆升,供給端 GPU、記憶體、先進封裝、電力基礎設施全都嚴重短缺,這種狀態預計會撐到 2028 年甚至更久。
以下整理 Dylan 對 AI 供需動態、模型能力、供應鏈瓶頸,以及 token 採用策略的看法。
## SemiAnalysis 的 token 支出爆炸:從 500 萬到 700 萬只隔一週
「去年我們自認為是 heavy user,所有人都用 ChatGPT,所有人都用雲端,每個人想要什麼訂閱服務我都提供,那時候公司花費大概在數萬美元等級。今年支出直接沖天,從 12 月底 Opus 4 發布開始就不斷飆升。」
Dylan 透露,SemiAnalysis 的 Anthropic 企業合約已達到年化 700 萬美元,而公司薪資費用大約 2,500 萬美元。Claude Code 支出已超過薪資的 25%,按這個速度到年底會超過 100%。
真正驚人的是增速。訪談中 Dylan 提到:「上週跟你聊的時候是 500 萬,現在已經是 700 萬。」一週 200 萬美元的 annual run rate 增量。驅動這個增量的,是公司內部從非技術人員到工程師全面擁抱 AI 的過程。
他提到一位同事 Doug 是關鍵角色,在公司內推動非技術人員用 AI 寫程式碼,讓整間公司逐步轉型。「工程師本來就會用,但 1 月開始支出開始出現拐點,一路飆升。」
## 從「執行困難」到「想法廉價」:商業邏輯翻轉
Dylan 的核心論點是商業邏輯的倒轉:
「過去,執行是非常困難的,而想法很昂貴。現在,想法便宜且充沛,執行非常容易。所以真正值得做的,只有那些能證明值得在超便宜的執行成本上花費的好想法。」
後果延伸出兩件事:過濾想法成為新的稀缺能力;速度成為生死線。不採用 AI 的公司會被採用 AI 的競爭對手碾壓。
他分享了兩個內部案例。第一個:SemiAnalysis 在 Oregon 有個 reverse engineering lab,配備高階電子顯微鏡分析晶片架構與材料,過去非常耗時。團隊裡一位 Intel 背景的同事,用幾千美元的 Claude Code tokens,做出一個 GPU 加速的應用程式,能分析晶片圖片、標示各區域材料(銅、鉭、鍺、鈷),並對整個晶片堆疊跑有限元素分析。「他說過去這是整個團隊的工作,需要漫長的時間建立和維護。現在,幾千美元就能做到。」
第二個案例是 Malcolm,曾任職於一家大銀行的經濟學家。他用 AI 串接所有資料(Fed 數據、就業報告等)跑經濟影響回歸分析,並對 BLS(美國勞工統計局)的 2,000 項任務逐一評估哪些現在可以被 AI 完成。「目前大約 3% 的任務可以透過 AI 完成。他創造了這個指標,並稱之為『Phantom GDP』——隨著 AI 執行這些任務,成本暴跌,GDP 在理論上反而會萎縮。」
案例的驚人之處:「這一切都是他一個人做的。放到以前,整個 200 人經濟學團隊需要一年的時間才能完成。」
## Anthropic 的 72% 毛利率與需求嚴重超載
Anthropic 的營收從 90 億飆到 350-400 億美元,但算力並沒有同步成長。Dylan 的測算:就算所有增量算力全部用於 inference,Anthropic 的毛利率下限是 72%。
「年初有文件洩露,顯示他們的毛利率約在 30% 多。但現在需求高到什麼程度?他們能夠收緊使用限制、rate limits,所有這些措施。」
關鍵在於:「token 最終是極度稀缺的。無論是誰付得起錢,Anthropic 的問題是——token 需求遠超供給。企業必須擁有 Anthropic 的企業合約,拿到 rate limit increase,否則就拿不到 token。」
「人們願意支付 400 億 ARR 的 tokens,但這些 tokens 創造的價值遠超 400 億美元。不同的商業模式從每個 token 獲得的價值不同,但當模型越來越聰明,真正重要的就是:獲得最聰明的 tokens 並有效利用它們。」
## Opus 4.7 與 Mythos:從 L4 到 L6 工程師的能力跳躍
訪談錄製時 Opus 4.7 剛發布。Dylan 講了一段 Opus 4 發布時的場景:「我和朋友 Leopold 跪在 Anthropic 聯合創辦人面前求 Mythos 的 access。我們知道它存在,但只能假裝不知道。」
Anthropic 2025 年的目標是讓模型達到 L4 軟體工程師的水準,Opus 4 基本上做到了。但 Mythos 是 L6——「L4 是菜鳥,L6 是經驗豐富的資深工程師。Anthropic 說這個模型 2 月就內部可用了。也就是說,兩個月內他們從 L4 到 L6。」
Mythos 的定價是 Opus 4.7 的 5 到 10 倍,但效率高到大多數任務反而更便宜:「Mythos 每個 token 更聰明,但完成任務所需的 token 數量大幅減少,所以實際成本反而更低。」
Dylan 直言:「看著 benchmark,Mythos 可能是 2 年來最大的模型能力跳躍。這是他們不想發布的原因——他們擔心對世界的影響。他們選擇性地發布給網路安全公司,且定價昂貴。他們在 model card 裡明確說了:我們刻意讓它在網路安全方面表現較差。」
對投資人的意義很直接:誰有管道存取最新模型,誰就能碾壓競爭對手。
## 「軟體奇點」之後:機器人的下一步
對於 AI 的下一步,Dylan 提出「Software Only Singularity」的概念:「軟體領域已經達到奇點,但實體世界呢?世界上絕大部分仍是物理的。當軟體變得超級容易,什麼讓機器人很難?就是 programming 微控制器、致動器、控制所有這些東西。」
「現在模型在學習上其實非常沒效率。我們能餵給它們海量資料,讓它們在某些方面超越人類。但機器人的 VLA(Vision Language Action)模型在資料上沒效率,我們無法快速擴展它們的資料。」
關鍵突破是樣本效率(sample efficiency)。人類靠少數例子就能學習,機器人模型也會朝這個方向演進。
「軟體奇點之後,執行變得超便宜,任何人都能開始建立這些東西。我認為在接下來 6 到 18 個月,我們會開始看到機器人的真正突破——few-shot learning。有一個預訓練的機器人模型,你給它展示幾個例子,它就能學會。」
結果就是:「物理商品的巨大加速和通縮效應,token 需求將持續狂熱。」
## 供給側瓶頸:記憶體、TSMC 與供應鏈的長期短缺
供給端是 Dylan 的專場。
### GPU 生命週期大幅延長
「有人說 GPU 的完整生命不到 5 年。完全是胡說。現在有叢集在續約 3、4 年的舊 Hopper 叢集,準備再用 3 到 4 年。A100 叢集也在續約。生命週期顯然不是 5 年,可能甚至是 7、8 年。」
實質影響:「一個叢集的毛利率不是 35%,而是更高。雲端層的毛利率在擴張,硬體層也超級健康。」
### 記憶體的產能剛性
「記憶體的產能每年只能成長低雙位數百分比(約 20-30%)。NAND 更少,DRAM 好一點。2025 年底的強勁需求信號出現後,記憶體公司立即開始反應,但真正的增量供應要等到 2028 年,最快也是 2027 年底。」
因此價格會繼續漲:「記憶體價格已經飆漲,而且會繼續翻倍、再翻倍。DRAM 起碼會從現在的位置再漲 2 到 3 倍,因為需求信號太強,必須透過更高定價來造成需求破壞。」
### TSMC 的 capex 暴增
「TSMC 今年說 capex 是 560 億美元。我們從 1 月以來追蹤到 574 億美元。他們可能還會稍微增加。但人們沒注意的是:三年後 TSMC 會在 capex 上花費 1,000 億美元。可能 2028 年就會達到這個數字。這個數字對下游供應鏈意味著什麼?Lam Research、Applied Materials、ASML,以及更下游的 MKSI 等公司,都會感受到巨大的連鎖效應。」
### 被忽視的 CPU 需求
「每個新一代 AI rack 有 120 個 FPGA。還有所有這些 reinforcement learning 環境,以及我們所有人產生的大量程式碼——現在都跑在 Vercel 實例、AWS 或某個雲端上。這些統統需要 CPU。所以 CPU 也是完全賣光,需求在暴漲。」
CPU 需求暴漲有兩個來源。一是 Reinforcement Learning 環境——模型需要在一個環境中嘗試各種做法,由環境給出評分反饋再迭代。「這些環境可以很簡單,也可以非常複雜——比如打開一個 Siemens 的物理模擬、編輯一個 CAD 模型。這些環境都跑在 CPU 上,不是 GPU。」二是部署環節,模型產出的程式碼和有用輸出最終都跑在 CPU 上,不是直接從 GPU 送到人類大腦。
## 供給為什麼這麼難快速反應
「供給鏈通常反應很快。但這次的獨特之處在於:我們現在的供給鏈比以前任何時候都更複雜,我們建造的東西比以前任何時候都更複雜,所以 lead time 比以前更長。」
「記憶體只是其中一個例子。即使記憶體公司想建多快就建多快,真正的增量供應也要等到 2028 年。這是非常獨特的情況。」
## Anthropic 與 OpenAI 的算力戰略分歧
Dylan 也分析了 Anthropic 與 OpenAI 的差異:
「Anthropic 的算力有上限,生長速度有限。回想起來,Anthropic 的 Dario 以前嘲笑 OpenAI 在算力上太激進,說 Anthropic 更保守。現在 Anthropic 後悔了——『我們應該有更多算力的。』」
「OpenAI 方面,他們從 Oracle、Coreweave、SoftBank、Microsoft 拿了大量算力,加上 AMD 的 Tranium。現在他們燒錢的狀況良好,帳單付得出來。但他們也需要更多。」
投資啟示:「Anthropic 現在可能毛利率 70%+,但如果 OpenAI 達到同樣的能力水準,他們可能只收 50% 毛利率,但仍然拿走所有增量需求。他們的算力也不足以服務所有用戶。所以 Tier 2 的實驗室也會賣光,Tier 3 可能也接近。」
## 誰能負擔得起算力的悖論
Dylan 點出一個讓人不安的趨勢:「模型會越來越少地廣泛部署。Anthropic 不會發布 Mythos 給大眾。他們只發布給特定網路安全公司。這種趨勢會持續。」
「模型會變得更貴,誰來支付萬億美元的基礎設施?是有錢的人、能用 AI 建造有用東西的人。你不希望別人蒸餾你的模型,所以你不會廣泛發布。你只會發布給越來越少的客戶。」
「假設有一天,頂級銀行有 Mythos access,只用於網路安全。但未來某個時候,也許因為你有 Anthropic 企業合約,而且 Anthropic 的人喜歡你,他們願意給你稍微早一點的 access 或稍微高一點的 rate limit。而你的競爭對手沒有,你就碾壓了他們。」
## Phantom GDP:測量不了的價值創造
Dylan 指出 AI 經濟分析中最難的地方:「很難的部分在於 token 經濟學。我們對運行基礎設施的成本、token 成本、模型成本、這些實驗室的毛利率有很好的掌握,但使用和採用是最難建模的部分。」
「1 月時我們對 2 月有瘋狂的預測,結果 Anthropic 遠超。2 月時我們對 3 月有瘋狂假設,又遠超。大家都看到 100 億這個數字,問『他們怎麼增加了 100 億營收?誰在用這些 tokens?他們用它們在建造什麼?更重要的是,這些 tokens 建造出來的東西如何擴散到經濟中?如何衡量創造的價值?』」
「GDP 統計根本無法捕捉這些。我用 tokens 創造的所有價值都轉化成了更好的資訊,我用比別人過去出售資訊更低的價格出售這些資訊,這些資訊現在正在滲透整個經濟,讓人們做出更好的投資決策或更好的商業決策。這種價值如何衡量?」
「如果有人問 Dylan Patel 創造了多少 GDP?數字很小。但我相信創造的價值遠超這個。這就是 Phantom GDP 的謎題。」
## 三個月後的世界:對 AI 產業的預測
訪談尾聲 Dylan 預測了三個月後(訪談於 2026 年 4 月錄製)可能發生的事:「大規模抗議,反對 Anthropic 和 OpenAI。」
「人們討厭 AI。AI 比 ICE、政治人物更不受歡迎。隨著 Anthropic 收入暴增,這將開始造成下游的商業變化。人們會越來越害怕 AI,開始把自己所有的問題——這些長期根深蒂固的全球性問題——都怪到 AI 頭上。」
「你看看新聞文章下面的留言。Sam Altman 的房子兩週內被扔了兩次燃燒彈,留言區的人們在歡呼。這只是開始。」
## 對 AI 產業的公關建議
Dylan 給 OpenAI 和 Anthropic 的 CEO 的建議,聽起來很直接:
第一,Sam Altman 和 Dario 必須停止接受訪談。「他們太沒有魅力了。每次受訪,一般民眾只會更討厭他們。Sam 上 Tucker Carlson 可能讓所有共和黨人討厭 OpenAI。Dario 也是,完全沒有魅力。」
第二,開始展示 AI 能帶來的好事。讓普通人看到 AI 能做什麼好事。
第三,停止不斷談論能力將如何改變世界。「人們對能力感到恐懼,是因為他們不知道如何使用它,也沒有任何連結。普通人不知道 Anthropic 的員工是誰,不知道 OpenAI 的員工是誰,不知道這些公司在追求什麼目標。他們只看到這 5,000 人的公司要改變世界、自動化所有工作、摧毀社會。資助建設所有這些資料中心和發電廠的人——他們不理解正在發生的事。」
「這需要一次大規模的重組和重新品牌。」
## 結語:permanent underclass 的威脅
Dylan 訪談最後丟出一句重話:「如果你不使用更多 tokens,你就永遠無法逃離 permanent underclass。」
「你可以用一種無聊的方式:用 AI 做一小時工作代替八小時工作,繼續懶惰地混日子。但更聰明的方式是:仍然工作八小時,但做 8 倍的工作,賺 5 倍的錢。」
「還有人同時做多份工作,有人創建公司開始銷售產品。趁 AI 還不是每個人的標配之前,趕快用 AI 獲取經濟價值。」
「這有三個不同的問題:使用更多 tokens、從這些 tokens 產生價值、以及捕捉價值。如果你不做這三件事,就會隨著模型能力持續飆升、資源持續集中,而永遠處於底層。」
對我來說,這整篇訪談最值得細想的不是算力數字,而是兩個事實的並列:一家幾百人的半導體分析公司一年燒掉 700 萬美元在 Claude 上、而且這個數字每週還在跳,同時 Anthropic 正在用 rate limit 把大多數中小企業擋在門外。這代表生產力工具的「取得權」正在快速集中,而不是像過去幾輪科技革命那樣逐步民主化。
如果 Dylan 對 Mythos 的描述是準的——L6 資深工程師、比上一代跳兩級、只賣給少數網路安全公司——那麼接下來兩三年,「有沒有存取權」對企業競爭力的影響,可能比「選哪個工具」大得多。這不是買 GPU 或租雲端就能解決的事,是跟 Anthropic、OpenAI 的企業關係問題。
---
*本文由 AI 根據 YouTube 影片內容生成,僅供參考。*