停損王SLKing
  • NEW!
    NEW!  Connect Ideas Across Notes
    Save time and share insights. With Paragraph Citation, you can quote others’ work with source info built in. If someone cites your note, you’ll see a card showing where it’s used—bringing notes closer together.
    Got it
      • Create new note
      • Create a note from template
        • Sharing URL Link copied
        • /edit
        • View mode
          • Edit mode
          • View mode
          • Book mode
          • Slide mode
          Edit mode View mode Book mode Slide mode
        • Customize slides
        • Note Permission
        • Read
          • Only me
          • Signed-in users
          • Everyone
          Only me Signed-in users Everyone
        • Write
          • Only me
          • Signed-in users
          • Everyone
          Only me Signed-in users Everyone
        • Engagement control Commenting, Suggest edit, Emoji Reply
      • Invite by email
        Invitee

        This note has no invitees

      • Publish Note

        Share your work with the world Congratulations! 🎉 Your note is out in the world Publish Note No publishing access yet

        Your note will be visible on your profile and discoverable by anyone.
        Your note is now live.
        This note is visible on your profile and discoverable online.
        Everyone on the web can find and read all notes of this public team.

        Your account was recently created. Publishing will be available soon, allowing you to share notes on your public page and in search results.

        Your team account was recently created. Publishing will be available soon, allowing you to share notes on your public page and in search results.

        Explore these features while you wait
        Complete general settings
        Bookmark and like published notes
        Write a few more notes
        Complete general settings
        Write a few more notes
        See published notes
        Unpublish note
        Please check the box to agree to the Community Guidelines.
        View profile
      • Commenting
        Permission
        Disabled Forbidden Owners Signed-in users Everyone
      • Enable
      • Permission
        • Forbidden
        • Owners
        • Signed-in users
        • Everyone
      • Suggest edit
        Permission
        Disabled Forbidden Owners Signed-in users Everyone
      • Enable
      • Permission
        • Forbidden
        • Owners
        • Signed-in users
      • Emoji Reply
      • Enable
      • Versions and GitHub Sync
      • Note settings
      • Note Insights New
      • Engagement control
      • Make a copy
      • Transfer ownership
      • Delete this note
      • Save as template
      • Insert from template
      • Import from
        • Dropbox
        • Google Drive
        • Gist
        • Clipboard
      • Export to
        • Dropbox
        • Google Drive
        • Gist
      • Download
        • Markdown
        • HTML
        • Raw HTML
    Menu Note settings Note Insights Versions and GitHub Sync Sharing URL Create Help
    Create Create new note Create a note from template
    Menu
    Options
    Engagement control Make a copy Transfer ownership Delete this note
    Import from
    Dropbox Google Drive Gist Clipboard
    Export to
    Dropbox Google Drive Gist
    Download
    Markdown HTML Raw HTML
    Back
    Sharing URL Link copied
    /edit
    View mode
    • Edit mode
    • View mode
    • Book mode
    • Slide mode
    Edit mode View mode Book mode Slide mode
    Customize slides
    Note Permission
    Read
    Only me
    • Only me
    • Signed-in users
    • Everyone
    Only me Signed-in users Everyone
    Write
    Only me
    • Only me
    • Signed-in users
    • Everyone
    Only me Signed-in users Everyone
    Engagement control Commenting, Suggest edit, Emoji Reply
  • Invite by email
    Invitee

    This note has no invitees

  • Publish Note

    Share your work with the world Congratulations! 🎉 Your note is out in the world Publish Note No publishing access yet

    Your note will be visible on your profile and discoverable by anyone.
    Your note is now live.
    This note is visible on your profile and discoverable online.
    Everyone on the web can find and read all notes of this public team.

    Your account was recently created. Publishing will be available soon, allowing you to share notes on your public page and in search results.

    Your team account was recently created. Publishing will be available soon, allowing you to share notes on your public page and in search results.

    Explore these features while you wait
    Complete general settings
    Bookmark and like published notes
    Write a few more notes
    Complete general settings
    Write a few more notes
    See published notes
    Unpublish note
    Please check the box to agree to the Community Guidelines.
    View profile
    Engagement control
    Commenting
    Permission
    Disabled Forbidden Owners Signed-in users Everyone
    Enable
    Permission
    • Forbidden
    • Owners
    • Signed-in users
    • Everyone
    Suggest edit
    Permission
    Disabled Forbidden Owners Signed-in users Everyone
    Enable
    Permission
    • Forbidden
    • Owners
    • Signed-in users
    Emoji Reply
    Enable
    Import from Dropbox Google Drive Gist Clipboard
       Owned this note    Owned this note      
    Published Linked with GitHub
    • Any changes
      Be notified of any changes
    • Mention me
      Be notified of mention me
    • Unsubscribe
    # Dylan Patel:AI tokens 的供需失衡與 SemiAnalysis 的年化 700 萬支出 > 原始影片:[The Supply and Demand of AI Tokens | Dylan Patel Interview](https://www.youtube.com/watch?v=LF3aUIM57uw) | Invest Like The Best | 2026-04-23 ## 導言 Dylan Patel 是 SemiAnalysis 的創辦人,這家半導體與 AI 基礎設施分析公司在業界公認是第一手情報來源。SemiAnalysis 自己本身,就是這場 AI 熱潮最直接的寫照:他們的 token 支出從去年的數萬美元,飆到今年年化 700 萬美元,還在持續加速。 他在訪談裡給出一個重要診斷:AI tokens 的供需失衡不是景氣循環,而是結構性產能瓶頸。需求端企業對 tokens 的消耗難以預測地飆升,供給端 GPU、記憶體、先進封裝、電力基礎設施全都嚴重短缺,這種狀態預計會撐到 2028 年甚至更久。 以下整理 Dylan 對 AI 供需動態、模型能力、供應鏈瓶頸,以及 token 採用策略的看法。 ## SemiAnalysis 的 token 支出爆炸:從 500 萬到 700 萬只隔一週 「去年我們自認為是 heavy user,所有人都用 ChatGPT,所有人都用雲端,每個人想要什麼訂閱服務我都提供,那時候公司花費大概在數萬美元等級。今年支出直接沖天,從 12 月底 Opus 4 發布開始就不斷飆升。」 Dylan 透露,SemiAnalysis 的 Anthropic 企業合約已達到年化 700 萬美元,而公司薪資費用大約 2,500 萬美元。Claude Code 支出已超過薪資的 25%,按這個速度到年底會超過 100%。 真正驚人的是增速。訪談中 Dylan 提到:「上週跟你聊的時候是 500 萬,現在已經是 700 萬。」一週 200 萬美元的 annual run rate 增量。驅動這個增量的,是公司內部從非技術人員到工程師全面擁抱 AI 的過程。 他提到一位同事 Doug 是關鍵角色,在公司內推動非技術人員用 AI 寫程式碼,讓整間公司逐步轉型。「工程師本來就會用,但 1 月開始支出開始出現拐點,一路飆升。」 ## 從「執行困難」到「想法廉價」:商業邏輯翻轉 Dylan 的核心論點是商業邏輯的倒轉: 「過去,執行是非常困難的,而想法很昂貴。現在,想法便宜且充沛,執行非常容易。所以真正值得做的,只有那些能證明值得在超便宜的執行成本上花費的好想法。」 後果延伸出兩件事:過濾想法成為新的稀缺能力;速度成為生死線。不採用 AI 的公司會被採用 AI 的競爭對手碾壓。 他分享了兩個內部案例。第一個:SemiAnalysis 在 Oregon 有個 reverse engineering lab,配備高階電子顯微鏡分析晶片架構與材料,過去非常耗時。團隊裡一位 Intel 背景的同事,用幾千美元的 Claude Code tokens,做出一個 GPU 加速的應用程式,能分析晶片圖片、標示各區域材料(銅、鉭、鍺、鈷),並對整個晶片堆疊跑有限元素分析。「他說過去這是整個團隊的工作,需要漫長的時間建立和維護。現在,幾千美元就能做到。」 第二個案例是 Malcolm,曾任職於一家大銀行的經濟學家。他用 AI 串接所有資料(Fed 數據、就業報告等)跑經濟影響回歸分析,並對 BLS(美國勞工統計局)的 2,000 項任務逐一評估哪些現在可以被 AI 完成。「目前大約 3% 的任務可以透過 AI 完成。他創造了這個指標,並稱之為『Phantom GDP』——隨著 AI 執行這些任務,成本暴跌,GDP 在理論上反而會萎縮。」 案例的驚人之處:「這一切都是他一個人做的。放到以前,整個 200 人經濟學團隊需要一年的時間才能完成。」 ## Anthropic 的 72% 毛利率與需求嚴重超載 Anthropic 的營收從 90 億飆到 350-400 億美元,但算力並沒有同步成長。Dylan 的測算:就算所有增量算力全部用於 inference,Anthropic 的毛利率下限是 72%。 「年初有文件洩露,顯示他們的毛利率約在 30% 多。但現在需求高到什麼程度?他們能夠收緊使用限制、rate limits,所有這些措施。」 關鍵在於:「token 最終是極度稀缺的。無論是誰付得起錢,Anthropic 的問題是——token 需求遠超供給。企業必須擁有 Anthropic 的企業合約,拿到 rate limit increase,否則就拿不到 token。」 「人們願意支付 400 億 ARR 的 tokens,但這些 tokens 創造的價值遠超 400 億美元。不同的商業模式從每個 token 獲得的價值不同,但當模型越來越聰明,真正重要的就是:獲得最聰明的 tokens 並有效利用它們。」 ## Opus 4.7 與 Mythos:從 L4 到 L6 工程師的能力跳躍 訪談錄製時 Opus 4.7 剛發布。Dylan 講了一段 Opus 4 發布時的場景:「我和朋友 Leopold 跪在 Anthropic 聯合創辦人面前求 Mythos 的 access。我們知道它存在,但只能假裝不知道。」 Anthropic 2025 年的目標是讓模型達到 L4 軟體工程師的水準,Opus 4 基本上做到了。但 Mythos 是 L6——「L4 是菜鳥,L6 是經驗豐富的資深工程師。Anthropic 說這個模型 2 月就內部可用了。也就是說,兩個月內他們從 L4 到 L6。」 Mythos 的定價是 Opus 4.7 的 5 到 10 倍,但效率高到大多數任務反而更便宜:「Mythos 每個 token 更聰明,但完成任務所需的 token 數量大幅減少,所以實際成本反而更低。」 Dylan 直言:「看著 benchmark,Mythos 可能是 2 年來最大的模型能力跳躍。這是他們不想發布的原因——他們擔心對世界的影響。他們選擇性地發布給網路安全公司,且定價昂貴。他們在 model card 裡明確說了:我們刻意讓它在網路安全方面表現較差。」 對投資人的意義很直接:誰有管道存取最新模型,誰就能碾壓競爭對手。 ## 「軟體奇點」之後:機器人的下一步 對於 AI 的下一步,Dylan 提出「Software Only Singularity」的概念:「軟體領域已經達到奇點,但實體世界呢?世界上絕大部分仍是物理的。當軟體變得超級容易,什麼讓機器人很難?就是 programming 微控制器、致動器、控制所有這些東西。」 「現在模型在學習上其實非常沒效率。我們能餵給它們海量資料,讓它們在某些方面超越人類。但機器人的 VLA(Vision Language Action)模型在資料上沒效率,我們無法快速擴展它們的資料。」 關鍵突破是樣本效率(sample efficiency)。人類靠少數例子就能學習,機器人模型也會朝這個方向演進。 「軟體奇點之後,執行變得超便宜,任何人都能開始建立這些東西。我認為在接下來 6 到 18 個月,我們會開始看到機器人的真正突破——few-shot learning。有一個預訓練的機器人模型,你給它展示幾個例子,它就能學會。」 結果就是:「物理商品的巨大加速和通縮效應,token 需求將持續狂熱。」 ## 供給側瓶頸:記憶體、TSMC 與供應鏈的長期短缺 供給端是 Dylan 的專場。 ### GPU 生命週期大幅延長 「有人說 GPU 的完整生命不到 5 年。完全是胡說。現在有叢集在續約 3、4 年的舊 Hopper 叢集,準備再用 3 到 4 年。A100 叢集也在續約。生命週期顯然不是 5 年,可能甚至是 7、8 年。」 實質影響:「一個叢集的毛利率不是 35%,而是更高。雲端層的毛利率在擴張,硬體層也超級健康。」 ### 記憶體的產能剛性 「記憶體的產能每年只能成長低雙位數百分比(約 20-30%)。NAND 更少,DRAM 好一點。2025 年底的強勁需求信號出現後,記憶體公司立即開始反應,但真正的增量供應要等到 2028 年,最快也是 2027 年底。」 因此價格會繼續漲:「記憶體價格已經飆漲,而且會繼續翻倍、再翻倍。DRAM 起碼會從現在的位置再漲 2 到 3 倍,因為需求信號太強,必須透過更高定價來造成需求破壞。」 ### TSMC 的 capex 暴增 「TSMC 今年說 capex 是 560 億美元。我們從 1 月以來追蹤到 574 億美元。他們可能還會稍微增加。但人們沒注意的是:三年後 TSMC 會在 capex 上花費 1,000 億美元。可能 2028 年就會達到這個數字。這個數字對下游供應鏈意味著什麼?Lam Research、Applied Materials、ASML,以及更下游的 MKSI 等公司,都會感受到巨大的連鎖效應。」 ### 被忽視的 CPU 需求 「每個新一代 AI rack 有 120 個 FPGA。還有所有這些 reinforcement learning 環境,以及我們所有人產生的大量程式碼——現在都跑在 Vercel 實例、AWS 或某個雲端上。這些統統需要 CPU。所以 CPU 也是完全賣光,需求在暴漲。」 CPU 需求暴漲有兩個來源。一是 Reinforcement Learning 環境——模型需要在一個環境中嘗試各種做法,由環境給出評分反饋再迭代。「這些環境可以很簡單,也可以非常複雜——比如打開一個 Siemens 的物理模擬、編輯一個 CAD 模型。這些環境都跑在 CPU 上,不是 GPU。」二是部署環節,模型產出的程式碼和有用輸出最終都跑在 CPU 上,不是直接從 GPU 送到人類大腦。 ## 供給為什麼這麼難快速反應 「供給鏈通常反應很快。但這次的獨特之處在於:我們現在的供給鏈比以前任何時候都更複雜,我們建造的東西比以前任何時候都更複雜,所以 lead time 比以前更長。」 「記憶體只是其中一個例子。即使記憶體公司想建多快就建多快,真正的增量供應也要等到 2028 年。這是非常獨特的情況。」 ## Anthropic 與 OpenAI 的算力戰略分歧 Dylan 也分析了 Anthropic 與 OpenAI 的差異: 「Anthropic 的算力有上限,生長速度有限。回想起來,Anthropic 的 Dario 以前嘲笑 OpenAI 在算力上太激進,說 Anthropic 更保守。現在 Anthropic 後悔了——『我們應該有更多算力的。』」 「OpenAI 方面,他們從 Oracle、Coreweave、SoftBank、Microsoft 拿了大量算力,加上 AMD 的 Tranium。現在他們燒錢的狀況良好,帳單付得出來。但他們也需要更多。」 投資啟示:「Anthropic 現在可能毛利率 70%+,但如果 OpenAI 達到同樣的能力水準,他們可能只收 50% 毛利率,但仍然拿走所有增量需求。他們的算力也不足以服務所有用戶。所以 Tier 2 的實驗室也會賣光,Tier 3 可能也接近。」 ## 誰能負擔得起算力的悖論 Dylan 點出一個讓人不安的趨勢:「模型會越來越少地廣泛部署。Anthropic 不會發布 Mythos 給大眾。他們只發布給特定網路安全公司。這種趨勢會持續。」 「模型會變得更貴,誰來支付萬億美元的基礎設施?是有錢的人、能用 AI 建造有用東西的人。你不希望別人蒸餾你的模型,所以你不會廣泛發布。你只會發布給越來越少的客戶。」 「假設有一天,頂級銀行有 Mythos access,只用於網路安全。但未來某個時候,也許因為你有 Anthropic 企業合約,而且 Anthropic 的人喜歡你,他們願意給你稍微早一點的 access 或稍微高一點的 rate limit。而你的競爭對手沒有,你就碾壓了他們。」 ## Phantom GDP:測量不了的價值創造 Dylan 指出 AI 經濟分析中最難的地方:「很難的部分在於 token 經濟學。我們對運行基礎設施的成本、token 成本、模型成本、這些實驗室的毛利率有很好的掌握,但使用和採用是最難建模的部分。」 「1 月時我們對 2 月有瘋狂的預測,結果 Anthropic 遠超。2 月時我們對 3 月有瘋狂假設,又遠超。大家都看到 100 億這個數字,問『他們怎麼增加了 100 億營收?誰在用這些 tokens?他們用它們在建造什麼?更重要的是,這些 tokens 建造出來的東西如何擴散到經濟中?如何衡量創造的價值?』」 「GDP 統計根本無法捕捉這些。我用 tokens 創造的所有價值都轉化成了更好的資訊,我用比別人過去出售資訊更低的價格出售這些資訊,這些資訊現在正在滲透整個經濟,讓人們做出更好的投資決策或更好的商業決策。這種價值如何衡量?」 「如果有人問 Dylan Patel 創造了多少 GDP?數字很小。但我相信創造的價值遠超這個。這就是 Phantom GDP 的謎題。」 ## 三個月後的世界:對 AI 產業的預測 訪談尾聲 Dylan 預測了三個月後(訪談於 2026 年 4 月錄製)可能發生的事:「大規模抗議,反對 Anthropic 和 OpenAI。」 「人們討厭 AI。AI 比 ICE、政治人物更不受歡迎。隨著 Anthropic 收入暴增,這將開始造成下游的商業變化。人們會越來越害怕 AI,開始把自己所有的問題——這些長期根深蒂固的全球性問題——都怪到 AI 頭上。」 「你看看新聞文章下面的留言。Sam Altman 的房子兩週內被扔了兩次燃燒彈,留言區的人們在歡呼。這只是開始。」 ## 對 AI 產業的公關建議 Dylan 給 OpenAI 和 Anthropic 的 CEO 的建議,聽起來很直接: 第一,Sam Altman 和 Dario 必須停止接受訪談。「他們太沒有魅力了。每次受訪,一般民眾只會更討厭他們。Sam 上 Tucker Carlson 可能讓所有共和黨人討厭 OpenAI。Dario 也是,完全沒有魅力。」 第二,開始展示 AI 能帶來的好事。讓普通人看到 AI 能做什麼好事。 第三,停止不斷談論能力將如何改變世界。「人們對能力感到恐懼,是因為他們不知道如何使用它,也沒有任何連結。普通人不知道 Anthropic 的員工是誰,不知道 OpenAI 的員工是誰,不知道這些公司在追求什麼目標。他們只看到這 5,000 人的公司要改變世界、自動化所有工作、摧毀社會。資助建設所有這些資料中心和發電廠的人——他們不理解正在發生的事。」 「這需要一次大規模的重組和重新品牌。」 ## 結語:permanent underclass 的威脅 Dylan 訪談最後丟出一句重話:「如果你不使用更多 tokens,你就永遠無法逃離 permanent underclass。」 「你可以用一種無聊的方式:用 AI 做一小時工作代替八小時工作,繼續懶惰地混日子。但更聰明的方式是:仍然工作八小時,但做 8 倍的工作,賺 5 倍的錢。」 「還有人同時做多份工作,有人創建公司開始銷售產品。趁 AI 還不是每個人的標配之前,趕快用 AI 獲取經濟價值。」 「這有三個不同的問題:使用更多 tokens、從這些 tokens 產生價值、以及捕捉價值。如果你不做這三件事,就會隨著模型能力持續飆升、資源持續集中,而永遠處於底層。」 對我來說,這整篇訪談最值得細想的不是算力數字,而是兩個事實的並列:一家幾百人的半導體分析公司一年燒掉 700 萬美元在 Claude 上、而且這個數字每週還在跳,同時 Anthropic 正在用 rate limit 把大多數中小企業擋在門外。這代表生產力工具的「取得權」正在快速集中,而不是像過去幾輪科技革命那樣逐步民主化。 如果 Dylan 對 Mythos 的描述是準的——L6 資深工程師、比上一代跳兩級、只賣給少數網路安全公司——那麼接下來兩三年,「有沒有存取權」對企業競爭力的影響,可能比「選哪個工具」大得多。這不是買 GPU 或租雲端就能解決的事,是跟 Anthropic、OpenAI 的企業關係問題。 --- *本文由 AI 根據 YouTube 影片內容生成,僅供參考。*

    Import from clipboard

    Paste your markdown or webpage here...

    Advanced permission required

    Your current role can only read. Ask the system administrator to acquire write and comment permission.

    This team is disabled

    Sorry, this team is disabled. You can't edit this note.

    This note is locked

    Sorry, only owner can edit this note.

    Reach the limit

    Sorry, you've reached the max length this note can be.
    Please reduce the content or divide it to more notes, thank you!

    Import from Gist

    Import from Snippet

    or

    Export to Snippet

    Are you sure?

    Do you really want to delete this note?
    All users will lose their connection.

    Create a note from template

    Create a note from template

    Oops...
    This template has been removed or transferred.
    Upgrade
    All
    • All
    • Team
    No template.

    Create a template

    Upgrade

    Delete template

    Do you really want to delete this template?
    Turn this template into a regular note and keep its content, versions, and comments.

    This page need refresh

    You have an incompatible client version.
    Refresh to update.
    New version available!
    See releases notes here
    Refresh to enjoy new features.
    Your user state has changed.
    Refresh to load new user state.

    Sign in

    Forgot password
    or
    Sign in via Google Sign in via Facebook Sign in via X(Twitter) Sign in via GitHub Sign in via Dropbox Sign in with Wallet
    Wallet ( )
    Connect another wallet

    New to HackMD? Sign up

    By signing in, you agree to our terms of service.

    Help

    • English
    • 中文
    • Français
    • Deutsch
    • 日本語
    • Español
    • Català
    • Ελληνικά
    • Português
    • italiano
    • Türkçe
    • Русский
    • Nederlands
    • hrvatski jezik
    • język polski
    • Українська
    • हिन्दी
    • svenska
    • Esperanto
    • dansk

    Documents

    Help & Tutorial

    How to use Book mode

    Slide Example

    API Docs

    Edit in VSCode

    Install browser extension

    Contacts

    Feedback

    Discord

    Send us email

    Resources

    Releases

    Pricing

    Blog

    Policy

    Terms

    Privacy

    Cheatsheet

    Syntax Example Reference
    # Header Header 基本排版
    - Unordered List
    • Unordered List
    1. Ordered List
    1. Ordered List
    - [ ] Todo List
    • Todo List
    > Blockquote
    Blockquote
    **Bold font** Bold font
    *Italics font* Italics font
    ~~Strikethrough~~ Strikethrough
    19^th^ 19th
    H~2~O H2O
    ++Inserted text++ Inserted text
    ==Marked text== Marked text
    [link text](https:// "title") Link
    ![image alt](https:// "title") Image
    `Code` Code 在筆記中貼入程式碼
    ```javascript
    var i = 0;
    ```
    var i = 0;
    :smile: :smile: Emoji list
    {%youtube youtube_id %} Externals
    $L^aT_eX$ LaTeX
    :::info
    This is a alert area.
    :::

    This is a alert area.

    Versions and GitHub Sync
    Get Full History Access

    • Edit version name
    • Delete

    revision author avatar     named on  

    More Less

    Note content is identical to the latest version.
    Compare
      Choose a version
      No search result
      Version not found
    Sign in to link this note to GitHub
    Learn more
    This note is not linked with GitHub
     

    Feedback

    Submission failed, please try again

    Thanks for your support.

    On a scale of 0-10, how likely is it that you would recommend HackMD to your friends, family or business associates?

    Please give us some advice and help us improve HackMD.

     

    Thanks for your feedback

    Remove version name

    Do you want to remove this version name and description?

    Transfer ownership

    Transfer to
      Warning: is a public team. If you transfer note to this team, everyone on the web can find and read this note.

        Link with GitHub

        Please authorize HackMD on GitHub
        • Please sign in to GitHub and install the HackMD app on your GitHub repo.
        • HackMD links with GitHub through a GitHub App. You can choose which repo to install our App.
        Learn more  Sign in to GitHub

        Push the note to GitHub Push to GitHub Pull a file from GitHub

          Authorize again
         

        Choose which file to push to

        Select repo
        Refresh Authorize more repos
        Select branch
        Select file
        Select branch
        Choose version(s) to push
        • Save a new version and push
        • Choose from existing versions
        Include title and tags
        Available push count

        Pull from GitHub

         
        File from GitHub
        File from HackMD

        GitHub Link Settings

        File linked

        Linked by
        File path
        Last synced branch
        Available push count

        Danger Zone

        Unlink
        You will no longer receive notification when GitHub file changes after unlink.

        Syncing

        Push failed

        Push successfully