停損王SLKing
    • Create new note
    • Create a note from template
      • Sharing URL Link copied
      • /edit
      • View mode
        • Edit mode
        • View mode
        • Book mode
        • Slide mode
        Edit mode View mode Book mode Slide mode
      • Customize slides
      • Note Permission
      • Read
        • Only me
        • Signed-in users
        • Everyone
        Only me Signed-in users Everyone
      • Write
        • Only me
        • Signed-in users
        • Everyone
        Only me Signed-in users Everyone
      • Engagement control Commenting, Suggest edit, Emoji Reply
    • Invite by email
      Invitee

      This note has no invitees

    • Publish Note

      Share your work with the world Congratulations! 🎉 Your note is out in the world Publish Note No publishing access yet

      Your note will be visible on your profile and discoverable by anyone.
      Your note is now live.
      This note is visible on your profile and discoverable online.
      Everyone on the web can find and read all notes of this public team.

      Your account was recently created. Publishing will be available soon, allowing you to share notes on your public page and in search results.

      Your team account was recently created. Publishing will be available soon, allowing you to share notes on your public page and in search results.

      Explore these features while you wait
      Complete general settings
      Bookmark and like published notes
      Write a few more notes
      Complete general settings
      Write a few more notes
      See published notes
      Unpublish note
      Please check the box to agree to the Community Guidelines.
      View profile
    • Commenting
      Permission
      Disabled Forbidden Owners Signed-in users Everyone
    • Enable
    • Permission
      • Forbidden
      • Owners
      • Signed-in users
      • Everyone
    • Suggest edit
      Permission
      Disabled Forbidden Owners Signed-in users Everyone
    • Enable
    • Permission
      • Forbidden
      • Owners
      • Signed-in users
    • Emoji Reply
    • Enable
    • Versions and GitHub Sync
    • Note settings
    • Note Insights New
    • Engagement control
    • Make a copy
    • Transfer ownership
    • Delete this note
    • Save as template
    • Insert from template
    • Import from
      • Dropbox
      • Google Drive
      • Gist
      • Clipboard
    • Export to
      • Dropbox
      • Google Drive
      • Gist
    • Download
      • Markdown
      • HTML
      • Raw HTML
Menu Note settings Note Insights Versions and GitHub Sync Sharing URL Create Help
Create Create new note Create a note from template
Menu
Options
Engagement control Make a copy Transfer ownership Delete this note
Import from
Dropbox Google Drive Gist Clipboard
Export to
Dropbox Google Drive Gist
Download
Markdown HTML Raw HTML
Back
Sharing URL Link copied
/edit
View mode
  • Edit mode
  • View mode
  • Book mode
  • Slide mode
Edit mode View mode Book mode Slide mode
Customize slides
Note Permission
Read
Only me
  • Only me
  • Signed-in users
  • Everyone
Only me Signed-in users Everyone
Write
Only me
  • Only me
  • Signed-in users
  • Everyone
Only me Signed-in users Everyone
Engagement control Commenting, Suggest edit, Emoji Reply
  • Invite by email
    Invitee

    This note has no invitees

  • Publish Note

    Share your work with the world Congratulations! 🎉 Your note is out in the world Publish Note No publishing access yet

    Your note will be visible on your profile and discoverable by anyone.
    Your note is now live.
    This note is visible on your profile and discoverable online.
    Everyone on the web can find and read all notes of this public team.

    Your account was recently created. Publishing will be available soon, allowing you to share notes on your public page and in search results.

    Your team account was recently created. Publishing will be available soon, allowing you to share notes on your public page and in search results.

    Explore these features while you wait
    Complete general settings
    Bookmark and like published notes
    Write a few more notes
    Complete general settings
    Write a few more notes
    See published notes
    Unpublish note
    Please check the box to agree to the Community Guidelines.
    View profile
    Engagement control
    Commenting
    Permission
    Disabled Forbidden Owners Signed-in users Everyone
    Enable
    Permission
    • Forbidden
    • Owners
    • Signed-in users
    • Everyone
    Suggest edit
    Permission
    Disabled Forbidden Owners Signed-in users Everyone
    Enable
    Permission
    • Forbidden
    • Owners
    • Signed-in users
    Emoji Reply
    Enable
    Import from Dropbox Google Drive Gist Clipboard
       Owned this note    Owned this note      
    Published Linked with GitHub
    1
    • Any changes
      Be notified of any changes
    • Mention me
      Be notified of mention me
    • Unsubscribe
    # 不斷迭代出最強投資組合 ## 193 輪自我對弈實驗 > 用三層 AI 架構打造自主進化的投資組合引擎 > 2026.04 --- ## 一、開場:讓 AI 自己研究股票 193 輪的實驗 想像一下:你把一個 AI 關在房間裡,盡量給它所有可能的公開與不公開資訊,告訴它「給我一個最強的投資組合」。然後讓它做 193 次,每一次都要延續上一次,追求比上一次更好。 聽起來像科幻小說? 但只花了三天。 這個實驗我們發現:AI 跟人類投資者一樣,會陷入偏見、會固執、會在自己的敘事框架裡打轉。而要讓 AI 突破這些限制,你需要的是更精巧的工程。 這就是 Harness Engineering(駕馭工程)的核心命題:如何設計一套系統,讓 AI 的推理能力被正確地引導、約束、並持續進化? ## 二、系統架構:三層 AI 的分工 這個系統的設計,是讓三個不同的 AI 各司其職,形成一個閉環的決策迴路。經過反覆實驗才確立的分層架構。 ### 第一層:Gemini 2.5 Pro(推理引擎) Gemini 是這個系統的「大腦」。每一輪,它會收到一份精心組裝的簡報,裡面包含當前最佳組合、最新市場情蒐、以及必須回答的強制任務。它的工作是:閱讀、思考,然後輸出一份完整的投資組合配置,包含持倉比例、投資論點、風險評估、和開放性問題。 為什麼選 Gemini?因為它在結構化推理和格式遵循上表現出色。這個系統要求模型嚴格按照五個固定 section 輸出(PORTFOLIO、THESIS、MANDATORY_TASKS_RESPONSE、RISKS、OPEN_QUESTIONS),比例加總必須剛好 100%。這是硬規則。我們實驗過 Gemini Flash、Gemini 3.1 Pro、Gemini 2.5 Pro,最終確認 2.5 Pro 是品質與穩定性的最佳平衡點。 (豪洨,其實是因為gemini 3.1 pro 配額用完了,退而求其次改用最佳候補Gemini 2.5 pro) ### 第二層:Claude Sonnet(執行與輪內監督) Claude Sonnet 扮演兩個角色。第一,它是情蒐員:在每輪開始前,它會掃描 Obsidian 知識庫裡的投資筆記、透過 Brave Search 搜尋最新市場資訊,然後把發現濃縮成一份精簡的研究摘要,注入 Gemini 的簡報中。 第二,也是更關鍵的角色:它是監督者。它負責整個單輪的執行流程:產生簡報、呼叫 Gemini API、驗證輸出格式、決定 PROMOTE 或 PATCH/RETRY/FAIL,然後更新系統狀態。 Sonnet 被設計為「無狀態的執行者」。每一輪它都從頭讀取所有 state 檔案,做完一輪就結束。跨輪的記憶完全由檔案系統承載,不依賴任何 AI 的對話歷史。這確保了系統的可重現性和魯棒性。 ### 第三層:Claude Opus(跨輪戰略評估) 這是整個架構中最後加入、卻最關鍵的一層。Claude Cowork Opus 不參與任何單輪的執行,它的工作是「看全局」:每隔數輪檢視組合演變趨勢、偵測系統是否陷入停滯、判斷 Gemini 的推理是否出現系統性偏差、並在必要時進行戰略性介入(且Cowork在檢查大量檔案的能力優秀)。 三層架構的精髓在於「關注分離」:Gemini 負責「想」,Sonnet 負責「做」,Opus 負責「看」。沒有任何一層需要同時承擔推理、執行和評估三重任務。 ## 三、核心工程機制:讓 AI 自我進化的六大支柱 ### 3.1 驗證框架:PROMOTE / PATCH / RETRY / FAIL 每一輪 Gemini 的輸出都要經過自動驗證器的嚴格審查。四級決策機制: PROMOTE:格式完整、比例加總 100% 正負 2%、所有必要 section 齊全、風險至少列出 3 條、強制任務有實質回應(超過 50 字且包含數據)。 PATCH:大部分合格但有小問題,例如比例偏差在 2%-10% 之間、缺少一個 section、或某個任務回應草率。系統會自動產生修正指令,讓 Gemini 只修正有問題的部分。 RETRY:嚴重格式錯誤,例如缺少兩個以上 section、找不到任何比例數字、或 THESIS 少於 50 字。整輪重來。 FAIL:連續三次 FAIL 觸發 ABORT,系統自動暫停並通知人類介入。 在 193 輪的實驗中,這個機制確保了每一輪產出的品質底線。即使 Gemini 偶爾跑偏,系統也能自動修正,不需要人類逐輪盯著看。 ### 3.2 輪間記憶:Round Learnings 機制 這是整個系統最重要的工程突破之一。 早期版本有一個致命問題:每一輪的 AI 都是「失憶」的。Gemini 不記得上一輪做了什麼決定、為什麼那樣做。Sonnet 的情蒐員每次都會去讀同樣的 Obsidian 筆記,產出幾乎一模一樣的研究摘要。系統在原地打轉。 解法是 round_learnings.json:一個累積式的輪間記憶檔案。每輪 PROMOTE 後,系統自動提取四類資訊:持倉異動軌跡(誰進誰出、權重怎麼變)、核心論點演變、已確認的市場事實(帶具體數據的陳述)、以及新識別的風險。 下一輪的簡報會自動注入最近 5 輪的記憶摘要,並且明確標註「以下事實已確認,勿重複研究」。情蒐員的搜尋提示也會注入已知事實清單,引導它去找新的資訊而非重複確認舊資訊。 這就像是給 AI 裝上了短期記憶。它不需要記住所有 193 輪的歷史,只需要知道最近發生了什麼、哪些事實已經確認、下一步應該探索什麼。 ### 3.3 強制任務隊列:人類的最小力量介入 mandatory_queue.json 是整個系統中人類唯一的操控槓桿。它的設計哲學是:最小力量,最大影響。 人類不直接修改投資組合,不告訴 AI 該買什麼賣什麼。人類做的事情只有一件:提出尖銳的問題。這些問題會被注入 Gemini 的簡報中,Gemini 必須在輸出中逐一回應,而且回應要有數據支撐,不能敷衍。 舉個實際案例:當我們觀察到 Gemini 連續數十輪都沒有考慮 ASML 時(後面會詳述),注入的任務不是「請加入 ASML」,而是: ASML 是全球唯一的 EUV 微影設備供應商,壟斷 High-NA EUV 設備。請重新評估:ASML 作為「設備層瓶頸」是否應納入組合?具體比較 ASML vs 當前持倉的風險報酬比。 注意措辭:不是命令,是提問。這個區別至關重要。我們讓 AI 自己做決定,只是確保它考慮了所有該考慮的因素。 ### 3.4 收斂追蹤器:偵測停滯與觸發破局 系統會持續計算每輪組合的雜湊值,追蹤連續多少輪組合沒有變化。當觸發收斂門檻(連續 3 輪相同),系統會自動升級介入策略: 第一級是尖銳提問:在 mandatory_queue 注入帶具體數據門檻的問題。例如不說「考慮 HBM 曝險」,而說「MU 的 HBM3E 良率相對 SK Hynix 差距是多少?若毛利率超過 50%,是否應配置 10% 以上?」 第二級是角色反轉:在簡報中注入「本輪你扮演空方分析師,必須指出組合的三個致命缺陷」。迫使 AI 從反方觀點審視自己的結論。 第三級是強制替換:「本輪必須移除一個持倉並引入一個全新標的,給出完整理由。」打破組合的慣性鎖定。 ### 3.5 探索期與收斂期:相位感知設計 系統不是單調地跑 193 輪。它被設計成有「呼吸節奏」的: R001-R098 是自由探索期。AI 被鼓勵大膽嘗試不同的持倉組合、不同的產業曝險、不同的防禦策略。系統提示明確標註「探索期」,降低收斂壓力。 R099-R125 是結構化探索期。提高變動率要求(90% 的輪次必須有持倉變動),測試了 11 個新標的,最終自然收斂回 R098 的基線組合。這證明了基線的穩健性。 R126 之後是收斂期。AI 被引導聚焦於優化現有持倉的權重和論點深度,而非不斷引入新標的。但收斂不等於僵化,mandatory task 機制確保系統不會完全停止演化。 ### 3.6 原子寫入與狀態完整性 一個常被忽略但至關重要的工程細節:所有 state JSON 檔案的寫入都採用原子操作。先寫入臨時檔案,確認完整性後再 rename 覆蓋原檔。 為什麼?因為在 193 輪的長時間運行中,我們遇到過多次檔案截斷和損壞。round_state.json 被截斷成半截 JSON、mandatory_queue.json 只剩下一個左括號。每一次損壞都可能讓整個系統崩潰。原子寫入不能 100% 防止問題,但大幅降低了風險。 說白了,這就是「駕馭工程」的現實面:你不只要設計 AI 怎麼思考,還要確保承載 AI 記憶的基礎設施不會在半夜悄悄壞掉。 --- ## 四、193 輪組合演化全紀錄:一部 AI 的投資思想史 現在進入最精彩的部分。讓我們追蹤這個 AI 投資者在 193 輪中的思想演變。 AI 如何形成、修正、推翻、重建自己認知框架的活歷史。 ### 第一章:R001 初始配置 | 標的 | 權重 | 定位 | | :- | :- | :- | | NVDA | 20% | AI 運算領導者 | | TSM | 20% | 晶圓代工龍頭 | | AVGO | 15% | 網通與客製化 ASIC | | MRVL | 10% | CPO 光通訊技術 | | 奇鋐 3017 | 10% | AI 伺服器散熱 | | 弘塑 3131 | 5% | 先進封裝設備 | | CASH | 20% | 保留彈性 | 7 個標的,橫跨美股與台股,涵蓋 GPU、代工、ASIC、光通訊、散熱、封裝設備,外加 20% 現金。這是一個典型的「什麼都想要」的初始配置,反映了 AI 在沒有歷史約束下的直覺式佈局。 ### 第二章:R001-R050 擴張期 從 R001 的 7 個標的,到 R050 時膨脹到 9 個標的加上黃金 ETF(GLD)。NVDA 從 20% 降到 12%,取而代之的是更分散的配置。AI 在這個階段展現了「多元化偏見」:它不斷嘗試新的標的,試圖覆蓋更多的「AI 受益環節」。 R050 的組合:AVGO 20%、TSM 18%、奇鋐 12%、NVDA 12%、CASH 10%、GLD 10%、弘塑 8%、MRVL 5%、PLTR 5%。 注意兩個有趣的變化:第一,黃金 ETF 出現了,佔 10%。AI 開始擔心宏觀風險,用黃金避險。第二,PLTR(Palantir)被加入,佔 5%。AI 試圖探索「AI 軟體應用層」的投資機會。 回頭看,這個階段的探索是「廣而淺」的。AI 在每個新標的上只分配了 5-12% 的權重,每一個論點都停留在表面。它知道很多公司,但對任何一家都沒有深入到能夠做出高信心決策的程度。 ### 第三章:R050-R098 局部最優陷阱 這是整個實驗中最令人沮喪的階段。從 R050 到 R098,組合幾乎沒有任何變化。同樣的 9 個標的、同樣的權重、同樣的投資論點。AI 找到了一個它認為「最好」的配置,然後就停下來了。 R093 到 R098:連續 6 輪,持倉變動率為 0%。系統完全凍結。 為什麼會這樣?因為每一輪的驗證都是 PROMOTE。格式正確、論點完整、風險列舉充分。從「品質」的角度看,AI 做得很好。但從「進步」的角度看,它已經完全停滯了。 這揭示了一個深刻的洞見:AI 的優化目標和你真正想要的結果之間可能存在巨大落差。AI 學會了「怎麼寫出通過驗證的輸出」,但沒有動力去探索「是否有更好的組合」。 ### 第四章:R099-R121 結構化探索 為了打破停滯,系統進入設計好的「探索期」。config.py 中的 EXPLORATION_START=99、EXPLORATION_END=125 觸發了不同的行為模式:agent_system.md 中的提示改為鼓勵「積極測試新持倉假設」,收斂追蹤器降低了門檻。 探索期數據:90% 的輪次出現持倉變動,測試了 11 個全新標的,包含 CRWD(資安)、NOW(SaaS 自動化)等非硬體標的。 最令人驚奇的結果是:經過 20 多輪的自由探索後,AI 自然收斂回了 R098 的基線組合。它嘗試了各種替代方案,但最終「選擇」回到原點。 這就像是在告訴你:「我試過了,這些新東西確實不如原來的配置。」探索不是為了改變而改變,而是為了用實驗驗證現有結論的穩健性。 ### 第五章:R125-R128 模型災難 R125 開始,我們嘗試切換到 Gemini Flash 模型(更快、更便宜)。這是一次慘烈的失敗。 Flash 模型在格式遵循上的能力遠不如 2.5 Pro。連續數輪 FAIL:比例加總偏離嚴重、section 缺失、THESIS 過短。驗證器忠實地執行了它的工作,攔下了所有不合格的輸出。但 consecutive_fails 快速累積到 3,觸發了 ABORT。 我們緊急切換回 Gemini 2.5 Pro,重置 ABORT 狀態。這個插曲驗證了一件事:模型的選擇不只是「品質偏好」,它是整個系統能否運行的基礎。選錯模型,再精巧的駕馭工程都是白費。 ### 第六章:R130-R147 防禦期 切回 2.5 Pro 後,AI 表現出明顯的「保守傾向」。組合維持 9 個標的的分散配置,NVDA 只佔 10%,CASH + GLD 合計超過 20%。就像一個經歷過市場暴跌的基金經理,變得格外謹慎。 但系統的記憶機制開始發揮作用。round_learnings.json 持續累積市場事實和分析洞見,簡報中的「已確認事實」區塊越來越厚實。AI 不再重複搜尋同樣的資訊,而是在已知基礎上深化分析。 ### 第七章:R148 結構性突變 R148 是整個 193 輪中最戲劇性的一輪。 在沒有任何人類干預的情況下,AI 自主決定了一次根本性的組合重組:從 9 個標的一口氣縮減到 5 個。奇鋐、弘塑、GLD、PLTR、MRVL 全部被移除。NVDA 從 10% 一口氣跳到 30%。VRT(Vertiv)作為全新標的被引入,佔 15%。 | | R147 (舊) | R148 (新) | | :- | :- | :- | | NVDA | 10% | 30% | | AVGO | 20% | 20% | | TSM | 18% | 20% | | VRT | -- | 15% | | CASH | 12% | 15% | | 奇鋐/弘塑/GLD/MRVL/PLTR | 40% | 全部移除 | AI 在 THESIS 中的解釋是:「本組合高度集中於 AI 基礎設施建設的核心瓶頸。」它建立了一個全新的敘事框架:只持有「不可繞過的瓶頸環節」。台股散熱股雖然受益於 AI,但並非「不可取代」;黃金是避險工具,但不是 AI 基礎設施;PLTR 是軟體公司,不是硬體瓶頸。 R148 是 AI 自主完成的一次「認知躍遷」:從「覆蓋所有 AI 受益環節」到「只押注不可替代的瓶頸」。這個框架轉換不是人類教的,是 AI 在累積了 147 輪的經驗後自己領悟的。 ### 第八章:R150-R172 敘事鎖定 R148 之後,AI 建立了自己的「四大支柱」敘事框架:GPU 算力(NVDA)、客製化晶片(AVGO)、先進製造(TSM)、資料中心基礎設施(VRT)。這個框架給了它清晰的決策邏輯,但也帶來了一個隱蔽的問題。 ASML——全球唯一的 EUV 微影設備供應商——在 R155 短暫出現後又被移除了。為什麼?因為 ASML 是「設備層」,不在「四大支柱」的分類框架內。AI 的敘事框架變成了一副濾鏡:只有符合框架的標的才會被認真考慮。 這是一個極其重要的發現。AI 不像人類那樣帶有情緒偏見,但它有另一種偏見:敘事框架偏見。一旦 AI 建立了一個自洽的分析框架,它會用這個框架去篩選所有新資訊,而那些不符合框架的重要標的就會被系統性地忽略。 --- ## 五、ASML 介入案例 這個案例完美展示了第三層 Opus「看全局」的價值,也是整個實驗中最能說明 Harness Engineering 精髓的故事。 ### 5.1 問題發現 在第三層對 R150-R172 進行跨輪檢視時,我們注意到一個異常:ASML 在 R155 短暫出現(15%),但隨後的十多輪中完全消失。同一時期,Gemini 持續在 RISKS section 中提到「先進製程軍備競賽」和「設備產能瓶頸」,卻從不把這個風險對應到具體的投資機會。 更深入的分析揭示了根本原因:Gemini 在 R148 建立的「四大支柱」框架(GPU、ASIC、代工、基礎設施)沒有為「設備層」留下位置。ASML 的壟斷地位毋庸置疑,但它在 Gemini 的認知地圖上沒有座標。 ### 5.2 精準介入 第三層的介入方式不是直接修改組合,而是在 mandatory_queue.json 中注入一個任務: ASML 是全球唯一的 EUV 微影設備供應商,壟斷 High-NA EUV 設備,鎖定 2nm 及以下節點的長期需求。請重新評估:ASML 作為「設備層瓶頸」是否應納入組合?具體比較 ASML vs 當前第 4-5 號持倉的風險報酬比。提供訂單能見度、毛利率趨勢、護城河強度三個維度的比較。 注意這個任務的設計:它提供了客觀事實(唯一供應商、壟斷地位),指定了比較維度(訂單能見度、毛利率、護城河),但沒有預設結論。AI 完全可以回答「不需要加入」,只要理由充分。 ### 5.3 AI 的回應 R173 輸出中,Gemini 對這個任務做出了詳盡的分析。它從三個維度比較了 ASML 與當時的第 5 號持倉 MRVL(Marvell): 訂單能見度:ASML 的 High-NA EUV 訂單與 TSMC、Intel、Samsung 的 2nm 製程藍圖直接掛鉤,能見度是「產業級別」的。MRVL 則依賴個別客戶的產品週期,不確定性更高。 毛利率趨勢:ASML 毛利率穩定在 51-54%,High-NA EUV 規模化後有望進一步提升。MRVL 的 Non-GAAP 毛利率則從 FY24Q1 的 61.2% 下滑至 FY25Q1 的 59.7%。 護城河強度:ASML 在 EUV 微影設備是「全球唯一供應商」,絕對壟斷。MRVL 在客製化晶片領域仍需與 AVGO 及雲端商的內部團隊競爭。 結論:ASML 以 10% 的權重取代 MRVL,正式納入組合。 ### 5.4 後續驗證 從 R173 到 R193 的 20 輪中,ASML 不僅沒有被移除,反而從 10% 逐步增加到 15%。Gemini 在後續的 THESIS 中主動將分析框架從「四大支柱」擴展為包含「設備層瓶頸」的更完整體系。 一個 mandatory task——不到 200 字的提問——永久性地改變了 AI 的認知框架。這就是 Harness Engineering 的力量:你不需要替 AI 做決定,你只需要確保它看到了所有該看到的東西。 --- ## 六、最終組合:193 輪後的結晶 | 標的 | 權重 | 核心理由 | | :- | :- | :- | | AVGO | 30% | AI ASIC 領導者,受益於雲端客戶自研晶片趨勢 | | TSM | 25% | AI 晶片製造的絕對瓶頸,CoWoS 與先進製程定價權穩固 | | NVDA | 15% | 鑑於潛在需求放緩風險,適度減碼鎖定部分利潤 | | ASML | 15% | 半導體先進製程軍備競賽的唯一軍火商,地位無可取代 | | MU | 10% | HBM 需求結構性增長,DRAM/NAND 價格週期性復甦 | | CASH | 5% | 重建緩衝部位以應對市場波動 | 從 R001 的 7 個標的到 R193 的 6 個標的(含現金),表面上看起來差異不大。但質變是巨大的: 前三大持倉(AVGO + TSM + NVDA)合計 70%,反映 AI 在 193 輪迭代後對「瓶頸壟斷」的高度信心。 台股全部移除:奇鋐、弘塑在探索期被充分測試後退出。AI 的結論是:它們受益於 AI,但不是「不可取代」的。 黃金避險被放棄:從 R050 的 10% GLD 到 R193 的 0%。AI 最終認為,在 AI 基礎設施的結構性牛市中,黃金的機會成本太高。 ASML 的加入:這是人類介入的直接成果。沒有 mandatory task,ASML 可能永遠被困在 Gemini 的認知盲區裡。 MU 的出現:在 R183 前後被引入,反映 AI 對 HBM(高頻寬記憶體)供應鏈瓶頸的新認知。 ![圖片](https://hackmd.io/_uploads/H1ahjtl3-l.png) --- ## 七、預測實驗:AI 系統的可預測性 在 R183 時,我們做了一個有趣的測試:基於當時的組合狀態和演化趨勢,預測 10 輪後(R193)的組合會變成什麼樣。 預測 vs 實際: | 標的 | 預測 | 實際 | 偏差分析 | | :- | :- | :- | :- | | AVGO | 30% | 30% | 完全命中 | | TSM | 25% | 25% | 完全命中 | | NVDA | 20% | 15% | 高估 5% | | ASML | 10% | 15% | 低估 5% | | VRT | 15% | 0% | 重大偏差:被移除 | | MU | 0% | 10% | 未預測到引入 | | CASH | 0% | 5% | 未預測到重建 | 命中率:3/7 完全命中,2/7 方向正確但權重偏差 5%,2/7 完全未預測。 這個結果本身就是一個重要發現。AI 系統的核心持倉(AVGO、TSM)具有高度可預測性,但邊際持倉(VRT、MU)的變動則難以預測。這意味著:系統對「什麼是最重要的」有穩定的判斷,但對「第 4-6 號持倉該是誰」仍在持續探索中。 --- ## 八、六個深層洞見 **洞見一:AI 的偏見是結構性的** 人類投資者有損失厭惡、確認偏誤、錨定效應。AI 沒有這些。但 AI 有自己的偏見:敘事框架鎖定。一旦它建立了一個自洽的分析框架(例如「四大支柱」),所有不符合框架的資訊都會被系統性地忽略。ASML 的案例完美展示了這一點。 **洞見二:記憶是自主系統的氧氣** 沒有 round_learnings 機制之前,系統在原地打轉。每一輪都像第一輪。加入記憶機制後,AI 開始展現累積性的認知進化。從 R001 的「什麼都想要」到 R193 的「只要不可取代的瓶頸」,這個思想演變需要記憶作為橋梁。 **洞見三:最小力量介入是最好的介入** 整個 193 輪中,人類直接介入的次數不超過 5 次,每次都是透過 mandatory task 提問,而非直接修改組合。每一次介入都產生了持久的效果(ASML 從 R173 開始就沒再被移除)。這證明了一個反直覺的原則:管得越少,效果越好。 **洞見四:驗證框架是品質的地板,不是天花板** PROMOTE/PATCH/RETRY/FAIL 確保了每一輪產出的最低品質。但它無法確保「進步」。AI 可以連續 50 輪交出格式完美、論點完整、但完全一樣的輸出。品質的地板和進步的動力是兩件不同的事,需要不同的機制來保障。 **洞見五:模型選擇是工程決策,不是性能偏好** Gemini Flash 的失敗告訴我們:在駕馭工程中,模型不只是「更好或更差」的問題,而是「能不能跑起來」的問題。格式遵循能力、指令理解深度、推理穩定性,這些「非性能」的特質決定了系統的可靠性。選模型就像選引擎,不是馬力越大越好,而是要跟車體匹配。 **洞見六:三層架構的關注分離是必要的** 一開始我們嘗試讓 Sonnet 同時負責執行和評估。結果是:它太忙於處理單輪的細節,無法退一步看全局趨勢。把「執行」和「評估」分離到不同的 AI 之後,評估層才能真正發揮「望遠鏡」的作用,看到 Sonnet 看不到的跨輪模式。 --- ## 九、結語:駕馭的藝術 193 輪。三層 AI。191 個資料夾。數百次自動驗證。不到 5 次人類介入。 這個實驗的結論不是「AI 選的股票比人類好」。老實說,最終組合跟一個有經驗的分析師可能配出的組合不會差太多。真正的價值在於過程,在於我們學到了如何讓 AI 系統自主進化,而又不失控。 Harness Engineering 的核心洞見是:AI 的能力上限不取決於模型有多大,而取決於你如何駕馭它。一個精巧的駕馭系統可以讓中等能力的 AI 持續產出高品質的決策,而一個糟糕的駕馭系統會讓最強的 AI 在原地打轉。 對投資人來說,這意味著什麼? 第一,AI 投資工具的價值不在模型本身,而在它背後的工程。下次有人告訴你他們用 AI 做投資分析,問他們:你的驗證框架是什麼?你怎麼處理 AI 的認知偏見?你的記憶機制是什麼?如果他們答不上來,那個 AI 可能只是在重複同樣的分析,而非真正在進化。 第二,人類的角色不會被取代,但會被重新定義。在這個系統中,人類不需要做每一個投資決策,但需要做最關鍵的判斷:哪些是 AI 看不到的盲區?什麼時候該介入?怎麼介入才能產生最大效果?這是一種更高層次的投資智慧。 第三,未來的 alpha 可能來自駕馭能力的差異。當所有人都能使用同樣的大語言模型時,誰能更好地引導、約束、迭代 AI 的推理過程,誰就能獲得更好的結果。這不是模型軍備競賽,而是工程智慧的競賽。 接下來呢? 目前為止這麼多輪下來,AI 都是紙上談兵,查遍了報告與網頁,卻一次都沒有看K線圖。只跑到193輪的原因是usage limit剛好在這時跑完,接下來窩要認真考慮一下到底還要不要再給他K線圖跑個500輪QQ。

    Import from clipboard

    Paste your markdown or webpage here...

    Advanced permission required

    Your current role can only read. Ask the system administrator to acquire write and comment permission.

    This team is disabled

    Sorry, this team is disabled. You can't edit this note.

    This note is locked

    Sorry, only owner can edit this note.

    Reach the limit

    Sorry, you've reached the max length this note can be.
    Please reduce the content or divide it to more notes, thank you!

    Import from Gist

    Import from Snippet

    or

    Export to Snippet

    Are you sure?

    Do you really want to delete this note?
    All users will lose their connection.

    Create a note from template

    Create a note from template

    Oops...
    This template has been removed or transferred.
    Upgrade
    All
    • All
    • Team
    No template.

    Create a template

    Upgrade

    Delete template

    Do you really want to delete this template?
    Turn this template into a regular note and keep its content, versions, and comments.

    This page need refresh

    You have an incompatible client version.
    Refresh to update.
    New version available!
    See releases notes here
    Refresh to enjoy new features.
    Your user state has changed.
    Refresh to load new user state.

    Sign in

    Forgot password
    or
    Sign in via Facebook Sign in via X(Twitter) Sign in via GitHub Sign in via Dropbox Sign in with Wallet
    Wallet ( )
    Connect another wallet

    New to HackMD? Sign up

    By signing in, you agree to our terms of service.

    Help

    • English
    • 中文
    • Français
    • Deutsch
    • 日本語
    • Español
    • Català
    • Ελληνικά
    • Português
    • italiano
    • Türkçe
    • Русский
    • Nederlands
    • hrvatski jezik
    • język polski
    • Українська
    • हिन्दी
    • svenska
    • Esperanto
    • dansk

    Documents

    Help & Tutorial

    How to use Book mode

    Slide Example

    API Docs

    Edit in VSCode

    Install browser extension

    Contacts

    Feedback

    Discord

    Send us email

    Resources

    Releases

    Pricing

    Blog

    Policy

    Terms

    Privacy

    Cheatsheet

    Syntax Example Reference
    # Header Header 基本排版
    - Unordered List
    • Unordered List
    1. Ordered List
    1. Ordered List
    - [ ] Todo List
    • Todo List
    > Blockquote
    Blockquote
    **Bold font** Bold font
    *Italics font* Italics font
    ~~Strikethrough~~ Strikethrough
    19^th^ 19th
    H~2~O H2O
    ++Inserted text++ Inserted text
    ==Marked text== Marked text
    [link text](https:// "title") Link
    ![image alt](https:// "title") Image
    `Code` Code 在筆記中貼入程式碼
    ```javascript
    var i = 0;
    ```
    var i = 0;
    :smile: :smile: Emoji list
    {%youtube youtube_id %} Externals
    $L^aT_eX$ LaTeX
    :::info
    This is a alert area.
    :::

    This is a alert area.

    Versions and GitHub Sync
    Get Full History Access

    • Edit version name
    • Delete

    revision author avatar     named on  

    More Less

    Note content is identical to the latest version.
    Compare
      Choose a version
      No search result
      Version not found
    Sign in to link this note to GitHub
    Learn more
    This note is not linked with GitHub
     

    Feedback

    Submission failed, please try again

    Thanks for your support.

    On a scale of 0-10, how likely is it that you would recommend HackMD to your friends, family or business associates?

    Please give us some advice and help us improve HackMD.

     

    Thanks for your feedback

    Remove version name

    Do you want to remove this version name and description?

    Transfer ownership

    Transfer to
      Warning: is a public team. If you transfer note to this team, everyone on the web can find and read this note.

        Link with GitHub

        Please authorize HackMD on GitHub
        • Please sign in to GitHub and install the HackMD app on your GitHub repo.
        • HackMD links with GitHub through a GitHub App. You can choose which repo to install our App.
        Learn more  Sign in to GitHub

        Push the note to GitHub Push to GitHub Pull a file from GitHub

          Authorize again
         

        Choose which file to push to

        Select repo
        Refresh Authorize more repos
        Select branch
        Select file
        Select branch
        Choose version(s) to push
        • Save a new version and push
        • Choose from existing versions
        Include title and tags
        Available push count

        Pull from GitHub

         
        File from GitHub
        File from HackMD

        GitHub Link Settings

        File linked

        Linked by
        File path
        Last synced branch
        Available push count

        Danger Zone

        Unlink
        You will no longer receive notification when GitHub file changes after unlink.

        Syncing

        Push failed

        Push successfully