Finding Alphas 導讀：量化交易的工廠操作手冊

# Finding Alphas 導讀：量化交易的工廠操作手冊 ## 一、這本書在講什麼《Finding Alphas》是 WorldQuant 創辦人 Igor Tulchinsky 帶領內部團隊寫的一本書。它不是傳統教科書，更像是 WorldQuant 把內部 Alpha 研發流程攤開來給你看。從「怎麼從零開始，到產出一個可以交易的 Alpha 訊號」，整套流程被拆成了標準化的步驟。這本書最有價值的地方不在公式，而在它傳達的思考框架 — **量化交易不是靠單一靈感，而是靠完整的工作流程**。 --- ## 二、Alpha 到底是什麼這裡的 Alpha 跟學校教的 CAPM 裡的 Alpha 不太一樣。書裡的定義很直白：Alpha 就是一段程式碼或數學表達式，吃進歷史數據，吐出一組對股票未來相對強弱的預測。正值代表做多，負值代表做空，絕對值反映信心強度。換句話說，每個 Alpha 本質上就是一個假設的數學翻譯。書中舉了一個簡單的例子：假設「過去五天跌太多的股票，短期內傾向反彈」，翻成公式大概長這樣： ``` Alpha = -(close(today) - close(5d_ago)) / close(5d_ago) #-returns_5d ``` 五天報酬率取負號，跌多的做多，漲多的做空。這就是一個最基本的均值回歸 Alpha。書裡另一個重點是，Alpha 有生命週期，可以分成四個階段： 1. **誕生 (Genesis)**：從市場觀察或數據中產生一個可測試的假設 2. **驗證 (Validation)**：在歷史數據上做嚴格回測，區分樣本內跟樣本外 3. **部署 (Deployment)**：通過驗證後分配資本，進入實盤交易 4. **衰退 (Decay)**：越來越多人發現同樣的規律，超額報酬逐漸被套利殆盡所以這一行沒有一勞永逸的策略，只有不斷在挖新的。書裡用了一個很有意思的比喻：Alpha 的出生和死亡是市場的自然循環 — 當一個規律被發現並吸引了足夠多的資本，這些資本流動本身又會創造出新的市場模式，成為下一批 Alpha 的種子。 --- ## 三、Alpha 設計的核心：先有假設，再寫公式書裡反覆強調一件事，我認為也是全書最核心的觀念：**Alpha 必須基於可解釋的經濟學邏輯。** 書中第四章（Alpha Design）講得很明確 — 設計 Alpha 的起點是 hypothesis，是一個你能說清楚的市場假設，然後才是把它翻成數學表達式去測試。書裡甚至列了一張表，把公式跟假設一一對應：`1/price` 對應的假設是「低價股傾向上漲」，`correlation(price, delay(price,1))` 對應的是「有趨勢性的股票表現較好」。為什麼這麼強調可解釋性？因為實務上太常見的陷阱是反過來做：先拿一堆數據跑暴力搜索，找到某個歷史回測表現很好的組合，就直接拿來用。這類 Alpha 往往缺乏清楚的經濟學解釋 — 它在歷史數據裡找到的只是巧合，不是規律。書中第十章專門討論了這個問題：只要嘗試夠多次策略配置，你幾乎一定能找到某個在兩年回測裡 Sharpe 超過 1 的結果，但它的樣本外期望 Sharpe 是 0。真正能活得久的 Alpha，背後都有清晰的經濟學原理。舉幾個書裡有涉及的方向： - **行為金融學**：投資人對資訊過度反應，造成短期超跌或超漲，之後會修正回來 - **資訊不對稱**：財報公佈後市場需要時間消化新資訊，股價會有短暫的漂移 - **基本面分析**：書中第七章花了整章在講這個 — 從財報的應計項目 (accruals) 到現金流品質，都可以成為預測股價的線索書中把這套做法叫做 hypothesis-driven approach。先有邏輯，再用數據驗證，而不是先有數據，再硬掰一個邏輯。 --- ## 四、中性化：只留下你想要的暴露書中花了不少篇幅講 Neutralization（中性化），這件事的意義比「市場中性」四個字深很多。一個 Alpha 的報酬可以拆解成很多成分： - **市場整體漲跌 (Beta)** - **行業輪動 (Sector)** - **風格因子（大小盤、價值成長、動能等）** - **真正屬於你選股能力的部分 (Idiosyncratic Alpha)** 前面那些成分，坦白說很難預測，也不是你的 Alpha 在做的事。如果你的組合不小心大量暴露在某個行業上，那你以為賺到的 Alpha 報酬，其實可能只是剛好那個行業在漲。書裡第五章和第六章實際走了一遍這個流程。一開始用的是最原始的五日均值回歸 Alpha，回測跑出來年化 31%、但最大回撤高達 39%。接著加上行業中性化 — 要求同行業內多空部位等量 — 結果年化降到 10%，但回撤大幅縮小到 9%，Information Ratio 反而從 1.0 提升到 1.4。報酬看起來少了，但品質高了非常多。所以中性化的本質是：**把那些你沒有能力預測、也不打算預測的因子暴露剝掉，讓組合只被你刻意設計的 Alpha 因子所驅動。** 書裡第十一章進一步指出，那些廣為人知的風格因子（規模、動能、流動性等）不該出現在你的 Alpha 裡，因為它們已經太擁擠了 — 2007 年 8 月的量化危機就是最好的例子：當大量資金同時押注在相同的因子上，一旦有人開始去槓桿，骨牌效應會把所有人拖下水。 --- ## 五、量大取勝：為什麼需要一支 Alpha 大軍書中提到 WorldQuant 的目標是產出百萬級別的 Alpha。聽起來很誇張，但背後的邏輯其實很樸素 — 書裡用了一個很生動的比喻來解釋。 Tulchinsky 在第三章（Cutting Losses）提出了一個叫 "UnRule" 的概念：**沒有任何規則是永遠完美的。** 他甚至引用了哲學家 Karl Popper 的觀點 — 任何規則都不能被證明為真，只能被反駁。所以你不能把身家押在任何單一規則上。 Alpha 也一樣。單一 Alpha 不管回測多漂亮，市場結構會變，參與者會變，你的假設在某些環境下就是不成立。但如果你有幾千支 Alpha，各自基於不同的邏輯、看不同面向的數據，它們同時全部失效的機率就極低。某些 Alpha 在震盪盤虧錢的時候，另一些在趨勢盤裡賺錢。整體加起來，淨值曲線會比任何單一策略平滑得多。這就是書裡講的 **Alpha Diversity**。關鍵不是每支 Alpha 有多強，而是它們之間的相關性有多低。統計學中有個經典的過擬合案例：有人發現歷屆世界盃冠軍的獲勝年份加起來都等於 3964（阿根廷 1978+1986、德國 1974+1990、巴西 1970+1994），然後拿這條「規則」去預測 2006 年冠軍 — 結果當然錯了。但這故事背後有個值得思考的點：在所有國家隊裡，曾經拿過冠軍的確實更可能再拿冠軍。好的 Alpha 就是把這種真實的驅動因素抽出來，而不是停留在表面的巧合上。 ### 數據面的延伸從數據面來說，要做到 Alpha 多樣性，你需要不斷拓展看數據的角度： 1. **價量數據 (Price/Volume)**：均線、動能、成交量分佈。這是入門，但也是最擁擠的賽道 2. **基本面數據 (Fundamental)**：財報、現金流、分析師預期。更新頻率低，但跟價量天然低相關，是很好的互補來源 3. **情緒與另類數據 (Sentiment & Alternative)**：新聞、社群討論、供應鏈數據。學術界甚至有研究把日照時間拿來當預測變數每多打開一個數據面向，就等於多開了一條新的 Alpha 礦脈。 --- ## 六、WorldQuant Brain 與工具演進書中大量篇幅在介紹當時叫 WebSim 的模擬平台，現在已經演進為 WorldQuant Brain。平台細節會過時，但它傳達的核心理念不會：把基礎建設標準化，讓研究員專注在 idea generation 上。現在做量化研究的工具鏈已經跟書裡寫的很不一樣了。Python 生態系（Pandas、Polars、PyTorch）是主流，機器學習在訊號生成和組合上的應用也遠超書中討論的範圍。但這些都是工具層面的差異，底層邏輯完全沒變。 --- ## 七、這本書的侷限最後聊幾個讀完之後要留意的落差： 1. **範例因子太簡單**：書裡的 case study 用的是 `-(close - close_5d)/close_5d` 配上行業中性化，在 2015 年當時有教學價值，但放在現今市場已經是完全公開的資訊，不太有超額報酬 2. **機器學習幾乎缺席**：書中完全沒有涉及深度學習、強化學習在因子挖掘和組合最佳化上的應用，而這在 2026 年已經是行業標配 3. **另類數據著墨少**：書裡提到了新聞和社群，但現代 Alpha 的前沿戰場早已轉移到 LLM 驅動的非結構化數據解析（財報電話會議語氣、專利文本）、ESG 與碳排合規數據、即時供應鏈圖譜、以及鏈上交易流分析等方向 --- ## 八、結語讀完這本書，你不會學到任何可以直接拿去交易的公式。但你會理解量化交易的底層結構： 1. 不斷提出**可解釋的市場假設**，把它翻譯成數學 2. 在歷史數據上做**嚴格的樣本內外驗證**，對過擬合保持警覺 3. 用**中性化剝掉不可控的因子暴露**，只留下你想要的 Alpha 4. 把大量**低相關的訊號組合**成一個穩健的投資組合這套方法論本身，比任何單一 Alpha 都更有價值。