# Finding Alphas 導讀:量化交易的工廠操作手冊 ## 一、這本書在講什麼 《Finding Alphas》是 WorldQuant 創辦人 Igor Tulchinsky 帶領內部團隊寫的一本書。它不是傳統教科書,更像是 WorldQuant 把內部 Alpha 研發流程攤開來給你看。從「怎麼從零開始,到產出一個可以交易的 Alpha 訊號」,整套流程被拆成了標準化的步驟。 這本書最有價值的地方不在公式,而在它傳達的思考框架 — **量化交易不是靠單一靈感,而是靠完整的工作流程**。 --- ## 二、Alpha 到底是什麼 這裡的 Alpha 跟學校教的 CAPM 裡的 Alpha 不太一樣。書裡的定義很直白:Alpha 就是一段程式碼或數學表達式,吃進歷史數據,吐出一組對股票未來相對強弱的預測。正值代表做多,負值代表做空,絕對值反映信心強度。 換句話說,每個 Alpha 本質上就是一個假設的數學翻譯。書中舉了一個簡單的例子:假設「過去五天跌太多的股票,短期內傾向反彈」,翻成公式大概長這樣: ``` Alpha = -(close(today) - close(5d_ago)) / close(5d_ago) #-returns_5d ``` 五天報酬率取負號,跌多的做多,漲多的做空。這就是一個最基本的均值回歸 Alpha。 書裡另一個重點是,Alpha 有生命週期,可以分成四個階段: 1. **誕生 (Genesis)**:從市場觀察或數據中產生一個可測試的假設 2. **驗證 (Validation)**:在歷史數據上做嚴格回測,區分樣本內跟樣本外 3. **部署 (Deployment)**:通過驗證後分配資本,進入實盤交易 4. **衰退 (Decay)**:越來越多人發現同樣的規律,超額報酬逐漸被套利殆盡 所以這一行沒有一勞永逸的策略,只有不斷在挖新的。書裡用了一個很有意思的比喻:Alpha 的出生和死亡是市場的自然循環 — 當一個規律被發現並吸引了足夠多的資本,這些資本流動本身又會創造出新的市場模式,成為下一批 Alpha 的種子。 --- ## 三、Alpha 設計的核心:先有假設,再寫公式 書裡反覆強調一件事,我認為也是全書最核心的觀念:**Alpha 必須基於可解釋的經濟學邏輯。** 書中第四章(Alpha Design)講得很明確 — 設計 Alpha 的起點是 hypothesis,是一個你能說清楚的市場假設,然後才是把它翻成數學表達式去測試。書裡甚至列了一張表,把公式跟假設一一對應:`1/price` 對應的假設是「低價股傾向上漲」,`correlation(price, delay(price,1))` 對應的是「有趨勢性的股票表現較好」。 為什麼這麼強調可解釋性?因為實務上太常見的陷阱是反過來做:先拿一堆數據跑暴力搜索,找到某個歷史回測表現很好的組合,就直接拿來用。這類 Alpha 往往缺乏清楚的經濟學解釋 — 它在歷史數據裡找到的只是巧合,不是規律。書中第十章專門討論了這個問題:只要嘗試夠多次策略配置,你幾乎一定能找到某個在兩年回測裡 Sharpe 超過 1 的結果,但它的樣本外期望 Sharpe 是 0。 真正能活得久的 Alpha,背後都有清晰的經濟學原理。舉幾個書裡有涉及的方向: - **行為金融學**:投資人對資訊過度反應,造成短期超跌或超漲,之後會修正回來 - **資訊不對稱**:財報公佈後市場需要時間消化新資訊,股價會有短暫的漂移 - **基本面分析**:書中第七章花了整章在講這個 — 從財報的應計項目 (accruals) 到現金流品質,都可以成為預測股價的線索 書中把這套做法叫做 hypothesis-driven approach。先有邏輯,再用數據驗證,而不是先有數據,再硬掰一個邏輯。 --- ## 四、中性化:只留下你想要的暴露 書中花了不少篇幅講 Neutralization(中性化),這件事的意義比「市場中性」四個字深很多。 一個 Alpha 的報酬可以拆解成很多成分: - **市場整體漲跌 (Beta)** - **行業輪動 (Sector)** - **風格因子(大小盤、價值成長、動能等)** - **真正屬於你選股能力的部分 (Idiosyncratic Alpha)** 前面那些成分,坦白說很難預測,也不是你的 Alpha 在做的事。如果你的組合不小心大量暴露在某個行業上,那你以為賺到的 Alpha 報酬,其實可能只是剛好那個行業在漲。 書裡第五章和第六章實際走了一遍這個流程。一開始用的是最原始的五日均值回歸 Alpha,回測跑出來年化 31%、但最大回撤高達 39%。接著加上行業中性化 — 要求同行業內多空部位等量 — 結果年化降到 10%,但回撤大幅縮小到 9%,Information Ratio 反而從 1.0 提升到 1.4。報酬看起來少了,但品質高了非常多。 所以中性化的本質是:**把那些你沒有能力預測、也不打算預測的因子暴露剝掉,讓組合只被你刻意設計的 Alpha 因子所驅動。** 書裡第十一章進一步指出,那些廣為人知的風格因子(規模、動能、流動性等)不該出現在你的 Alpha 裡,因為它們已經太擁擠了 — 2007 年 8 月的量化危機就是最好的例子:當大量資金同時押注在相同的因子上,一旦有人開始去槓桿,骨牌效應會把所有人拖下水。 --- ## 五、量大取勝:為什麼需要一支 Alpha 大軍 書中提到 WorldQuant 的目標是產出百萬級別的 Alpha。聽起來很誇張,但背後的邏輯其實很樸素 — 書裡用了一個很生動的比喻來解釋。 Tulchinsky 在第三章(Cutting Losses)提出了一個叫 "UnRule" 的概念:**沒有任何規則是永遠完美的。** 他甚至引用了哲學家 Karl Popper 的觀點 — 任何規則都不能被證明為真,只能被反駁。所以你不能把身家押在任何單一規則上。 Alpha 也一樣。單一 Alpha 不管回測多漂亮,市場結構會變,參與者會變,你的假設在某些環境下就是不成立。但如果你有幾千支 Alpha,各自基於不同的邏輯、看不同面向的數據,它們同時全部失效的機率就極低。某些 Alpha 在震盪盤虧錢的時候,另一些在趨勢盤裡賺錢。整體加起來,淨值曲線會比任何單一策略平滑得多。 這就是書裡講的 **Alpha Diversity**。關鍵不是每支 Alpha 有多強,而是它們之間的相關性有多低。統計學中有個經典的過擬合案例:有人發現歷屆世界盃冠軍的獲勝年份加起來都等於 3964(阿根廷 1978+1986、德國 1974+1990、巴西 1970+1994),然後拿這條「規則」去預測 2006 年冠軍 — 結果當然錯了。但這故事背後有個值得思考的點:在所有國家隊裡,曾經拿過冠軍的確實更可能再拿冠軍。好的 Alpha 就是把這種真實的驅動因素抽出來,而不是停留在表面的巧合上。 ### 數據面的延伸 從數據面來說,要做到 Alpha 多樣性,你需要不斷拓展看數據的角度: 1. **價量數據 (Price/Volume)**:均線、動能、成交量分佈。這是入門,但也是最擁擠的賽道 2. **基本面數據 (Fundamental)**:財報、現金流、分析師預期。更新頻率低,但跟價量天然低相關,是很好的互補來源 3. **情緒與另類數據 (Sentiment & Alternative)**:新聞、社群討論、供應鏈數據。學術界甚至有研究把日照時間拿來當預測變數 每多打開一個數據面向,就等於多開了一條新的 Alpha 礦脈。 --- ## 六、WorldQuant Brain 與工具演進 書中大量篇幅在介紹當時叫 WebSim 的模擬平台,現在已經演進為 WorldQuant Brain。平台細節會過時,但它傳達的核心理念不會:把基礎建設標準化,讓研究員專注在 idea generation 上。 現在做量化研究的工具鏈已經跟書裡寫的很不一樣了。Python 生態系(Pandas、Polars、PyTorch)是主流,機器學習在訊號生成和組合上的應用也遠超書中討論的範圍。但這些都是工具層面的差異,底層邏輯完全沒變。 --- ## 七、這本書的侷限 最後聊幾個讀完之後要留意的落差: 1. **範例因子太簡單**:書裡的 case study 用的是 `-(close - close_5d)/close_5d` 配上行業中性化,在 2015 年當時有教學價值,但放在現今市場已經是完全公開的資訊,不太有超額報酬 2. **機器學習幾乎缺席**:書中完全沒有涉及深度學習、強化學習在因子挖掘和組合最佳化上的應用,而這在 2026 年已經是行業標配 3. **另類數據著墨少**:書裡提到了新聞和社群,但現代 Alpha 的前沿戰場早已轉移到 LLM 驅動的非結構化數據解析(財報電話會議語氣、專利文本)、ESG 與碳排合規數據、即時供應鏈圖譜、以及鏈上交易流分析等方向 --- ## 八、結語 讀完這本書,你不會學到任何可以直接拿去交易的公式。但你會理解量化交易的底層結構: 1. 不斷提出**可解釋的市場假設**,把它翻譯成數學 2. 在歷史數據上做**嚴格的樣本內外驗證**,對過擬合保持警覺 3. 用**中性化剝掉不可控的因子暴露**,只留下你想要的 Alpha 4. 把大量**低相關的訊號組合**成一個穩健的投資組合 這套方法論本身,比任何單一 Alpha 都更有價值。