---
title: "2026 量化論文筆記:可驗證來源與可回測 proxy"
date: 2026-05-26
category: quant-research
tags: ["量化研究", "asset allocation", "Transformer", "Sharpe Ratio", "backtest"]
hackmd_url: "https://hackmd.io/@no0mTG4DTVi61wHzNybh_Q/BJ5jDAzlGx"
description: "把目前可找到公開來源的量化資產配置論文整理成研究筆記,並用可重現的 ETF proxy 回測比較 direct allocation、risk-control 與 sparse Sharpe 思路。"
---
> 更新時間:2026-05-26 16:05 CST
> 定位:研究筆記 / proxy backtest,不是買賣建議。這篇只把「目前可找到公開來源」的論文納入;未找到公開來源的標題先不當成已發表事實。
# 一句話結論
【判斷】這批量化 AI 論文真正值得追的是同一個方向:**不要只把 ML 拿來預測價格,而是讓模型直接學 portfolio decision / risk objective**。但用簡化 proxy 回測後,結果也提醒一件事:**降低風險比提高報酬容易;要打敗 SPY 的長期總報酬很難。**
本次 proxy 回測中:
- **SPY buy-and-hold** 總報酬最高:2018-01-02 至 2026-05-22 成長 **3.15x**,CAGR **14.67%**,但最大回撤 **-33.72%**。
- **Trend inverse-vol proxy** 報酬較低:成長 **2.04x**,CAGR **8.91%**,但最大回撤只有 **-9.86%**,Sharpe_0rf **1.19**,是風險控制最強的版本。
- **Sparse tangent proxy** 成長 **2.19x**,CAGR **9.81%**,最大回撤 **-19.35%**;沒有明顯優於簡單等權。
【解讀】如果目標是「長期資本成長」,SPY 仍是強 benchmark;如果目標是「降低 drawdown / CVaR」,risk-aware allocation 才有研究價值。
---
# 1. 來源查證:哪些標題目前有公開來源?
| 原始題目 / 相關論文 | 查證狀態 | 公開來源 | 本文處理方式 |
|---|---:|---|---|
| Joint-Embedding Predictive Learning of Latent Market States in U.S. Equities | 未找到精確公開論文 | — | 不納入正式回測,只保留為「regime encoder」研究方向 |
| Signature-Informed Transformer for Asset Allocation | 找到精確 arXiv | arXiv: [2510.03129](https://arxiv.org/abs/2510.03129) | 納入,做 risk-aware direct allocation proxy |
| Portfolio Transformer for Attention-Based Asset Allocation | 找到相關 arXiv | arXiv: [2206.03246](https://arxiv.org/abs/2206.03246) | 納入,作為 direct Sharpe optimization 的前序參考 |
| Global Merger-Arbitrage Forecasting with Language Models | 未找到精確公開論文 | — | 不納入回測;M&A 需要 deal database,不適合用 ETF proxy 硬測 |
| Decision-focused Sparse Tangent Portfolio Optimization | 未找到精確同名論文 | 相關:arXiv [2410.21100](https://arxiv.org/abs/2410.21100)、DOI [10.1016/j.orl.2016.05.012](https://doi.org/10.1016/j.orl.2016.05.012) | 納入 sparse tangent / sparse Sharpe proxy |
---
# 2. 已有來源論文重點
## 2.1 Signature-Informed Transformer for Asset Allocation
【來源】Yoontae Hwang, Stefan Zohren, *Signature-Informed Transformer for Asset Allocation*, arXiv:2510.03129v3,分類 cs.LG / cs.AI / q-fin.PM,初版 2025-10-03,更新 2026-01-22。來源:<https://arxiv.org/abs/2510.03129>
【事實】arXiv 摘要指出,傳統 deep learning asset allocation 常把 forecasting 與 optimization 分開,作者認為這會造成「prediction error 低,但 portfolio decision 不一定好」的 mismatch。論文提出 Signature-Informed Transformer,把 path signatures、特殊 attention module 與 direct policy learning 結合,並直接最小化 Conditional Value at Risk,讓訓練目標與金融風險目標更一致。
【我的解讀】這篇的重點不是「Transformer 比 MA 更會預測價格」,而是:
1. feature extraction 與 allocation decision 合併;
2. objective 從 MSE / return forecast 換成 CVaR;
3. 模型被設計成看資產之間的幾何關係,而不是單一資產時間序列。
【可疑點】金融資料低訊噪,Transformer 容易過擬合;若 turnover、交易成本、universe selection、survivorship bias 沒嚴格處理,漂亮結果不一定能實盤。
## 2.2 Portfolio Transformer for Attention-Based Asset Allocation
【來源】Damian Kisiel, Denise Gorse, *Portfolio Transformer for Attention-Based Asset Allocation*, arXiv:2206.03246。來源:<https://arxiv.org/abs/2206.03246>
【事實】arXiv 摘要表示,傳統流程是 returns forecasting 後再 optimization;Portfolio Transformer 則試圖繞過報酬預測,直接最佳化 Sharpe ratio,作為 end-to-end portfolio optimization framework。
【我的解讀】這是 #2 的前序精神:**不要先預測報酬再丟 optimizer,而是讓模型直接對 portfolio performance 負責。**
## 2.3 Sparse Sharpe / Sparse Tangent Portfolio
【來源 1】Yizun Lin, Zhao-Rong Lai, Cheng Li, *A Globally Optimal Portfolio for m-Sparse Sharpe Ratio Maximization*, arXiv:2410.21100。來源:<https://arxiv.org/abs/2410.21100>
【來源 2】*Sparse tangent portfolio selection via semi-definite relaxation*, Operations Research Letters, DOI: 10.1016/j.orl.2016.05.012。來源:<https://doi.org/10.1016/j.orl.2016.05.012>
【事實】arXiv:2410.21100 摘要指出,現代投組管理可能需要 m-sparse portfolio,也就是最多只持有 m 個活躍資產,以降低管理與交易成本;但 Sharpe ratio + sparsity constraint 因為非凸與稀疏限制而困難。該文將 m-sparse fractional optimization 轉換成等價的 m-sparse quadratic programming problem,並提出 proximal gradient algorithm。
【我的解讀】這條線比單純 AI 更接近實務:不是要持有 500 個權重很漂亮但沒法執行的資產,而是要在可管理的持倉數內,把風險調整後報酬做出來。
---
# 3. Proxy 回測設計
這次沒有重做原論文模型;原因是:
1. Signature-Informed Transformer 需要完整訓練 pipeline、path signature feature、CVaR loss 與原始 universe 設定。
2. Portfolio Transformer 需要神經網路架構與訓練資料切分。
3. Sparse Sharpe 需要更嚴格 optimizer;本文只做「可解釋、可重現」的近似版本。
因此本文做的是 **proxy backtest**:用簡化規則模擬論文思想,而不是宣稱復現論文。
## 資料與假設
【資料來源】Yahoo Finance chart API adjusted close。下載檔保存在本地:`assets/quant-research/quant-paper-proxy-backtest/yahoo_adjusted_close.csv`。
【回測區間】2018-01-02 至 2026-05-22,共 2109 個交易日。
【資產池】
- SPY:S&P 500 ETF
- QQQ:Nasdaq 100 ETF
- IWM:Russell 2000 ETF
- TLT:20Y Treasury ETF
- GLD:Gold ETF
- HYG:High-yield bond ETF
- UUP:US Dollar ETF
【交易假設】
- 月底再平衡。
- 使用 adjusted close。
- 每次單邊 turnover 成本 5 bps。
- 不含稅,不含借券 / 放空,不含股息稅差異。
- 現金部位報酬假設為 0%。
## 策略定義
| 策略 | 對應研究概念 | 實作 proxy |
|---|---|---|
| SPY buy-and-hold | benchmark | 100% SPY,買入持有 |
| Monthly equal weight | naive diversified baseline | 7 個 ETF 每月等權再平衡 |
| Trend inverse-vol proxy | Signature / CVaR / risk-control 思路 | 僅持有價格高於 200 日均線的資產,權重按 63 日 realized volatility 反比配置 |
| Sparse tangent proxy | sparse Sharpe / tangent portfolio 思路 | 每月用過去 252 日估計 mean / covariance,選 trailing Sharpe 前 3 名,再用 shrinkage covariance 做 long-only tangent-like weighting |
---
# 4. 回測結果
## 4.1 總表
| strategy | final_growth_x | total_return_pct | cagr_pct | ann_vol_pct | sharpe_0rf | max_drawdown_pct | worst_month_pct | positive_month_pct | avg_annual_turnover_x | rebalance_count |
|---|---:|---:|---:|---:|---:|---:|---:|---:|---:|---:|
| SPY buy-and-hold | 3.15 | 215.04 | 14.67 | 19.23 | 0.76 | -33.72 | -12.49 | 67.00 | 0.12 | 1 |
| Monthly equal weight | 2.23 | 122.69 | 10.02 | 10.42 | 0.96 | -18.79 | -6.23 | 65.00 | 0.45 | 102 |
| Trend inverse-vol proxy | 2.04 | 104.47 | 8.91 | 7.51 | 1.19 | -9.86 | -3.83 | 68.00 | 4.12 | 97 |
| Sparse tangent proxy | 2.19 | 119.15 | 9.81 | 10.86 | 0.90 | -19.35 | -8.80 | 67.00 | 5.30 | 90 |
【解讀】
- SPY 仍然是最難打敗的總報酬 benchmark。
- Trend inverse-vol proxy 不是報酬最高,但 drawdown 壓得最漂亮;這比較符合「CVaR / risk-aware allocation」的研究價值。
- Sparse tangent proxy 沒有打敗等權太多,且 turnover 較高。這提醒:sparse Sharpe 在小資產池、粗糙估計下,不會自動變魔法。
## 4.2 年度報酬
| year | SPY buy-and-hold | Monthly equal weight | Trend inverse-vol proxy | Sparse tangent proxy |
|---:|---:|---:|---:|---:|
| 2018 | -5.25 | -2.02 | -2.02 | -5.25 |
| 2019 | 31.22 | 21.03 | 15.61 | 15.19 |
| 2020 | 18.33 | 18.96 | 17.11 | 12.97 |
| 2021 | 28.73 | 9.99 | 5.80 | 9.18 |
| 2022 | -18.18 | -15.39 | 1.78 | 1.99 |
| 2023 | 26.18 | 18.13 | 10.63 | 7.27 |
| 2024 | 24.89 | 14.53 | 11.98 | 16.13 |
| 2025 | 17.72 | 16.52 | 11.86 | 16.30 |
| 2026 YTD | 9.64 | 7.67 | 3.34 | 10.21 |
【解讀】
2022 是最有資訊量的一年:SPY -18.18%,等權 -15.39%,但 Trend inverse-vol 與 Sparse tangent proxy 都小幅正報酬。這表示 risk-control / trend filter 的核心價值是在熊市與升息壓力期保命,而不是在 2021 或 2023 這種強多頭衝最快。
## 4.3 期末權重
| strategy | SPY | QQQ | IWM | TLT | GLD | HYG | UUP |
|---|---:|---:|---:|---:|---:|---:|---:|
| SPY buy-and-hold | 100.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
| Monthly equal weight | 14.3 | 14.3 | 14.4 | 14.3 | 14.1 | 14.3 | 14.3 |
| Trend inverse-vol proxy | 12.6 | 9.6 | 8.6 | 0.0 | 6.6 | 32.5 | 30.1 |
| Sparse tangent proxy | 43.7 | 36.1 | 20.2 | 0.0 | 0.0 | 0.0 | 0.0 |
【解讀】
- Trend inverse-vol proxy 的期末配置偏 HYG / UUP,表示在當下規則中,低波動與趨勢條件讓風險資產權重被壓低。
- Sparse tangent proxy 集中在 SPY / QQQ / IWM,這比較像「風險資產 momentum 延伸」,不是真正防守策略。
---
# 5. 對四個研究方向的實務判斷
## A. JEPA market state:可研究,但先不要急著交易
【狀態】未找到公開精確論文,因此不納入本文實證。
【如果要做】我會先拿它做 regime encoder,不直接拿來下單。驗證重點是:embedding 是否能提前或同步辨識 volatility spike、correlation breakdown、breadth deterioration,而不是只重現 VIX。
## B. Signature / Portfolio Transformer:真正價值在風控 objective
【狀態】有公開來源。
【本文 proxy 結果】Trend inverse-vol proxy 顯示:如果把目標放在 CVaR / drawdown control,確實可以顯著降低最大回撤;但代價是犧牲多頭市場報酬。
【實務意義】這類模型比較適合:
- 多資產配置;
- 風控 overlay;
- 退休 / family office / 低回撤目標;
- 不是純粹追求打敗 QQQ 的 aggressive strategy。
## C. Merger-arbitrage LLM:不要用 ETF proxy 硬測
【狀態】未找到公開精確論文。
【原因】M&A arbitrage 的資料單位是 deal,不是 daily ETF price。需要 deal announcement、deal terms、regulatory status、spread、completion / break outcome。沒有乾淨 deal database,用 ETF 回測沒有意義。
## D. Sparse tangent / sparse Sharpe:數學漂亮,但估計誤差是敵人
【狀態】有相關公開來源。
【本文 proxy 結果】Sparse tangent proxy 沒有明顯打敗等權,且 turnover 更高。
【解讀】這不是否定 sparse Sharpe,而是提醒:mean / covariance estimation 很脆弱。若要在台股或美股個股實作,必須加上:
- shrinkage covariance;
- liquidity filter;
- turnover penalty;
- sector cap;
- walk-forward validation;
- transaction cost sensitivity。
---
# 6. 下一步:如果要做成真正研究系統
我會分三階段:
1. **先做 baseline suite**:SPY、等權、risk parity、trend inverse-vol、sparse Sharpe。
2. **再做台股 / 美股 universe**:加入流動性、產業限制、交易成本、稅制。
3. **最後才上神經網路**:Transformer / JEPA 必須打敗上述 baseline,否則只是把 overfit 包裝得比較高級。
【關鍵判準】不是 in-sample Sharpe,而是:
- walk-forward CAGR;
- max drawdown;
- turnover-adjusted return;
- 2020 / 2022 / 2025-2026 各市場 regime 表現;
- 是否能在不同 universe 上維持方向一致。
---
# 7. 可重現資料
本次輸出檔:
- [proxy_backtest_metrics.csv](../../assets/quant-research/quant-paper-proxy-backtest/proxy_backtest_metrics.csv)
- [proxy_backtest_yearly_returns.csv](../../assets/quant-research/quant-paper-proxy-backtest/proxy_backtest_yearly_returns.csv)
- [proxy_backtest_equity.csv](../../assets/quant-research/quant-paper-proxy-backtest/proxy_backtest_equity.csv)
- [proxy_latest_weights.csv](../../assets/quant-research/quant-paper-proxy-backtest/proxy_latest_weights.csv)
- [yahoo_adjusted_close.csv](../../assets/quant-research/quant-paper-proxy-backtest/yahoo_adjusted_close.csv)
回測腳本:`scripts/quant_paper_backtest.py`
---
# 來源
1. Yoontae Hwang, Stefan Zohren, *Signature-Informed Transformer for Asset Allocation*, arXiv:2510.03129. <https://arxiv.org/abs/2510.03129>
2. Damian Kisiel, Denise Gorse, *Portfolio Transformer for Attention-Based Asset Allocation*, arXiv:2206.03246. <https://arxiv.org/abs/2206.03246>
3. Yizun Lin, Zhao-Rong Lai, Cheng Li, *A Globally Optimal Portfolio for m-Sparse Sharpe Ratio Maximization*, arXiv:2410.21100. <https://arxiv.org/abs/2410.21100>
4. *Sparse tangent portfolio selection via semi-definite relaxation*, Operations Research Letters. DOI: 10.1016/j.orl.2016.05.012. <https://doi.org/10.1016/j.orl.2016.05.012>
5. Yahoo Finance chart API, adjusted close data for SPY / QQQ / IWM / TLT / GLD / HYG / UUP, downloaded 2026-05-26. Example endpoint pattern: <https://query1.finance.yahoo.com/v8/finance/chart/SPY>
---
# Tags
量化研究、asset allocation、Transformer、Sharpe Ratio、backtest