2026 量化論文筆記：可驗證來源與可回測 proxy

--- title: "2026 量化論文筆記：可驗證來源與可回測 proxy" date: 2026-05-26 category: quant-research tags: ["量化研究", "asset allocation", "Transformer", "Sharpe Ratio", "backtest"] hackmd_url: "https://hackmd.io/@no0mTG4DTVi61wHzNybh_Q/BJ5jDAzlGx" description: "把目前可找到公開來源的量化資產配置論文整理成研究筆記，並用可重現的 ETF proxy 回測比較 direct allocation、risk-control 與 sparse Sharpe 思路。" --- > 更新時間：2026-05-26 16:05 CST > 定位：研究筆記 / proxy backtest，不是買賣建議。這篇只把「目前可找到公開來源」的論文納入；未找到公開來源的標題先不當成已發表事實。 # 一句話結論【判斷】這批量化 AI 論文真正值得追的是同一個方向：**不要只把 ML 拿來預測價格，而是讓模型直接學 portfolio decision / risk objective**。但用簡化 proxy 回測後，結果也提醒一件事：**降低風險比提高報酬容易；要打敗 SPY 的長期總報酬很難。** 本次 proxy 回測中： - **SPY buy-and-hold** 總報酬最高：2018-01-02 至 2026-05-22 成長 **3.15x**，CAGR **14.67%**，但最大回撤 **-33.72%**。 - **Trend inverse-vol proxy** 報酬較低：成長 **2.04x**，CAGR **8.91%**，但最大回撤只有 **-9.86%**，Sharpe_0rf **1.19**，是風險控制最強的版本。 - **Sparse tangent proxy** 成長 **2.19x**，CAGR **9.81%**，最大回撤 **-19.35%**；沒有明顯優於簡單等權。【解讀】如果目標是「長期資本成長」，SPY 仍是強 benchmark；如果目標是「降低 drawdown / CVaR」，risk-aware allocation 才有研究價值。 --- # 1. 來源查證：哪些標題目前有公開來源？ | 原始題目 / 相關論文 | 查證狀態 | 公開來源 | 本文處理方式 | |---|---:|---|---| | Joint-Embedding Predictive Learning of Latent Market States in U.S. Equities | 未找到精確公開論文 | — | 不納入正式回測，只保留為「regime encoder」研究方向 | | Signature-Informed Transformer for Asset Allocation | 找到精確 arXiv | arXiv: [2510.03129](https://arxiv.org/abs/2510.03129) | 納入，做 risk-aware direct allocation proxy | | Portfolio Transformer for Attention-Based Asset Allocation | 找到相關 arXiv | arXiv: [2206.03246](https://arxiv.org/abs/2206.03246) | 納入，作為 direct Sharpe optimization 的前序參考 | | Global Merger-Arbitrage Forecasting with Language Models | 未找到精確公開論文 | — | 不納入回測；M&A 需要 deal database，不適合用 ETF proxy 硬測 | | Decision-focused Sparse Tangent Portfolio Optimization | 未找到精確同名論文 | 相關：arXiv [2410.21100](https://arxiv.org/abs/2410.21100)、DOI [10.1016/j.orl.2016.05.012](https://doi.org/10.1016/j.orl.2016.05.012) | 納入 sparse tangent / sparse Sharpe proxy | --- # 2. 已有來源論文重點 ## 2.1 Signature-Informed Transformer for Asset Allocation 【來源】Yoontae Hwang, Stefan Zohren, *Signature-Informed Transformer for Asset Allocation*, arXiv:2510.03129v3，分類 cs.LG / cs.AI / q-fin.PM，初版 2025-10-03，更新 2026-01-22。來源：<https://arxiv.org/abs/2510.03129> 【事實】arXiv 摘要指出，傳統 deep learning asset allocation 常把 forecasting 與 optimization 分開，作者認為這會造成「prediction error 低，但 portfolio decision 不一定好」的 mismatch。論文提出 Signature-Informed Transformer，把 path signatures、特殊 attention module 與 direct policy learning 結合，並直接最小化 Conditional Value at Risk，讓訓練目標與金融風險目標更一致。【我的解讀】這篇的重點不是「Transformer 比 MA 更會預測價格」，而是： 1. feature extraction 與 allocation decision 合併； 2. objective 從 MSE / return forecast 換成 CVaR； 3. 模型被設計成看資產之間的幾何關係，而不是單一資產時間序列。【可疑點】金融資料低訊噪，Transformer 容易過擬合；若 turnover、交易成本、universe selection、survivorship bias 沒嚴格處理，漂亮結果不一定能實盤。 ## 2.2 Portfolio Transformer for Attention-Based Asset Allocation 【來源】Damian Kisiel, Denise Gorse, *Portfolio Transformer for Attention-Based Asset Allocation*, arXiv:2206.03246。來源：<https://arxiv.org/abs/2206.03246> 【事實】arXiv 摘要表示，傳統流程是 returns forecasting 後再 optimization；Portfolio Transformer 則試圖繞過報酬預測，直接最佳化 Sharpe ratio，作為 end-to-end portfolio optimization framework。【我的解讀】這是 #2 的前序精神：**不要先預測報酬再丟 optimizer，而是讓模型直接對 portfolio performance 負責。** ## 2.3 Sparse Sharpe / Sparse Tangent Portfolio 【來源 1】Yizun Lin, Zhao-Rong Lai, Cheng Li, *A Globally Optimal Portfolio for m-Sparse Sharpe Ratio Maximization*, arXiv:2410.21100。來源：<https://arxiv.org/abs/2410.21100> 【來源 2】*Sparse tangent portfolio selection via semi-definite relaxation*, Operations Research Letters, DOI: 10.1016/j.orl.2016.05.012。來源：<https://doi.org/10.1016/j.orl.2016.05.012> 【事實】arXiv:2410.21100 摘要指出，現代投組管理可能需要 m-sparse portfolio，也就是最多只持有 m 個活躍資產，以降低管理與交易成本；但 Sharpe ratio + sparsity constraint 因為非凸與稀疏限制而困難。該文將 m-sparse fractional optimization 轉換成等價的 m-sparse quadratic programming problem，並提出 proximal gradient algorithm。【我的解讀】這條線比單純 AI 更接近實務：不是要持有 500 個權重很漂亮但沒法執行的資產，而是要在可管理的持倉數內，把風險調整後報酬做出來。 --- # 3. Proxy 回測設計這次沒有重做原論文模型；原因是： 1. Signature-Informed Transformer 需要完整訓練 pipeline、path signature feature、CVaR loss 與原始 universe 設定。 2. Portfolio Transformer 需要神經網路架構與訓練資料切分。 3. Sparse Sharpe 需要更嚴格 optimizer；本文只做「可解釋、可重現」的近似版本。因此本文做的是 **proxy backtest**：用簡化規則模擬論文思想，而不是宣稱復現論文。 ## 資料與假設【資料來源】Yahoo Finance chart API adjusted close。下載檔保存在本地：`assets/quant-research/quant-paper-proxy-backtest/yahoo_adjusted_close.csv`。【回測區間】2018-01-02 至 2026-05-22，共 2109 個交易日。【資產池】 - SPY：S&P 500 ETF - QQQ：Nasdaq 100 ETF - IWM：Russell 2000 ETF - TLT：20Y Treasury ETF - GLD：Gold ETF - HYG：High-yield bond ETF - UUP：US Dollar ETF 【交易假設】 - 月底再平衡。 - 使用 adjusted close。 - 每次單邊 turnover 成本 5 bps。 - 不含稅，不含借券 / 放空，不含股息稅差異。 - 現金部位報酬假設為 0%。 ## 策略定義 | 策略 | 對應研究概念 | 實作 proxy | |---|---|---| | SPY buy-and-hold | benchmark | 100% SPY，買入持有 | | Monthly equal weight | naive diversified baseline | 7 個 ETF 每月等權再平衡 | | Trend inverse-vol proxy | Signature / CVaR / risk-control 思路 | 僅持有價格高於 200 日均線的資產，權重按 63 日 realized volatility 反比配置 | | Sparse tangent proxy | sparse Sharpe / tangent portfolio 思路 | 每月用過去 252 日估計 mean / covariance，選 trailing Sharpe 前 3 名，再用 shrinkage covariance 做 long-only tangent-like weighting | --- # 4. 回測結果 ## 4.1 總表 | strategy | final_growth_x | total_return_pct | cagr_pct | ann_vol_pct | sharpe_0rf | max_drawdown_pct | worst_month_pct | positive_month_pct | avg_annual_turnover_x | rebalance_count | |---|---:|---:|---:|---:|---:|---:|---:|---:|---:|---:| | SPY buy-and-hold | 3.15 | 215.04 | 14.67 | 19.23 | 0.76 | -33.72 | -12.49 | 67.00 | 0.12 | 1 | | Monthly equal weight | 2.23 | 122.69 | 10.02 | 10.42 | 0.96 | -18.79 | -6.23 | 65.00 | 0.45 | 102 | | Trend inverse-vol proxy | 2.04 | 104.47 | 8.91 | 7.51 | 1.19 | -9.86 | -3.83 | 68.00 | 4.12 | 97 | | Sparse tangent proxy | 2.19 | 119.15 | 9.81 | 10.86 | 0.90 | -19.35 | -8.80 | 67.00 | 5.30 | 90 | 【解讀】 - SPY 仍然是最難打敗的總報酬 benchmark。 - Trend inverse-vol proxy 不是報酬最高，但 drawdown 壓得最漂亮；這比較符合「CVaR / risk-aware allocation」的研究價值。 - Sparse tangent proxy 沒有打敗等權太多，且 turnover 較高。這提醒：sparse Sharpe 在小資產池、粗糙估計下，不會自動變魔法。 ## 4.2 年度報酬 | year | SPY buy-and-hold | Monthly equal weight | Trend inverse-vol proxy | Sparse tangent proxy | |---:|---:|---:|---:|---:| | 2018 | -5.25 | -2.02 | -2.02 | -5.25 | | 2019 | 31.22 | 21.03 | 15.61 | 15.19 | | 2020 | 18.33 | 18.96 | 17.11 | 12.97 | | 2021 | 28.73 | 9.99 | 5.80 | 9.18 | | 2022 | -18.18 | -15.39 | 1.78 | 1.99 | | 2023 | 26.18 | 18.13 | 10.63 | 7.27 | | 2024 | 24.89 | 14.53 | 11.98 | 16.13 | | 2025 | 17.72 | 16.52 | 11.86 | 16.30 | | 2026 YTD | 9.64 | 7.67 | 3.34 | 10.21 | 【解讀】 2022 是最有資訊量的一年：SPY -18.18%，等權 -15.39%，但 Trend inverse-vol 與 Sparse tangent proxy 都小幅正報酬。這表示 risk-control / trend filter 的核心價值是在熊市與升息壓力期保命，而不是在 2021 或 2023 這種強多頭衝最快。 ## 4.3 期末權重 | strategy | SPY | QQQ | IWM | TLT | GLD | HYG | UUP | |---|---:|---:|---:|---:|---:|---:|---:| | SPY buy-and-hold | 100.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | | Monthly equal weight | 14.3 | 14.3 | 14.4 | 14.3 | 14.1 | 14.3 | 14.3 | | Trend inverse-vol proxy | 12.6 | 9.6 | 8.6 | 0.0 | 6.6 | 32.5 | 30.1 | | Sparse tangent proxy | 43.7 | 36.1 | 20.2 | 0.0 | 0.0 | 0.0 | 0.0 | 【解讀】 - Trend inverse-vol proxy 的期末配置偏 HYG / UUP，表示在當下規則中，低波動與趨勢條件讓風險資產權重被壓低。 - Sparse tangent proxy 集中在 SPY / QQQ / IWM，這比較像「風險資產 momentum 延伸」，不是真正防守策略。 --- # 5. 對四個研究方向的實務判斷 ## A. JEPA market state：可研究，但先不要急著交易【狀態】未找到公開精確論文，因此不納入本文實證。【如果要做】我會先拿它做 regime encoder，不直接拿來下單。驗證重點是：embedding 是否能提前或同步辨識 volatility spike、correlation breakdown、breadth deterioration，而不是只重現 VIX。 ## B. Signature / Portfolio Transformer：真正價值在風控 objective 【狀態】有公開來源。【本文 proxy 結果】Trend inverse-vol proxy 顯示：如果把目標放在 CVaR / drawdown control，確實可以顯著降低最大回撤；但代價是犧牲多頭市場報酬。【實務意義】這類模型比較適合： - 多資產配置； - 風控 overlay； - 退休 / family office / 低回撤目標； - 不是純粹追求打敗 QQQ 的 aggressive strategy。 ## C. Merger-arbitrage LLM：不要用 ETF proxy 硬測【狀態】未找到公開精確論文。【原因】M&A arbitrage 的資料單位是 deal，不是 daily ETF price。需要 deal announcement、deal terms、regulatory status、spread、completion / break outcome。沒有乾淨 deal database，用 ETF 回測沒有意義。 ## D. Sparse tangent / sparse Sharpe：數學漂亮，但估計誤差是敵人【狀態】有相關公開來源。【本文 proxy 結果】Sparse tangent proxy 沒有明顯打敗等權，且 turnover 更高。【解讀】這不是否定 sparse Sharpe，而是提醒：mean / covariance estimation 很脆弱。若要在台股或美股個股實作，必須加上： - shrinkage covariance； - liquidity filter； - turnover penalty； - sector cap； - walk-forward validation； - transaction cost sensitivity。 --- # 6. 下一步：如果要做成真正研究系統我會分三階段： 1. **先做 baseline suite**：SPY、等權、risk parity、trend inverse-vol、sparse Sharpe。 2. **再做台股 / 美股 universe**：加入流動性、產業限制、交易成本、稅制。 3. **最後才上神經網路**：Transformer / JEPA 必須打敗上述 baseline，否則只是把 overfit 包裝得比較高級。【關鍵判準】不是 in-sample Sharpe，而是： - walk-forward CAGR； - max drawdown； - turnover-adjusted return； - 2020 / 2022 / 2025-2026 各市場 regime 表現； - 是否能在不同 universe 上維持方向一致。 --- # 7. 可重現資料本次輸出檔： - [proxy_backtest_metrics.csv](../../assets/quant-research/quant-paper-proxy-backtest/proxy_backtest_metrics.csv) - [proxy_backtest_yearly_returns.csv](../../assets/quant-research/quant-paper-proxy-backtest/proxy_backtest_yearly_returns.csv) - [proxy_backtest_equity.csv](../../assets/quant-research/quant-paper-proxy-backtest/proxy_backtest_equity.csv) - [proxy_latest_weights.csv](../../assets/quant-research/quant-paper-proxy-backtest/proxy_latest_weights.csv) - [yahoo_adjusted_close.csv](../../assets/quant-research/quant-paper-proxy-backtest/yahoo_adjusted_close.csv) 回測腳本：`scripts/quant_paper_backtest.py` --- # 來源 1. Yoontae Hwang, Stefan Zohren, *Signature-Informed Transformer for Asset Allocation*, arXiv:2510.03129. <https://arxiv.org/abs/2510.03129> 2. Damian Kisiel, Denise Gorse, *Portfolio Transformer for Attention-Based Asset Allocation*, arXiv:2206.03246. <https://arxiv.org/abs/2206.03246> 3. Yizun Lin, Zhao-Rong Lai, Cheng Li, *A Globally Optimal Portfolio for m-Sparse Sharpe Ratio Maximization*, arXiv:2410.21100. <https://arxiv.org/abs/2410.21100> 4. *Sparse tangent portfolio selection via semi-definite relaxation*, Operations Research Letters. DOI: 10.1016/j.orl.2016.05.012. <https://doi.org/10.1016/j.orl.2016.05.012> 5. Yahoo Finance chart API, adjusted close data for SPY / QQQ / IWM / TLT / GLD / HYG / UUP, downloaded 2026-05-26. Example endpoint pattern: <https://query1.finance.yahoo.com/v8/finance/chart/SPY> --- # Tags 量化研究、asset allocation、Transformer、Sharpe Ratio、backtest