Algorithmic Financial Trading with Deep Convolutional NeuralNetworks: Time Series to Image Conversion Approach

# Abstract - 金融交易系統的計算智能技術一直非常受歡迎。在過去的十年中，深度學習模型開始受到更多關注，尤其是在圖像處理社區中。在這項研究中，我們提出了一種新的算法交易模型CNN-TA，該模型使用基於圖像處理特性的二維卷積神經網絡。為了將金融時間序列轉換為二維圖像，我們使用了15個不同的技術指標，每個指標都有不同的參數選擇。每個指標實例生成15天的數據。結果，構建了15x15大小的二維圖像。根據原始時間序列的高峰和低谷，將每個圖像標記為買入、賣出或持有。結果表明，與長期的Buy & Hold策略和其他常見交易系統相比，在長期的樣本外期間，訓練的模型為股票和ETF提供了更好的結果 # Introduction - 基於計算智能模型的股市預測已成為股票交易系統的一部分，持續了數十年。與此同時，對於個人投資者和交易者而言，出現了更多的金融工具，例如ETF、期權和槓桿系統（如外匯）。因此，基於自主智能決策模型的交易系統在全球各個金融市場上受到越來越多的關注 - 近年來，基於深度學習的預測/分類模型開始在各種應用中表現出色，超越了傳統的計算智能方法，如支持向量機（SVM）。然而，圖像處理和基於視覺的問題佔據了這些深度學習模型優於其他技術的應用類型[2]。在文獻中，深度學習方法開始出現在金融研究中。有一些深度學習技術的實施，如循環神經網絡（RNN）[3]、卷積神經網絡（CNN）[4]和長短期記憶（LSTM）[5]。特別是在金融預測模型中應用深度神經網絡的情況非常有限 - CNNs一直是最常見的深度學習模型[2]。與此同時，文獻中大多數CNN的實現是為了應對計算機視覺和圖像分析方面的挑戰。隨著CNN模型的成功實施，模型的錯誤率逐年下降。儘管AlexNet是最早提出的模型之一，但其成功率也只達到50-55%。近期的Inception（v3、v4）和ResNet（v50、v101、v152）算法的不同版本則取得了約75-80%的成功率[2]。現如今，幾乎所有計算機視覺研究人員都以某種方式在圖像分類問題中實施CNN - 在這項研究中，我們提出了一種新方法，將一維金融時間序列轉換為類似於2D圖像的數據表示，以便能夠利用深度卷積神經網絡的強大能力進行算法交易系統。為了得到這樣的表示，我們使用15種不同的技術指標實例，每種指標都具有不同的參數設置，每個指標在15天的時間跨度內表示該列的值。同樣地，x軸由每行每個特定技術指標的15天數據時間序列組成。同時，行的排序方式使得類似的指標被聚集在一起，以滿足沿y軸的局部性要求。結果生成了15x15像素大小的圖像，並將其餵入深度卷積神經網絡。據我們所知，將金融技術分析時間序列數據表示為2D並將其作為2D圖像分類的輸入，即CNN-TA模型，用於金融交易系統是一種新的方法，因為這種方法不僅在任何交易系統中從未使用過，而且在我們提出的方式下，也沒有在任何金融預測模型中使用過。性能評估表明，這種方法在長時間內表現出色。與Buy & Hold、基於常見技術指標的模型、最廣泛使用的神經網絡模型（即MLP）和最先進的深度學習時間序列預測模型（即LSTM）相比，所提出的模型在短期和長期的樣本外期間表現優異。儘管這可能是使用這種非傳統技術的首次嘗試之一，但我們相信所提出的模型具有潛力。此外，參數優化和模型微調可能進一步提高性能。 # 2. Related Work ## 2.1. Time Series Data Analytics - 時間序列預測應用於多個領域，例如風速預測、股價預測、電力需求預測、空氣中花粉濃度預測、人體活動識別預測、物聯網應用中的用戶行為預測等等 1. Arizmendi [14]在時間序列數據中使用了人工神經網絡（ANN）來預測大氣中的花粉濃度，並觀察到ANN的預測性能優於傳統方法 2. Srinivasan [15]使用了一個四層前饋神經網絡（ANN）來估計電力系統中的每小時電荷 3. Kaastra和Boyd [16]開發了一個八步驟的程序，其中包括ANN模型，用於預測金融和經濟時間序列數據 4. Bezerianos [21]使用基於徑向基函數的神經網絡（RBF）估計和評估脈搏變化 5. Li [22]使用反向傳播人工神經網絡（BPANN）和自回歸（AR）模型來估計高樓中難以用儀器測量的最高振動值 6. Guan [23]通過使用ANN分析人體腿部40個運動感測器獲得的數據，估計人體活動（跑步、步行、躺臥、跳躍等）的準確率達到97％ 7. Choi [24]在智能家居系統的學習部分中使用ANN 8. Mohandes [13]應用支持向量機（SVM）和多層感知器（MLP）於時間變化的風速數據並進行比較。在醫學領域 9. Morchen [19]使用自組織映射（SOM）來提取肌肉活動的模式並識別提取出的模式 ## 2.2. Financial Time Series Data Analytics - Cavalcante等人[1]在他們的調查中綜述了所有的預測模型方法，如ANN、SVM、混合機制、優化和集成方法 - Krollner等人[26]在不同的類別中回顧了基於機器學習的股市預測論文，如基於ANN的模型、進化和優化技術，以及多元/混合方法。大多數研究人員使用ANN模型來預測股市指數值[27]，[28] - Chen等人[29]提出了一個神經網絡模型，用於預測和交易臺灣股票指數 - Guresen等人[30]評估了神經網絡模型，特別是多層感知器（MLP）和動態ANN，以預測納斯達克股票指數 - Sezer等人[31]提出了一種ANN，使用金融技術分析指標（MACD、RSI、Williams％R）來預測道指股價轉折點 - Dhar等人[32]在他們的研究中使用了一個經典的三層MLP網絡，來估計印度證券交易所股票的收盤價。研究人員還研究了各種網絡參數的組合（輸入和隱藏層中的神經元數量、學習率），以找到最佳的MLP配置 - Vanstone等人[33]使用MLP創建了一個能夠為澳大利亞市場提供買入/賣出點的系統。基本分析數據（市盈率、帳面價值、股本回報率（ROE）和股息支付比率）被用作MLP的輸入 - 遺傳和演化方法也被用於預測股票價格和趨勢[34]，[35]。Kwon等人[36]提出了一個使用遺傳演算法優化的循環神經網絡（RNN）來預測股票價值的方法。他們在1992年至2004年期間對紐約證券交易所和納斯達克的36家公司進行了測試 - Sezer等人[37]提出了一種結合遺傳演算法優化的深度多層感知器（MLP）方法來預測道瓊斯30家公司的股票價格。在他們的研究中，使用遺傳演算法來確定RSI指標的參數（買入值、買入間隔、賣出值、賣出間隔）。最佳點被用作深度MLP的訓練數據集 - Evans等人[38]使用遺傳演算法來糾正預測誤差，並找到最佳的MLP網絡拓撲結構，以預測外匯（FOREX）數據 - Huang[39]使用遺傳演算法來優化支持向量回歸（SVR）的參數，並找到應該作為方法輸入的股票 - Pulido[40]使用粒子群優化（PSO）來預測墨西哥證券交易所的時間序列，用於MLP網絡結構參數（隱藏層數量和每層神經元數量及鏈接）的優化 - 還提出了混合機器學習模型來分析金融時間序列數據。Wang等人[41]提出了一種混合支持向量回歸（SVR）模型，該模型結合了主成分分析（PCA）和腦力風暴優化（BSO）來預測股票價格。在他們的方法中，選擇了20種不同的技術指標作為模型的輸入。在進行PCA和BSO處理後，對技術指標進行SVR分析 - Mabu等人[42]提出了一種結合MLP和基於規則的演化算法的集成學習機制，用於確定股票價格的買入/賣出點 - Ballings等人[43]比較了集成解決方案（隨機森林、AdaBoost和核函數工廠）和分類器模型（ANN、邏輯回歸、SVM和KNN）的性能，以估計市場股票的波動 ## 2.3. Deep Learning - 利用深度學習的神經網絡是一種特定類型的人工神經網絡 (ANN)，它由多個層次組成，在每一層中具有不同的貢獻，使整個網絡的性能優於其較淺層的對應模型 - 卷積神經網絡 (CNN)、循環神經網絡 (RNN)、深度置信網絡 (DBN)、受限玻爾茲曼機 (RBM) 和長短期記憶 (LSTM) 網絡。這些深度學習模型被用於不同的目的 1. CNN、DBN 和 RBM 主要用於圖像的分類和識別 2. RNN 和 LSTM 用於分析序列數據、自然語言處理、語音識別和時間序列數據分析 - 儘管近年來深度學習模型，特別是深度卷積神經網絡 (deep CNN)，一直是最受歡迎的選擇之一，但在金融問題上只有有限數量的深度神經網絡實現 - Ding 等人 [51] 提出了一種用於事件驅動的股市預測的深度學習方法，用於提取新聞文本、互聯網和報紙的信息。他們還使用深度 CNN 和神經張量網絡模擬情況對股價變動的短期和長期影響。他們使用標普500指數的歷史數據來測試模型 - Langkvist 等人 [52] 就 RBM、自編碼器、RNN、深度學習、卷積和池化以及隱馬可夫模型 (HMM) 進行了時間序列數據分析方法的綜述，同時在評估股票市場指數和價格方面也提到和綜述了深度學習方法 - Fischer 等人 [5] 使用 LSTM 預測標普500指數的股票趨勢方向，時間範圍為1992年至2015年 - Krauss 等人 [3] 在他們的研究中比較了深度神經網絡、梯度增強樹和隨機森林。他們使用深度神經網絡模型預測標普500指數的股票價格，時間範圍為1992年至2015年。 - 在文獻中，CNN 主要用於圖像分類/分析問題，並不常直接應用於時間序列數據分析。然而，相較於傳統模型，在計算機視覺領域的成功非常顯著。在金融時間序列預測中，近年來最常用的是深度學習算法，尤其是 RNN 和 LSTM 網絡。同時，算法交易系統主要依賴於技術分析指標和其他一些輸入。然而，在文獻中很少見到將技術分析數據與深度神經網絡相結合的模型。此外，將技術分析數據表示為 2D 矩陣，並應用於算法交易是一個新的方法。通過本研究，我們結合了技術分析數據和深度 CNN。所提出模型與其他方法的不同之處在於將技術分析數據應用於價格上，以創建特徵向量和矩陣（二維圖像），從而將金融時間序列預測問題隱含地轉化為圖像分類問題。本研究旨在開發能夠在中短期內進行金融預測的算法交易模型，以提供穩定的決策、最大的利潤和較低的風險（方差） # 3. Model Features and Convolutional Neural Network (CNN) - 在從金融數據中進行分析和開發推論模型時，有兩種廣泛採用的方法：技術分析和基本面分析 [1]。基本面分析可以通過檢查公司特定的財務數據，如資產負債表、現金流量表、資產回報率等來實施。與此同時，技術分析可以通過分析過去的金融時間序列數據使用數學和/或基於規則的建模方法來實施。有許多技術指標可用於預測金融資產的未來走勢。在我們的研究中，我們使用了15個不同的技術指標和不同的時間間隔。選擇的技術分析指標及其相應的公式在附錄中總結。 - CNN 是一種前饋型人工神經網絡，它以2D矩陣形式作為輸入。與像 MLP 這樣的全連接神經網絡不同，輸入向量（或矩陣）中的數據局部性很重要。因此，矩陣中的相鄰數據點應該仔細選擇。對於圖像分類問題，這不是個問題，因為前述要求可以直接滿足，因為相鄰像素在兩個方向上是相關的。 - CNN通常由兩種類型的層組成：卷積層和子取樣層。它的結構中連續地有卷積和取樣層。在卷積層中，應用卷積操作，將結果傳遞到下一層。在子取樣層中，減少參數數量和表示的空間尺寸。在最後的子取樣層中，數據變成一維向量。最後，最後一層連接到一個全連接的多層感知器（MLP）。通過這樣做，高層次的決策就像傳統分類器一樣執行。因此，CNN的前面幾層實際上進行了隱式的特徵提取。CNN在圖像和視頻識別、自然語言處理和專家系統等領域有廣泛的應用。CNN的一般結構如圖1所示[57]，[47]。 ![](https://hackmd.io/_uploads/SyeRxZ_Yn.png) # 4. Method - 對於我們的算法交易模型，我們提出了一種新的方法，使用卷積神經網絡（CNN）來確定股價中的「買入」和「賣出」點，並使用15個不同的技術指標與不同的時間間隔和參數選擇來創建每日股價時間序列的圖像。我們還使用Apache Spark、Keras和Tensorflow來創建和分析圖像，並進行大數據分析。如圖2所示，我們提出的方法分為五個主要步驟：數據集提取/轉換、標記數據、圖像創建、CNN分析和財務評估階段。我們的目標是確定與相關股價的時間序列中最佳的買入、賣出和持有點 ![](https://hackmd.io/_uploads/Sk_1ZWdFh.png) ## 4.1. Preprocessing (DataSet Extract/Transform) - Dow 30股票的每日股價和每日交易所交易基金（ETF）的價格是從finance.yahoo.com獲取的，用於訓練和測試的目的 - 股票/ETF價格在2002年1月1日至2017年1月1日期間用於訓練和測試的目的 - 我們採用了滑動窗口和重新訓練的方法，其中我們選擇了5年的訓練期和隨後的1年的測試期，即訓練期：2002年至2006年，測試期：2007年。然後，我們將訓練和測試期間都向前推進一年，重新訓練模型，並在接下來的一年進行測試，即訓練期：2003年至2007年，測試期：2008年。因此，從2007年到2016年的每一年都使用重複訓練進行測試 ![](https://hackmd.io/_uploads/r1rnm-OFn.png) ## 4.2. Labelling - 在標記階段中，提取了所需期間的數據後，所有的每日收盤價都通過在滑動窗口中確定頂點和底點來手動標記為“持有”、“買入”或“賣出”。底點被標記為“買入”，頂點被標記為“賣出”，其餘點被標記為“持有”。標記過程的結構如算法1所示 ![](https://hackmd.io/_uploads/BySs8Z_t2.png) ## 4.3. Image Creation - 在圖像創建階段中，對於每一天，使用TA4J（Java技術分析）庫計算不同間隔（6到20天）的RSI、Williams %R、WMA、EMA、SMA、HMA、Triple EMA、CCI、CMO、MACD、PPO、ROC、CMFI、DMI和PSI的值 - 這些特定指標主要是基於振盪器和趨勢的金融時間序列濾波器，通常被短期到中期交易者所偏好。由於我們研究中使用了6到20天的指標範圍，因此重點放在1周到1個月的擺動交易上。對於希望減少交易次數的模型，可以選擇不同的指標和更長的範圍 - 對於每一天，使用15個技術指標和15個不同的技術指標間隔生成一個15x15的圖像。同時，每個圖像使用與算法1中提供的滑動窗口邏輯相關聯的標籤（"持有"、"買入"或"賣出"）。指標的順序很重要，因為不同的順序會產生不同的圖像形式。為了提供一致且有意義的圖像表示，我們將指標分組（震盪器或趨勢）和表現相似的指標聚集在一起或靠近一起。圖4顯示了在圖像創建階段生成的示例15x15像素圖像 - 在我們的研究中，每個股票價格的訓練數據中大約有1250個圖像，涵蓋了5年的時間範圍。儘管從2007年到2016年，每一年都進行了單獨測試，但其結果被結合起來，並計算相應的年化指標以表示更長的測試期間。選擇了兩個長期測試期間，以驗證該模型在不同市場環境中的表現。為了驗證模型在10年時間跨度內的持久性，為第一個測試案例（2007年1月1日至2017年1月1日），每個股票價格生成了約2500個圖像。此外，為了覆蓋2008-2009年金融危機期間，第二個測試案例（2007年1月1日至2012年1月1日）使用了1250個測試圖像。對於每個股票和ETF，準備了不同的訓練和測試數據圖像文件，並對它們的不同特徵進行單獨評估。 ![](https://hackmd.io/_uploads/rJ6CvM_K2.png) - 在我們提出的CNN分析階段中，如圖5所示，使用了九個層次。它們分別是：輸入層（15x15）、兩個卷積層（15x15x32、15x15x64）、最大池化層（7x7x64）、兩個Dropout層（0.25、0.50）、全連接層（128）和輸出層（3）。Dropout層用於防止過擬合。在我們提出的CNN-TA中，使用3x3的濾波器大小進行CNN濾波。文獻中採用了不同大小的CNN濾波器：3x3、5x5和7x7。減小濾波器大小通常會捕捉到圖像更多的細節。3x3是圖像處理應用中最小且最常用的核心大小（AlexNet [45]）。使用3x3的濾波器大小可以在處理當前層時，獲得最接近鄰居（上、下、右、左、左上、右上、左下、右下）的信息；因此可以捕捉到圖像中的銳變。在我們的特定研究中，我們也選擇了3x3的濾波器大小，因為我們的圖像相對較小（15x15），而且圖像中可能存在顯著的強度變化（參見圖4） - 增加更多的層次會增加算法的複雜性。在沒有大型訓練集的情況下，越來越複雜的網絡很可能過度擬合，降低對測試數據的準確性。未來的工作中，可以在有更多訓練數據時配置更深的模型和更多的處理層次 - 在我們提出的CNN結構中，有不同的層次：卷積層、最大池化層、Dropout層和全連接MLP層。卷積層包含卷積操作。基本卷積操作如方程式1所示（t表示時間）。此外，卷積操作是在二維圖像上實現的。方程式2說明了二維圖像的卷積操作（I表示輸入圖像，K表示卷積核）。此外，連續的卷積和最大池化層構建了深度神經網絡結構。方程式3提供了有關神經網絡結構的細節（W表示權重，x表示輸入，b表示偏差）。在網絡的最後，使用softmax函數獲得輸出。方程式4顯示了softmax函數（y表示輸出）[59]。 ![](https://hackmd.io/_uploads/HJqIcG_Kh.png) - 在本研究中，我們使用Keras2、Tensorflow3基礎設施實現了CNN結構，每個測試運行持續200個epochs。通過在不同的測試中選擇不同的epochs數量來微調epochs的數量 ## 4.5. Financial Evaluation - 在最後一個步驟中，根據預測的買入、賣出和持有標籤進行買賣決策。根據相應的連續買賣配對，執行金融交易。這些交易被存儲在交易表中，並通過金融評估模型進行評估。金融評估的結果將在下一節中介紹，涉及所選的測試期間。算法2概述了提出的算法交易模型的概述。 ![](https://hackmd.io/_uploads/B18CqzOtn.png) # 5. Performance Evaluation - 我們對提出的CNN-TA模型的整體表現進行了兩個不同的評估標準：計算模型性能和金融評估。計算模型性能評估介紹了卷積神經網絡的性能，即分類器在區分買入、持有和賣出類別方面的表現。金融評估通過實施現實世界的金融場景來展示整個提出模型的表現。根據預測的標籤和實際股票價格，股票被買入、賣出或持有 ## 5.1. 測試數據 - 在金融評估階段，我們使用不同的時間段（2007年至2012年以分析2008年金融危機的影響，2007年至2017年以評估過去10年的表現）對ETF和道瓊斯30股進行了我們提出的方法（CNN-TA）的評估。我們的提出模型使用五年的訓練數據進行訓練，並使用一年的樣本外數據進行測試。然後，網絡使用接下來五年的訓練數據進行重新訓練（根據前一節的解釋，每次向前移動一年），並使用下一年的樣本外數據進行測試。表1顯示了選定的ETF及其描述。選擇的ETF交易量最高且具有足夠的訓練數據 ![](https://hackmd.io/_uploads/rJVTlmOY3.png) ## 5.2. 計算模型性能 - 分析了所提出模型的預測性能。儘管每個股票/ETF的表現被單獨考慮，但由於空間限制，僅呈現摘要結果。表2列出了Dow-30測試數據的混淆矩陣。表3顯示了通過混淆矩陣獲得的結果的性能評估，評估了“買入”類別和“賣出”類別的召回率。然而，“買入”和“賣出”類別的精確率較“持有”類別差。對於股票交易系統來說，準確的進出點（“買入”和“賣出”類別）對於交易算法的整體成功很重要。在我們的情況下，所提出的模型能夠正確捕捉到大多數的“買入”和“賣出”點。然而，也產生了許多錯誤的進出點。這主要是由於“買入”和“賣出”點出現的頻率比“持有”點少得多，神經網絡很難在不損害主導的“持有”值的整體分布的情況下捕捉到“罕見”的進出點。 ![](https://hackmd.io/_uploads/ryUufmut3.png) ![](https://hackmd.io/_uploads/HJ1YfXdth.png) - 換句話說，為了能夠捕捉到大部分的“買入”和“賣出”點（召回率），該模型在生成不存在的進出點時產生了一些誤報（精確率）。此外，“持有”點不像“買入”和“賣出”點（山峰和谷底）那麼明確。神經網絡很可能將一些“持有”點與“買入”和“賣出”點混淆，尤其是在滑動窗口的山頂或谷底附近。表2提供了Dow30測試數據的混淆矩陣，表3顯示了Dow30測試數據的混淆矩陣評估。表4提供了ETF測試數據的混淆矩陣，表5顯示了ETF測試數據的混淆矩陣評估。績效評估結果表明，ETF的結果（整體準確率）優於Dow30的結果。這可能是因為與股票相比，ETF更穩定，對事件、經濟危機和政治決策不太敏感，因此波動性較小。這種較低的波動性使得算法交易模型能夠在更穩定的環境中更容易地學習交易模型 ## 5.3. Financial Evaluation - 在我們的算法交易模型的最後一步，使用財務評估方法對生成的交易進行分析。在我們的模型中，每個股票根據預測的標籤進行買入、賣出或持有操作。如果預測的標籤是“買入”，則使用所有當前可用的資金（如果之前沒有買入的話）在該點買入股票。如果預測的標籤是“賣出”，則以當時的價格賣出股票（如果已經買入）。如果預測的標籤是“持有”，則在該點不採取任何操作。在財務交易中，如果連續出現相同的標籤，只有第一個標籤被激活並執行相應的交易。重複的標籤將被忽略，直到標籤發生變化。財務評估的起始資金為10,000美元，交易佣金為每筆交易1美元。財務評估情景如公式5所示（“S”表示財務評估情景，“tMoney”表示總資金，“#OfStocks”表示股票數量）。評估指標的相應公式（見表10和表11）列在公式6、7、8、9、10、11中。 ![](https://hackmd.io/_uploads/S1UnVmOK3.png) ## 5.4. Compared Models - 我們的提議模型也與“買入持有”策略（BaH）、RSI（14天，70-30）、SMA（50天）、LSTM和MLP迴歸方法進行了比較。每種方法、模型和策略都已實施，並進行了相關的財務計算情景分析。在“買入持有”策略中，股票在測試數據的開始時買入，在測試數據的結束時賣出。在RSI模型中，計算了測試數據中每天的RSI值。如果相應測試數據的RSI值小於30，則生成買入信號。如果相應測試數據的RSI值大於70，則生成賣出信號。在SMA模型中，計算了測試數據中每天的50天SMA值。如果相應測試數據大於50天SMA值，則生成買入信號；如果相應測試數據小於50天SMA值，則生成賣出信號。LSTM[5]和MLP迴歸[30]模型也在文獻中用於金融時間序列數據的分析。實施的LSTM模型由25個神經元組成（輸入層：1個神經元，隱藏層：25個神經元，輸出層：1個神經元，dropout：0.5，迭代：1000次，時間步長：240）[5]。實施的MLP是一個由4層組成的模型（層：1,10,5,1，dropout：0.5，迭代：200次，時間步長：100）[5]。 - 我們提出的方法（ETFs-2007-2017）的平均年化回報率為13.01%，成功交易的百分比為71.51%（表11），而BaH的平均年化回報率為4.63%，RSI模型的平均年化回報率為3.95%，SMA模型的平均年化回報率為2.81%，LSTM模型的平均年化回報率為6.22%，MLP迴歸的平均年化回報率為4.01%（表6）。我們提出的方法的平均年化回報率幾乎是BaH、RSI、SMA和MLP迴歸平均年化回報率的三倍 ![](https://hackmd.io/_uploads/BJ7THQuKn.png) - 我們提出的方法（ETFs-2007-2017）的平均年化回報率為13.01%，成功交易的百分比為71.51%（表11），而BaH的平均年化回報率為4.63%，RSI模型的平均年化回報率為3.95%，SMA模型的平均年化回報率為2.81%，LSTM模型的平均年化回報率為6.22%，MLP迴歸的平均年化回報率為4.01%（表6）。我們提出的方法的平均年化回報率幾乎是BaH、RSI、SMA和MLP迴歸平均年化回報率的三倍。同時，我們提出的模型和MLP迴歸是在10年的測試期間內所有ETF中唯一具有正回報的模型。與此同時，我們模型的年化回報率的標準差也很低，表明回報穩定且一致（表6）。圖6顯示了所選ETF的資本累積情況，我們將模型的表現與相應期間的買入持有策略進行了比較。其他ETF的表現結果也具有類似的特徵 ![](https://hackmd.io/_uploads/rJsHDQuK3.png) - 該方法還在2007年至2012年的測試期間內進行了測試並與其他上述模型進行了比較，這段時間正好是2008年至2009年的金融危機期間。股市在這段期間受到了重大打擊，很多股票/基金/ETF都出現了負回報。在該期間，我們提出的方法（ETFs-2007-2012）的平均年化回報率為13.17%，成功交易的百分比為71.44%（表11），而BaH的平均年化回報率為2.60%，RSI模型的平均年化回報率為-0.01%，SMA模型的平均年化回報率為1.30%，LSTM模型的平均年化回報率為8.44%，MLP迴歸的平均年化回報率為8.23%（表7）。在這個特定期間，我們提出的方法的平均年化回報率幾乎是BaH平均年化回報率的五倍。此外，在金融危機期間，我們提出的解決方案的平均年化回報率幾乎是LSTM和MLP迴歸平均年化回報率的1.5倍。與2007-2017年相比，年化回報的標準差在這個期間更高。然而，與其他模型相比，它仍然優於大多數模型（表7） ![](https://hackmd.io/_uploads/r1v5PXut3.png) ## 5.6. Dow30 Analysis - 正如前面提到的，我們提出的方法還在不同的時間段（2007年至2012年和2007年至2017年）對道瓊斯30種股票進行了評估。我們提出的方法（Dow30-2007-2017）的平均年化回報率為12.59%，成功交易的百分比為71.32%（表10），而BaH的平均年化回報率為10.47%，RSI模型的平均年化回報率為5.01%，SMA模型的平均年化回報率為3.78%，LSTM模型的平均年化回報率為6.48%，MLP迴歸的平均年化回報率為5.45%。對ETF的分析也適用於道瓊斯30種股票的表現，因為觀察到類似的結果。提出的模型在整體年化回報率方面表現最好，並具有相對較低的年化回報的標準差（表8）。圖7顯示了不同道瓊斯30種股票的提出模型資本累積情況。在每個情況下，模型的表現與相應的時間段內的買入持有進行比較。其他道瓊斯30種股票的表現結果也呈現類似的特徵。 ![](https://hackmd.io/_uploads/ryVMdQdK2.png) ![](https://hackmd.io/_uploads/B1DXO7dK2.png) - 此外，在金融危機期間，我們提出的方法（Dow30-2007-2012）的平均年化回報率為12.83%，成功交易的百分比為70.63%（表10），而BaH的平均年化回報率為6.98%，RSI模型的平均年化回報率為1.92%，SMA模型的平均年化回報率為0.75%，LSTM模型的平均年化回報率為10.82%，MLP迴歸的平均年化回報率為9.98%。此外，我們提出的解決方案在金融危機期間的平均年化回報率幾乎是BaH的兩倍。再次，提出的模型在保持方差較低的同時實現了最佳整體表現。這些結果表明，提出的解決方案比其他模型更穩定（表9）。 ![](https://hackmd.io/_uploads/rJNjuXuth.png) ## 5.7. Discussions - 在長期（例如10年）的時間內持續擊敗「買進持有」策略是具有挑戰性的。我們提出的方法（Dow30-2007-2012）在28支股票中有24支在樣本外測試期間的年化報酬率表現優於「買進持有」策略（表9）（在同一期間，Visa股票[V]的資料點不足，因此被忽略。此外，Dupont[DD]股票在finance.yahoo.com上的價格存在資料不一致性，因此未在分析中使用）。此外，我們提出的方法（ETF-2007-2012）在9種ETF中有9種在樣本外測試期間的年化報酬率優於「買進持有」策略（表7）。當分析表10和表11時，可以觀察到交易成功率在70-80%之間。因此，提出的模型生成的交易大多數時間都是成功的（有利可圖的）。由於樣本外測試期間選擇為10年，因此在這樣一個長時間內觀察到不同的市場狀況（如上升趨勢、下降趨勢、平穩）。但這些市場狀況的波動並未影響提出的模型的整體交易表現。因此，即使在市場環境惡化的情況下，該模型仍能產生良好的利潤。對於最常交易的ETF，提出的模型（ETF-2007-2017）在9次中有9次優於「買進持有」策略（表6），而對於Dow30股票，提出的模型（Dow30-2007-2017）在10年的時間跨度中有22次優於「買進持有」策略的表現（表8） ![](https://hackmd.io/_uploads/Bk_btQut2.png) ![](https://hackmd.io/_uploads/BJJGt7dtn.png) ![](https://hackmd.io/_uploads/By8fF7_Kn.png) ## 5.8. Statistical Significance Tests - 表10和表11中列出的統計顯著性測試結果表明，提出的模型在不同資產類別（Dow30股票或ETF）以及不同時間期間和不同市場狀況（2007-2012和2007-2017時間期間）下都不改變其行為。對於大多數評估指標，提出的模型表現出穩定且強健的運行特性。即使在不同市場狀況下，統計上並未觀察到提出的模型的交易表現存在顯著差異，但該模型在整體市場不處於上升趨勢時，比傳統交易模型（如買進持有、RSI、SMA、LSTM和MLP回歸）表現更好。 - 此外，在表10和表11中提供了一些交易摘要結果。這些結果不僅在ETF和Dow30股票之間保持一致，而且在不同市場狀況（2007-2012）和（2007-2017）期間也是如此。在所有情況下，交易數（AnT）在17到21之間，這表明該模型每3週進行一次交易（買進和賣出配對），這與技術分析的輸入解析度（6到20天）相一致。平均交易持續時間（L）也在7到9天之間，這表明還有9-14天的閑置時間，模型在現金上等待交易觸發（由閑置比率指示）。 - 此外，將提出的CNN-TA與買進持有、LSTM和MLP進行統計顯著性測試的結果列在表12和表13中。結果表明，對於Dow30股票和ETF，CNN-TA的交易表現在長期（2007-2017）明顯優於所有模型。對於2007-2012期間，結果是相似的，然而，只有在LSTM的情況下，CNN-TA的優勢並不顯著。 # 6. Conclusion - 在這項研究中，我們利用了2D深度卷積神經網絡模型，應用於金融股票市場數據和技術分析指標，以開發一個算法交易系統。在我們提出的解決方案中，我們分析了金融時間序列數據並將其轉換為2D圖像。在研究中，我們嘗試預測時間序列數值的進出點，並將其標記為"買入"、"賣出"和"持有"，以實現盈利交易。我們使用道瓊斯30指數的股票價格和ETF作為我們的金融時間序列數據。結果表明，這種新穎的方法在長時間的樣本外測試期間中表現出色，優於Buy & Hold和其他模型。在未來的工作中，我們將使用更多的ETF和股票來為深度學習模型創建更多的數據。我們還將分析所選指標之間的相關性，以創建更有意義的圖像，從而使學習模型能夠更好地關聯買入-賣出-持有信號並提供更具盈利性的交易模型。