申請書討論 - HackMD

###### tags: `畢專` # 申請書討論 **線上申請截止日設為110年2月19日中午12：00** ## 2/1 題目討論 * 運用深度學習預測資產之定價 - [name=UsePerson] * 應用深度學習預測未來資產定價之研究 - [name=Cash Lu] * 使用深度學習分析資產的合理定價 - [name=HJackH] ## 1. 摘要 ## 2. 研究動機與研究問題 * ## 3. 文獻回顧與探討 ### Listening to Chaotic Whispers: A Deep Learning Framework for News-oriented Stock Trend Prediction[1] * 透過文本分析的方式，讓機器來模仿人類在判讀新聞時的思考方式： 1. 分析一連串的新聞，而不是單獨的分析每一個新聞 2. 辨別新聞的重要性 3. 先了解資訊較多的股票，再去學習資訊較少的股票 > * 因此他們設計了 Hybrid Attention Networks(HAN) 是他們設計的模型，這個模型的輸入是一支股票的好幾天好幾則的相關新聞，然後會經過 word embedding layer 所使用的是事先訓練好的Word2Vec，算出某一天某一則新聞的重要性， > * 在news level layer 會根據算出來的新聞的重要性給它更大的關注，接著將該天所有新聞相加得到一天的總重要性， > * 在 sequential modeling layer 會透過 bi-GRU結合過去和未來的訊息來調整該天的總重要性， > * 接著根據重要性給叫重要的天數更多關注，將每一天的重要性相加之後可以得到這支股票在每個時間每個新聞對他的評價， > * 最後會根據評價得出這支股票接下來是漲、跌或是平。 > * ![](https://i.imgur.com/UZiD7dq.png) >> ![](https://i.imgur.com/BaMmuaE.png) ### Autoencoder asset pricing models[2] * 在 [KPS](https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3032013) 的論文中證明資產的某些特徵可以拿來預測收益 * 他們以 KPS 的研究為基礎，提出了一種基於 autoencoder 的資產定價模型 * 以 autoencoder 找出對於資產收益關聯性較高的資產特徵 * 比起 KPS 的線性模型，他們的非線性模型更加有彈性 * 利用 autoencoder 將資產收益降維成因子，使這些因子能夠跟資產特徵交互作用 > 此模型主要由兩個部分組成: > 1. beta model > * 輸入為 $t - 1$ 時間的各個資產的特徵 > * 輸出為 $\beta_{t - 1}$ > * 用來將資產特徵降維 > 2. factor model > * 輸入 $t$ 各個資產的收益或投資組合 > * 輸出為 $f_t$ > * 用來將資產收益降維 > * 最後將 beta model 和 factor model 的輸出做 dot product 得出最後的結果為預測的資產收益 ($\beta_{t - 1}f_t$) > ![](https://i.imgur.com/ZxTXEP8.jpg) ### Deep Learning in Asset Pricing[3] * 透過分析SDF(stochastic discount factor, 隨機貼現因數)來解釋每個資產的預期報酬率。 * 關鍵的創新: 把基礎無套利的條件作為標準函數並運用在neural network algorithm中，用一種對抗的方法來建構信息最豐富的測試資產，並從許多宏觀經濟的時間序列中提取經濟狀況。由於在有效市場中資產收益似乎是被不可預知的消息所支配，所以很難用現成的方法預測風險溢價。因此他們通過整合經濟結構來構建更好的機器學習估計器。 * 在學習演算法中，用無套利的限制大幅改善風險溢價信號且更能解釋單個股票的收益 ## 4. 研究方法及步驟 ### Sigmoid function * 將任何變量映射到 [0,1] 之間，通常被用來當作機器學習領域 (Machine Learning) 神經網路的激活函數 (Activation Function)。 > * ![](https://i.imgur.com/pvwwz02.png) https://clay-atlas.com/blog/2019/10/19/machine-learning-chinese-sigmoid-function/ ### Softmax function * Softmax函式實際上是有限項離散機率分布的梯度對數歸一化。多項線性判別分析，樸素貝葉斯分類器和人工神經網路等的多種基於機率的多分類問題方法中都有著廣泛應用。特別地，在多項邏輯迴歸和線性判別分析中，函式的輸入是從K個不同的線性函式得到的結果，而樣本向量 x 屬於第 j 個分類的機率為： ![](https://i.imgur.com/VPQIi0Q.png) > * ![](https://i.imgur.com/ch4Y4JG.png) https://zh.wikipedia.org/zh-tw/Softmax%E5%87%BD%E6%95%B0 ### Word2Vec * 用來產生詞向量的相關模型。這些模型為淺層雙層的神經網路，用來訓練以重新建構語言學之詞文本。網路以詞表現，並且需猜測相鄰位置的輸入詞，在word2vec中詞袋模型假設下，詞的順序是不重要的。 * 訓練完成之後，word2vec模型可以把每個詞映射到一個向量，來表示詞與詞之間的關係。該向量為神經網路的隱藏層。 https://zh.wikipedia.org/wiki/Word2vec ### GRU * 和 LSTM 很像，是 RNN 的一種可以記憶不動時間長度的數值，有 input gate、output gate、update gate、reset gate 可以用來決定要記住多少過去的資訊和採用多少現在的資訊，相較於LSTM 有較少的參數，因此所需花費的時間也較少 > ![](https://img-blog.csdnimg.cn/20190224220747594.png) https://en.wikipedia.org/wiki/Gated_recurrent_unit https://www.kaggle.com/thebrownviking20/intro-to-recurrent-neural-networks-lstm-gru ## 5. 預期結果 ## 6. 參考文獻 --- # 想法 * 使用非監督式學習分群演算法(看漲or看跌)，再加上時間序列概念，輸出每個行業別在指定時間內的趨勢(如1個月內紡織業看漲，3個月內食品業看跌之類的) * 使用 CNN （的 convolution layer）來計算**單一股票的時間相關性** 和 **各股之間的相關性** > 有意思 *