---
title: Project19
tags: teach:MF
---
# ML and FinTech: Project by 李彥璋
---
#### keyword: machine learning, Fama-French ,three-factor model
## Motivations (Talk 1)
1.利用Fama-French 三因子模型的參數做投資組合.改進策略並相比傳統的線性回歸建模, 看對報酬是不是有更好的利潤.
2.原論文是根據firm size和BM將股票拆成25個portfolio.有足夠時間的話嘗試是否可以應用到個股報酬的解釋上.

---
## EDA (Talk 2)
1.對證交所的網頁進行爬蟲來獲得日股價資料和公司的季基本資料.


2.實作market return,firm size,BM, SMB,HML,的敘述性統計,相關性分析(Heatmap)和統計分布圖分析
3.利用線性回歸的三因子模型做股票投資組合分析
4.針對三因子模型做策略改進
## Problem formulation (Talk 3)

## Analysis (Talk 4)
note:insample & out-sample comparision
模型假設:
1.資料時間20120101-20210801
2.交易時間2014-2021.7
3.取樣大陸代號前1000檔的股票
4.根據前260天的資料來計算SMB,HML. Rm-rf是用單日數據
5.因子載荷是根據前120天的資料迴歸而來
6.每20日調整投資組合一次(考慮交易成本)
這邊只列出前30檔股票的相關係數

這邊列出計算得出來的市場風險溢酬, 公司規模溢酬, BM溢酬 的描述性統計

市場風險隨時間的變化

公司規模溢酬隨時間的變化

BM溢酬隨時間的變化

市場風險溢酬,公司規模溢酬和BM溢酬的數值分布直方圖

市場風險,公司規模溢酬和BM溢酬間的相關係數

策略一:選取回歸報酬和alpha的前5%和後5%作投資組合
PS:bull_profit和bear_profit是根據回歸報酬分組
PS:bull_profit2和bear_profit2是根據alpha大小分組
圖一

策略二:
bull_profitx和bear_profitx選取20日實際累積報酬和回歸累積報酬的排名差值排名差值的前5%和後5%作排列組合
bull_profitx和bear_profitx選取20日實際累積報酬和回歸累積alpha的排名差值排名差值的前5%和後5%作排列組合
圖二

策略三:
加上一個條件就是多單的標的必須是負偏離季線最多的10%.反之空單亦然.
圖三

策略四:買進負偏離季線的100檔股票和賣出正乖離季線100檔的股票
圖四

## Conclusion (Talk 4)
0.SMB,HML並無顯著在零以上,可能也是模型效率不高的原因.
1.Fama-French模型是要解釋是當下的報酬, 而不是未來的報酬
2.2019後三因子模型策略的效率下降, 甚至逆轉
3.回歸報酬不代表市場會按照此路線前進, 當市場實際走向和回歸方向差很多時, 可預期有的收斂. 因此在策略三中加入一個多單必須在負乖離很大時才進場, 能有效幫助策略.
4.策略三篩選出來的投組, 也有可能是模型失準的一群, 需要進一步檢驗.
5.比較圖三和圖四,策略三對空單比較有效
## Future development (Talk 5)
1.考慮'Asset Pricing Models and Financial Market Anomalies
,Doron Avramov,Tarun Chordia, 2006 這篇論文加入總經因子並對alpha和beta向加上動態修正.
2.對不同產業做分組計算
3.因子載荷的穩定性是否可以找出更符合預期的投組.
4.是否對SMB, HML做擇時篩選.
---
---