owned this note changed 7 years ago
Linked with GitHub

人工智慧與財務分析 - 王淳恆

歡迎來到 https://hackmd.io/c/COSCUP2018 共筆

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

點擊本頁上方的 開始用 Markdown 一起寫筆記!
手機版請點選上方 按鈕展開議程列表。

請從這裡開始

講師

Andrew Wang

其實就是證券分析

20170802 獲利了結 重達-KY
+162.55%

人工智慧分析軟體 - 尋億股

http://www.findbillion.com/

股市分析研究報告

看財報的:

  • 營收成長率
  • 預估每股盈餘(EPS)
  • 目標價
  • 建議

尋億股的人工智慧

  1. 預估EPS
  2. 評估個股價值
  3. 判斷營收成長率

價值 vs. 價格

過去8粒400 = 價值
現在8粒100 = 價格
價值>價格 == 買
但股市價值不容易預估

首先要看財務報表
工程師看不懂 看了想睡覺

第一步要資料視覺化,看出趨勢向上向下

預估每股盈餘EPS

平均稅後淨利率
預估每股盈餘EPS = 近12個月營收*平均稅後淨利率/股本

機器學習的方法

  • 多變數回歸
    • 目前結合此方法與平均稅後淨利率
  • 隨機森林回歸法
  • xgboost
    • 未來嘗試的此法,此法結合回歸與決策樹的優點

預估價值(1)

  • 平均配息(常見)
  • 平均過去五年的現金股利

預估價值(2)

  • 預估EPS
  • 平均配息率 x 預估EPS = 預估最新配息

預估價值(3)

  • 本益比
  • 預估合理股價 = 過去平均本益比 x 預估EPS
  • 缺點
    • 公司未來成長趨快時會低估
    • 公司未來成長趨緩時會高估

預估價值(4)

  • 機器學習的方法

    • 決策樹找出適合本益比法的個股
  • 輸入 ROE, 成長率、配習率、目標價入決策樹計算

    • 特徵值從哪來?
    • 請從財務管理課本去找,資料太多了
    • 沒有財務背景的話會拿"價"、"量",後面會講缺點
  • 估不準的不要買

  • 1 - FDR= TP/(TP+TF)

  • FDR = 錯誤發現率

  • 建議買進時 (預估大於1),準確度要高

  • 沒買的漲了也沒差

人工智慧開發流程

  1. 下載資料(爬蟲與資料庫)
  2. 訓練資料與預估(統計/機器學習/人工智慧)
  3. 賺錢養家賠錢修正

下載資料

爬蟲

  • 取得網頁資料·
    • 爬蟲
      抓網頁資料 - 財報 股價 成交量 籌碼
      ETL(Extract Transform Load)
  • 萃取 Extract
  • 轉置 Transform
  • 載入 Load 至目的端(資料庫)的過程
    清資料
  • 資料很多錯誤,需要校正的地方

資料來源

  • 公開資訊觀測站
  • 台灣證卷交易所
  • 證卷櫃台買賣中心

人工智慧/統計分析等方法

統計(不算人工智慧)
回歸
決策樹/隨機森林
事後機率 (貝氏定理)
深度學習

事後機率 (貝氏定理)

全部股票40%會上漲
- p(A=股價上漲) = 0.4
全部股票25%股價低估
- p(B=股價低估) = 0.25
上漲的股票有50%是因為價值低估

依照貝氏定理可得 股價低估的股票中 80%曾上漲

任意選股會有4成交量0%賺到錢,透過價值分析賺錢機率變成80%

深度學習

LSTM 利用時間上的相關性

利用深度學習預估台積電股價
22天日開盤 高價 低價 收盤價 以及 成交量做隔日收盤的預估
看起來很好,但如果用同樣東西估計別的股票 會賠錢

過適 overfitting

訓練時參數過度貼近資料,造成不同資料時無法準確預估

處理 overfitting 的問題

Validation Data Set
好的模型是不同區間的資料都能適用
Traning Set = 50%
Validation Set = 20%
Test Set = 30%

假設台積電長期趨近向上,用這種Data訓練出來的Model,如果哪天突然 不上漲打平 或 下跌 就掛了
因為Model從來沒學過盤整或下跌

要怎樣在Model訓練過程中選最佳的點,避免Overfiting
參數調整過程中,要找到Validation最低點,才是最佳參數點
但大部分的人因為沒有Validation,所以都是在找training set的最低點,就會宣稱自己報酬非常好

市面上9成程式交易都是避免Overfiting
結果剛買來都會準 一陣子之後就不準了

造成都是用真金白銀在validation

一開始多頭績效驚人 (AI-Traders 2017/11/22)
11月中疊200點 損益超過-50%

大盤大多數都在盤整和上漲,看不出很差,但金融風暴才會大跌,一次就賠光,再也不更新也沒有model了

人工智慧投資股票實際上是模仿智慧
如果學巴菲特就是慢慢存錢

輔助人類的智慧 減少情緒的判斷

tags: COSCUP2018 data
Select a repo