--- title: 202109 Overview tags: teach:MF --- # 機器學習與金融科技 :::info 編輯者: 鄧惠文教授 財務金融研究所,國立陽明交通大學,教學使用請勿轉載。或有疏漏,歡迎留言分享。上次更新2021/11/1. ::: ## 金融科技 ### Fantancies from course participants 1. 沒有人的服務,冰冷的空間,悄悄的完成客戶想要的交易 ### 最新科技? |Type | Topic | Features| | ----|----|----| | Algorithm | AI| Machine learning, etc. | | Block Chain| 節點之間傳遞加密訊息,由*區塊*跟*鏈*組成, 藉由密碼學串接並保護內容的串聯紀錄, 分散式的分類帳, Pkc, 由密碼串接並保護內容, 雲端儲存, 點對點架構讓資料去中心化| | 硬體 | Cloud computing| | | 量子電腦 | ### 金融服務業? ## 例子 ![](https://i.imgur.com/L3svSVD.jpg) ### Portfolio management Predict return $y$ using explanatory variable $x_1,\ldots,x_p$. ![](https://i.imgur.com/GlZcIbs.jpg) :::info Markowitz 在 1952 年發表「分散投資」與「效率組合投資理論」等論文,第一次以嚴謹的數學工具,展示投資者在眾多風險資產中、如何構建最佳資產組合的方法,也因此成為「現代投資組合理論之父」。 初探markowitz的現代投資組合理論 https://reurl.cc/1ovzKD 資本資產定價模型 (CAPM) https://reurl.cc/oxRXYD ::: :::success [巴塞爾協定](https://www.moneydj.com/kmdj/wiki/wikiviewer.aspx?keyid=5fa34842-7319-4e7b-814a-15ed9c6f8aae) 1. Market Risk 2. Counterparty risk 3. Liquidity risk 巴塞爾協定起源於前聯邦德國赫爾斯塔銀行(Herstatt Bank)和美國的佛蘭克林國民銀行(Franklin National Bank)的倒閉,在這兩家國際著名銀行倒閉第二年,也就是1975年9月,第一個《巴塞爾協定》提出。該協定之核心內容是針對國際性銀行監管主體缺位的現實,提出了兩個基本之監管思想:任何銀行的國外機構全都不能逃避監管;母國和地主國應共同承擔相應職責。1988年7月,國際清算銀行下的巴塞爾銀行監理委員會(BCBS)對協定進行了首次實質性完善,並通過了《關於統一國際銀行的資本計算和資本標準的報告》(簡稱《巴塞爾報告》),以規範信用風險為主的國際準則,簡稱Basel I。報告的核心內容是資本分類,從資本標準及資本風險兩個方面對銀行提出明確要求,反映出監管思想的根本轉變。 巴塞爾委員會建議在1992年底之前,各會員國銀行的自有資本與風險性資產比例(資本適足率),不得低於8%。 資本適足率=自有資本/經風險係數調整之資產 自有資產=第一類資本+第二類資本+第三類資本; 風險係數調整之資產,該協定根據違約風險將銀行資產區分為四類。 ::: ### Algorithmic trading Similarly terms: statistical arbitrage, quantitative trading, AI trading. Which term you prefer? :heart: Predict return $y$ using explanatory variable $x_1,\ldots,x_p$. ![](https://i.imgur.com/ajbmels.jpg) :::info 文藝復興科技有限責任公司(英語:Renaissance Technologies LLC)是美國一家對沖基金公司,其專門從事利用數學和統計分析得出的定量模型進行系統交易。文藝復興科技公司由詹姆斯·西蒙jim simons斯於1982年成立,詹姆斯·西蒙斯jim simons是一位屢獲殊榮的數學家和前冷戰時代的密碼破解者。 1988年,文藝復興科技公司創立了該公司最賺錢的投資組合,即「大獎章基金(Medallion Fund)」。大獎章基金的定量模型是基於對倫納德·鮑姆的鮑姆-韋爾奇算法模型的改進和擴展,以探索其可能獲利的相關性,而這個改進是由代數家詹姆斯·克斯完成。西蒙斯與克斯以此成立了一家基金,並以「大獎章」命名來紀念他們曾經獲得的數學榮譽。 [from course parcipant internet surfing] ::: ### Risk Management ![](https://i.imgur.com/kKuLwmq.jpg) ### API 經濟 ![](https://i.imgur.com/2CSmw87.jpg) ### Other data science ![](https://i.imgur.com/nqkYN30.jpg) ![](https://i.imgur.com/PiLmMu0.jpg) ### RegTech ![](https://i.imgur.com/di8Y17W.jpg) ### 政府對金融監理沙盒的態度 ![](https://i.imgur.com/iQvsFHq.jpg) ![](https://i.imgur.com/q8IxujB.jpg) ![](https://i.imgur.com/TMHa6UK.jpg) ![](https://i.imgur.com/UShpgo3.jpg) ![](https://i.imgur.com/H0bvxSN.jpg) ![](https://i.imgur.com/DxYJ1z2.jpg) ![](https://i.imgur.com/0Rhi5K2.jpg) ![](https://i.imgur.com/NeBudxN.jpg) ![](https://i.imgur.com/NyA0n1e.jpg) ![](https://i.imgur.com/fL9M38E.jpg) ![](https://i.imgur.com/ZemOq0L.jpg) ![](https://i.imgur.com/zQf7POp.jpg) ![](https://i.imgur.com/jJ8vLK9.jpg) ![](https://i.imgur.com/ZhGTifR.jpg) ![](https://i.imgur.com/lCA5Lgc.jpg) ![](https://i.imgur.com/z0czre3.jpg) ![](https://i.imgur.com/C5vvdtc.jpg) ![](https://i.imgur.com/fdEpza4.jpg) ![](https://i.imgur.com/I1nd7HP.jpg) ![](https://i.imgur.com/8TpowNR.jpg) --- ## AI v.s. machine learning v.s. 統計 --- “When you’re fundraising, it’s AI. When you’re hiring, it’s ML. When you’re implementing, it’s logistic regression.” —everyone on Twitter ever --- ![](https://i.imgur.com/okmLMa0.jpg) --- [No, Machine Learning is not just glorified Statistics](https://towardsdatascience.com/no-machine-learning-is-not-just-glorified-statistics-26d3952234e3) ![](https://i.imgur.com/lOYbI8a.jpg =250x) --- #### A funny news from course participants [【不要叫我大學生,叫我AI生】 有一系列招生廣告,被罵翻....太荒謬 不要叫我大學生 叫我AI生](https://ai.thu.edu.tw/) --- ## 統計 v.s. 機器學習 (data science) --- ![](https://i.imgur.com/P0mo1ge.jpg =350x) --- ![](https://i.imgur.com/ZfIX6dw.jpg) --- ## 統計 ![](https://i.imgur.com/oWHZYMJ.jpg) ### 信賴區間 ### 假設檢定 ![](https://i.imgur.com/vKyzd5w.jpg) ### 迴歸 (不是校正回歸喔):smile: ![](https://i.imgur.com/86Y74Ck.jpg) ### 其他統計模型 1. 財務:財務時間序列模型 2. 生物統計:存活分析,長期資料分析 3. 工業統計:實驗設計,品質管理 4. 機器學習:又稱統計學習 --- ## 機器學習 1. Unsupervised learning a. Clustering: K-means, heirarchical clustering. b. Dimension reduction: Principle Components Analysis (PCA). 2. Supervised learning a. Classification ($y$ is binary): K-nearest neighbors, Decision tree, Random forest, Support vector machine, Neural network b. Regression ($y$ is continuous): regression, Neural network 3. Others a. Reinforcement learning b. Semi-supervised learning c. Active learinng d. Natural language processing ### Unsupervised learning 非監督式學習 (data mining): $(x_1,x_2,\ldots,x_p)$ #### Clustering 分群: K-means Euclidean distance: $$d(a,b)=\sqrt{\sum_{i=1}^p(a_i-b_i)^2}.$$ ![](https://i.imgur.com/4Hq29F9.jpg) --- #### Hierarchical clustering Need to decide 1. Distance: $d(a,b)$ 2. Linkage method: $L(G_1,G_2)$ ![](https://i.imgur.com/wvaLh66.jpg) #### Principle component analysis (PCA) 主成分分析 ![](https://i.imgur.com/GUAs0ZB.jpg) ### Supervised learning 監督式學習: $(x,y)$ #### Notation $y$: 被解釋變數, response variable, dependent variable, output. $x$: 解釋變數, explanatory variable, independent variable, input. Seeks a function $f$ to connect $x$ and $y$ through $$y = f(x).$$ $f(\cdot)$ can be very complicated. If $y$ takes continuous values, we call it regression. If $y$ takes categorical values, we call it classification. #### KNN ![](https://i.imgur.com/nE7y1I0.jpg) #### Decision tree and random forest ![](https://i.imgur.com/bKdMo6N.jpg) #### Support vector machine ![](https://i.imgur.com/Y5PjDh2.jpg) #### Neural network ![](https://i.imgur.com/y8F0KzM.jpg) ### 文字探勘 #### 文字雲 ![](https://i.imgur.com/P604pO8.jpg) #### 知識圖譜 ![](https://i.imgur.com/aqeinKd.jpg) ## 結論: Take home message 1. Humanity versus technology! 2. A mixture of domain knowledge (business question), analysis (math, stat, machine learning), coding. ![](https://i.imgur.com/OhiOjht.png)