---
title: 202109 Overview
tags: teach:MF
---
# 機器學習與金融科技
:::info
編輯者: 鄧惠文教授
財務金融研究所,國立陽明交通大學,教學使用請勿轉載。或有疏漏,歡迎留言分享。上次更新2021/11/1.
:::
## 金融科技
### Fantancies from course participants
1. 沒有人的服務,冰冷的空間,悄悄的完成客戶想要的交易
### 最新科技?
|Type | Topic | Features|
| ----|----|----|
| Algorithm | AI| Machine learning, etc.
| | Block Chain| 節點之間傳遞加密訊息,由*區塊*跟*鏈*組成, 藉由密碼學串接並保護內容的串聯紀錄, 分散式的分類帳, Pkc, 由密碼串接並保護內容, 雲端儲存, 點對點架構讓資料去中心化|
| 硬體 | Cloud computing|
| | 量子電腦 |
### 金融服務業?
## 例子

### Portfolio management
Predict return $y$ using explanatory variable $x_1,\ldots,x_p$.

:::info
Markowitz 在 1952 年發表「分散投資」與「效率組合投資理論」等論文,第一次以嚴謹的數學工具,展示投資者在眾多風險資產中、如何構建最佳資產組合的方法,也因此成為「現代投資組合理論之父」。
初探markowitz的現代投資組合理論
https://reurl.cc/1ovzKD
資本資產定價模型 (CAPM)
https://reurl.cc/oxRXYD
:::
:::success
[巴塞爾協定](https://www.moneydj.com/kmdj/wiki/wikiviewer.aspx?keyid=5fa34842-7319-4e7b-814a-15ed9c6f8aae)
1. Market Risk
2. Counterparty risk
3. Liquidity risk
巴塞爾協定起源於前聯邦德國赫爾斯塔銀行(Herstatt Bank)和美國的佛蘭克林國民銀行(Franklin National Bank)的倒閉,在這兩家國際著名銀行倒閉第二年,也就是1975年9月,第一個《巴塞爾協定》提出。該協定之核心內容是針對國際性銀行監管主體缺位的現實,提出了兩個基本之監管思想:任何銀行的國外機構全都不能逃避監管;母國和地主國應共同承擔相應職責。1988年7月,國際清算銀行下的巴塞爾銀行監理委員會(BCBS)對協定進行了首次實質性完善,並通過了《關於統一國際銀行的資本計算和資本標準的報告》(簡稱《巴塞爾報告》),以規範信用風險為主的國際準則,簡稱Basel I。報告的核心內容是資本分類,從資本標準及資本風險兩個方面對銀行提出明確要求,反映出監管思想的根本轉變。
巴塞爾委員會建議在1992年底之前,各會員國銀行的自有資本與風險性資產比例(資本適足率),不得低於8%。
資本適足率=自有資本/經風險係數調整之資產
自有資產=第一類資本+第二類資本+第三類資本;
風險係數調整之資產,該協定根據違約風險將銀行資產區分為四類。
:::
### Algorithmic trading
Similarly terms: statistical arbitrage, quantitative trading, AI trading. Which term you prefer? :heart:
Predict return $y$ using explanatory variable $x_1,\ldots,x_p$.

:::info
文藝復興科技有限責任公司(英語:Renaissance Technologies LLC)是美國一家對沖基金公司,其專門從事利用數學和統計分析得出的定量模型進行系統交易。文藝復興科技公司由詹姆斯·西蒙jim simons斯於1982年成立,詹姆斯·西蒙斯jim simons是一位屢獲殊榮的數學家和前冷戰時代的密碼破解者。
1988年,文藝復興科技公司創立了該公司最賺錢的投資組合,即「大獎章基金(Medallion Fund)」。大獎章基金的定量模型是基於對倫納德·鮑姆的鮑姆-韋爾奇算法模型的改進和擴展,以探索其可能獲利的相關性,而這個改進是由代數家詹姆斯·克斯完成。西蒙斯與克斯以此成立了一家基金,並以「大獎章」命名來紀念他們曾經獲得的數學榮譽。 [from course parcipant internet surfing]
:::
### Risk Management

### API 經濟

### Other data science


### RegTech

### 政府對金融監理沙盒的態度




















---
## AI v.s. machine learning v.s. 統計
---
“When you’re fundraising, it’s AI. When you’re hiring, it’s ML. When you’re implementing, it’s logistic regression.”
—everyone on Twitter ever
---

---
[No, Machine Learning is not just glorified Statistics](https://towardsdatascience.com/no-machine-learning-is-not-just-glorified-statistics-26d3952234e3)

---
#### A funny news from course participants
[【不要叫我大學生,叫我AI生】
有一系列招生廣告,被罵翻....太荒謬 不要叫我大學生 叫我AI生](https://ai.thu.edu.tw/)
---
## 統計 v.s. 機器學習 (data science)
---

---

---
## 統計

### 信賴區間
### 假設檢定

### 迴歸 (不是校正回歸喔):smile:

### 其他統計模型
1. 財務:財務時間序列模型
2. 生物統計:存活分析,長期資料分析
3. 工業統計:實驗設計,品質管理
4. 機器學習:又稱統計學習
---
## 機器學習
1. Unsupervised learning
a. Clustering: K-means, heirarchical clustering.
b. Dimension reduction: Principle Components Analysis (PCA).
2. Supervised learning
a. Classification ($y$ is binary): K-nearest neighbors, Decision tree, Random forest, Support vector machine, Neural network
b. Regression ($y$ is continuous): regression, Neural network
3. Others
a. Reinforcement learning
b. Semi-supervised learning
c. Active learinng
d. Natural language processing
### Unsupervised learning 非監督式學習 (data mining): $(x_1,x_2,\ldots,x_p)$
#### Clustering 分群: K-means
Euclidean distance:
$$d(a,b)=\sqrt{\sum_{i=1}^p(a_i-b_i)^2}.$$

---
#### Hierarchical clustering
Need to decide
1. Distance: $d(a,b)$
2. Linkage method: $L(G_1,G_2)$

#### Principle component analysis (PCA) 主成分分析

### Supervised learning 監督式學習: $(x,y)$
#### Notation
$y$: 被解釋變數, response variable, dependent variable, output.
$x$: 解釋變數, explanatory variable, independent variable, input.
Seeks a function $f$ to connect $x$ and $y$ through
$$y = f(x).$$
$f(\cdot)$ can be very complicated.
If $y$ takes continuous values, we call it regression.
If $y$ takes categorical values, we call it classification.
#### KNN

#### Decision tree and random forest

#### Support vector machine

#### Neural network

### 文字探勘
#### 文字雲

#### 知識圖譜

## 結論: Take home message
1. Humanity versus technology!
2. A mixture of domain knowledge (business question), analysis (math, stat, machine learning), coding.
