# Online Board for 2023 Fintech Midterm Exam
Q: 範例問題
A1: 範例答案
A2: 範例答案
...
> 範例評論
------
Q: 有關於lift chart的部分
因為對於lift chart看到好像還是不是很明瞭,所以打了這篇
假設我們有個random-guess的分類器,和一個"穩定"90%精確的模型
資料集有N=750,P=250,用分成10個bin的方式畫圖。
A1:
bin1(抓10%的資料): random的部分會由 75個N和25個P組成,90%精確會是10個N和90個P組成。
bin2(抓20%的資料):同上。
bin3(抓30%的資料):這裡開始出現變化,random在這個點還是抓100個,組成是75個N和25個P,但是90%精確的模型,因為在這個bin中,所有的P都被抓完了,這個bin就收集所有剩下的P,剩下的由N填補。也就是70個P和30個N。
bin4(抓40%的資料):這邊ramdon還是一樣,但是因為P前面30%的資料全部都收集了,後面全部都強制是N。
bin5-10,和4都一樣了。
這樣有每一個bin累積的N和P(FP,TP),沒有被抓到的N和P(TN,FN),累積recall和precision就可以畫出來了。
> 如果我理解有誤的話麻煩請同學糾正。
>> 看起來是對的
>>> 我的理解是:
每個 bin 的資料數, 應是按照總資料數平均分配的, 依照你的案例應是每次都抓 100 筆, 每次抓取的人數分配(P:N), 在人數比例滿足 precision 的分配時, 都由模型的 precision 決定, 不足時 precision 就會下降(因為 N 變多了)
所以, 到 bin3, 90% 精確的模型應該是 70(=250-90-90)筆 P + 30 筆 N, 計算出的 precision 為 70%, 不再是 90% 了, 但這時的 recall 是 100%(=((90+90)/250{前2次} + 70/250{第3次})* 100)
題外話:
我們在計算時都從上帝視角看問題, 感覺 precision 下降是奇怪的, 但是如果從機器的角度看應是合理的, 因為它總是拿它手上的資料來算結果
乍看是模型精確度變差(跟假設不符), 但過程中 recall 是一直上升, 直到所有的 P 都被抓完而導致 "看起來" 變差
Q:想問一下關於One-pass ranking的方式進行search,為什麼需要2d-1次計算啊?全部算一次然後排序不是也才d次嗎?
> 全部算一次 d ,前二好 1 次,前三好 1 次 ... 前 d 好一次 = 2d - 1
>> 前二好 1 次是為了確定用兩個的performance有比只用一個的好嗎?
>>> one-pass 的計算過程會算出最好的 feature 然後把前二好的 feature 結合算一次結果, 然後把前三好的 feature 結合算一次結果 ... 以此類推
Q: 想問一下10/18小考第21題是怎麼算的。
題目是: 按單期二元定價模型,若期初股價為1元,一季內上漲與下跌幅度皆為10%,履約價亦為1元,無風險利率為0,一季後到期的歐式賣權的理論價格應為?
> 可以用 10/18 投影片(Intro. to Financial Engineering) P39 的 P0 公式計算,
其中因為 r=0, 所以 exp(r* dt) = 1,
因為 x=1 元到第 2 期會分叉成, 跌 xd=0.9(=1-10%)=> d=0.9 跟漲 xu=1.1(=1+10%) => u=1.1 兩個分支, 履約價 K = 1, 根據 (xd-K)^+ 的定義, xd=0.9 < K=1, 所以第二項為 0, 只看第一項的話就剩 (1-d)/(u-d)*(1.1-1)=(1-0.9)/(1.1-0.9)*0.1=0.05
Q: 請問Quiz 1 第三題怎麼算,答案是否有誤?
> 每天的報酬率分別是 [1 / 5, 1 / 6, - 1 / 7, 2 / 6]
> 可以算出每天的平均報酬率是 0.139285714
> 然後可以按照標準差公式算出每天的標準差是 0.201407556
> 所以算出每天的 sharpe ratio 為 (平均報酬 - 每天無風險) / 每天的標準差
> = (0.139285714 - 0.01 / 252) / 0.201407556 = 0.691364486
> 一年估計有 252 天,所以把每天的 sharpe ratio 乘上根號 252 就是 10.975 也就是每年的 sharpe ratio
Q: 想請問 Quiz 7 的第六題,(2 / 5 + 2022) mod 7 為什麼答案是 5 而不是 6 呢?
> 5 對於 7 的 mod inverse 是 3(因為 5 * 3 mod 7 = 1)
> 所以 (2 / 5 + 2022) mod 7 會變成 (2 * 3 + 2022) mod 7 也就是 2028 mod 7 = 5
Q: Which is a generator of the cyclic group G = (Z17*, × mod 17)?
請問這題找generator時只能暴力解每個選項慢慢試嗎?
> generator的order會等於群的成員個數,因此
> If g is a generator of group G, then $g^a \not\equiv 1 (\mod\ |G|)$ for $a\ |\ |G|$ and $a \ne |G|$.
> 以這題為例,g的2、4、8次方都不能是1,也就是說只要驗證這幾個次方就好了。
> 舉例來說,檢查2是不是generator時,$2^2 \equiv 4 \not\equiv 1$,$2^4 \equiv 16 \not\equiv 1$,如果要算$2^8$可能會比較麻煩,這時候可以考慮$2^4 \equiv -1$,所以$2^8 \equiv -1 \times -1 \equiv 1$,所以2不是G的generator。
>> 記得老師有提到 Lagrange’s Theorem, 當存在 generator 時表示 G 可以被等分切割, 本例中 $\mid G \mid = 17-1=16$, 可因式分解成 2,4,8,16, 因為 Eluer 小定理的關係, 所以只要檢查 $a^{2,4,8} \not\equiv 1$ 即可, 可以觀察到 $15 \equiv -2$(mod 17), $13 \equiv -4$(mod 17), 剛好 2,4,8 都是偶數, 所以只要算一半, 其中比較特殊的是 14, 所以明天搞不好先算一下哪個比較特殊, 然後再驗算一次應該可以了
Q: 請問 Performance indices 投影片中,是如何計算出 Chinese and English 的 55.7% 的MER?
> 中文以字的層級拆開,英文以詞的層級拆開,groundtruth處理完可以得到「我 有 點 喜 歡 iPhone」,共6個字。
> 正確:我 有 點 喜 歡 iPhone
> 預測:我 優 點 喜 歡 哀 鳳
> 優 → 有
> 哀 → iPhone
> 鳳 → X
> 共有3個錯誤。
> 因此MER$=\frac{3}{6}=0.5$,應該是50%才對。
>> 這不是算錯誤喔, 是要看 D(刪除) + I(插入) + S(替換), 幾個字/詞, 才能讓 ASR matched groundtruth, 以這個例子(MER: CH-字, EN-詞)來說,
>> D:哀, S: 優->有, 鳳->iPhone, 3 = 1(D) + 2(S), 分母 6=5(CH)+1(EN)
Q: 請問Quiz 3第4題(b)怎麼算?
>我的理解如下,有錯煩請糾正:
>因為$\rho_{12}=-1$,所以他會有點像是以y軸做鏡面,找一條入射線與反射線分別通過
>Asset1(0.15,0.2)以及Asset2(0.25,0.3),這時候你可以直接把(0.15,0.2)這個點對y軸做鏡射
>得到(-0.15,0.2),然後這點和Asset2連成的直線的斜率$m = \frac{0.3-0.2}{0.25-(-0.15)}= 0.25$就會是答案
Q:請問Quiz5的21題如何計算?
> 請參考 "Q: 想問一下10/18小考第21題是怎麼算的。"
Q:請問Quiz10,問題6C,same-gender height-dependent linear interpolation怎麼計算? 不好意思沒聽到老師上課一開始講的方法
>題目的意思是, 參考同性別的做 height 為 x, weight 為 y 的線性插值,
因為 index=5 的性別是女, 所以要參考 index=2,6,7 來估算 X1, 其中
因為 5 的身高介於 6 跟 7 中間, 所以獲得方程式:
(164-148)/(168-148) = (X1-35)/(55-35) => X1 = 51