IMMC賽後評審的有感而發

# IMMC賽後評審的有感而發舒宇宸 2024/04/29 ### 先用理由來說明方法脈絡各位同學好，很高興看到各位同學在2024 IMMC中華賽及國際賽中，透過不同的方法來求解數學建模問題，如AHP、TOPSIS、EWM、ARIMA、DECISION TREE、XGBOOST等等。而在報告的過程中，或是在論文的寫作上，各位同學總是希望趕快秀出這些方法，來證實論文的解題過程是有憑有據的。我覺得這展現了同學的學習精神。但其實在建模比賽，或是生活中真正的說服別人相信你的論點，不見得需要用到這麼複雜的方法。舉例來說，之前曾經有衛生單位要查驗某家廠商的油品是不是純油品，他們想到從該廠商的進出貨紀錄來檢驗。如果廠商進了10公斤的純油料，但卻能做出20公斤的油品，10<20就是一個有力的證據了。所以這時要知道有沒有純，只需要一個不等式。但如果沒有來龍去脈，就直接說『我要用不等號檢驗油品純不純』。這時候就會令人一頭霧水。所以要用這些方法來說服評審，建議同學們應該先講出用這些方法的理由，如「為什麼要用這樣的方法？觀察到了什麼現象？什麼動機？才使得你來使用這種方法。」舉例來說，同學常常在預測的過程中，也不先說清楚為什麼要用那個函數或方法，然後最後就用R2當成一個評估的指標。但評審真正關心的，不是R2有多靠近1，而是同學們對未來的想像是什麼，而R2只是這個想像與真實數據之間的差異指標而已。如果沒有說清楚原因，只考慮R2，那麼我可以用夠高次的多項式讓R2是1。另外就像同學在預測未來的人口時，在沒有原因的情況下，開頭就提使用Logistic Model來預測，但同學們展現出在論文上的未來預測，就幾乎跟直線一樣。同學們有沒有想過，那為何不使用線性來預測就好？使用Logistic Model同學們想到的未來又是什麼？也有同學用ARIMA，為什麼要取那一個自我迴歸項數？為什麼要差分那麼多次？為什麼要平均那麼多項？到底哪些證據可以支持你使用這樣的方式？如果說最後只看迴歸的誤差，那麼跟我直接拿高次多項式的通過資料點得到誤差是0有什麼不一樣？其實題目要問你的是對未來人口的看法，而不是之前的歷史數據是哪一個函數。綜合以上所說，建議同學們在「展現數學技術或方法」前先告訴我們，為什麼要用這個方法，這個模型？其實後續的擬合，也只是模型中參數搜尋的過程而已。 ::: success Remember, reason comes before modeling methods!。 ::: --- ### 了解所使用的方法再來談到方法的使用。這次有許多同學使用AI的方法。依照前段的邏輯，建模競賽中同學們是要說服評審的。請同學們可以倒過來想想，你在論文或報告中提出的方法，能夠說服你自己嗎？如果題目變成，要你用這個AI方法來決定你自己是否要開刀，來決定你跟另一半要不要結婚等跟自身相關的重大決定時，同學們真的會丟給機器跑一個答案，然後什麼都不問嗎？ ::: warning What do you learn from machine learning? ::: 相信很多使用機器學習方法的團隊都被問了上面這個問題。如果整個建模過程只有機器學習，而我們只是啟動機器，它說怎樣我們就相信是怎樣，那各位在建模過程中的角色定位是什麼。我們該頒獎給同學還是機器？要知道我們與機器不同的地方，就是好奇心；我們會想方設法問清楚，到底為什麼會這樣？舉例來說，這個AI方法的原理是什麼？如DECISION TREE跑出來的表格中，GINI INDEX是什麼？怎麼用這個DECISION TREE來分類？換個ORDER難道不行嗎？PCA又是什麼過程？XGBoost到底是怎麼做的？Random Forest為什麼要Random？舉個例子來說，這次大家常用的AHP，那個AHP矩陣怎麼來的？為什麼要請專家來訂定AHP 矩陣？從矩陣怎麼算出最後的權重？為什麼要算CI、RI？那個意義又是什麼？為什麼大家做出來都是可以接受的？當評審一個人看到10幾個比重不盡相同的AHP矩陣來做同一個問題時，其實那就已經代表，某隊同學所提出的那一個比例或權重，在另一隊來看就是不認同的了。請同學們要想辦法自我提問，提問到自己能夠接受做出來的答案，相信到那時候同學們就會更有自信地站在講台上。 --- ### 熟悉的工具與語言承上，另一件重要的事，就是希望大家用自己熟悉的工具以及熟悉的語言。如果我們把一個資料，丟給黑盒子，跑出一個答案，即使黑盒子上面寫了，這個可以協助你算出一個答案，你怎麼知道那個黑盒子算的是對的？各位同學若有使用ChatGPT，相信同學們也會在它給你回答時，思考一下ChatGPT是不是言過其實吧？舉例來說，高中階段應該還沒有徹底學習微分方程。而論文時同學說要用PDE來求解問題，那同學知道PDE是在模擬什麼物理現象嗎？同學們有確定要使用PDE做的物理現象預測，跟實際問題是否相同？科學是一個求真的論證過程，數學建模也絕對不是一個計算題，把答案算出來就好了。它還是一個說服的過程，讓你透過一封信，投影片，甚至問答，來說服評審們你的作品是有學理基礎，有數學推導，有模式建構，有資料驗證，經得起考驗的過程。如果同學們無法了解這些AI求解的過程，中間的術語，無法跟我們說明那些是在做什麼，那我們怎麼會相信這個AI的結果呢？ ::: info Convince us as best as you can！ ::: 說到說服，熟悉的語言就更重要了。評審也知道大家站在上面會很緊張，其實我們站上去也是。IMMC沒有限制一定要用英文，即使是國際賽也可以用中文。那就是因為我們希望各位同學能在台上，或在報告中把自己的想法傳遞清楚。不是看著英文稿子，唸得飛快，投影片在上面不到1秒就換頁，那已經失去了「溝通」、「簡報」甚至「說服」的意義了。我們了解大家真的做了很多結果要來跟評審分享。但飛快的投影片就是什麼都沒分享到。而且因為只有短短幾分鐘，同學們更要懂得把它去蕪存菁，留下最精彩的部分與我們分享，如整個論文的思路架構，甚至是將文字無法完整傳達的想法讓我們知道。大家都是兩岸四地的中國人，雖然這是個國際競賽，但若在場的各位，母語都是中文，沒有一位聽眾是只聽得懂英文的狀況下，我也會以講中文為榮。 --- ### 結論最後，容我整理一下上述的有感而發，那就是 ::: danger 用你最擅長的語言，先說明建模的理由，再使用能掌握的方法，做出結果，最後反思在這個過程中學到了什麼 ::: 相信透過以上的方式，大家一定能在數學建模競賽中有更多收穫，從中建立起決定自己人生的數學模型。

Read more

變異數的探究與實作 --- 以2022年學測第三題為例