# IMMC賽後評審的有感而發 舒宇宸 2024/04/29 ### 先用理由來說明方法脈絡 各位同學好,很高興看到各位同學在2024 IMMC中華賽及國際賽中,透過不同的方法來求解數學建模問題,如AHP、TOPSIS、EWM、ARIMA、DECISION TREE、XGBOOST等等。而在報告的過程中,或是在論文的寫作上,各位同學總是希望趕快秀出這些方法,來證實論文的解題過程是有憑有據的。我覺得這展現了同學的學習精神。但其實在建模比賽,或是生活中真正的說服別人相信你的論點,不見得需要用到這麼複雜的方法。舉例來說,之前曾經有衛生單位要查驗某家廠商的油品是不是純油品,他們想到從該廠商的進出貨紀錄來檢驗。如果廠商進了10公斤的純油料,但卻能做出20公斤的油品,10<20就是一個有力的證據了。所以這時要知道有沒有純,只需要一個不等式。但如果沒有來龍去脈,就直接說『我要用不等號檢驗油品純不純』。這時候就會令人一頭霧水。所以要用這些方法來說服評審,建議同學們應該先講出用這些方法的理由,如「為什麼要用這樣的方法?觀察到了什麼現象?什麼動機?才使得你來使用這種方法。」舉例來說,同學常常在預測的過程中,也不先說清楚為什麼要用那個函數或方法,然後最後就用R2當成一個評估的指標。但評審真正關心的,不是R2有多靠近1,而是同學們對未來的想像是什麼,而R2只是這個想像與真實數據之間的差異指標而已。如果沒有說清楚原因,只考慮R2,那麼我可以用夠高次的多項式讓R2是1。另外就像同學在預測未來的人口時,在沒有原因的情況下,開頭就提使用Logistic Model來預測,但同學們展現出在論文上的未來預測,就幾乎跟直線一樣。同學們有沒有想過,那為何不使用線性來預測就好?使用Logistic Model同學們想到的未來又是什麼?也有同學用ARIMA,為什麼要取那一個自我迴歸項數?為什麼要差分那麼多次?為什麼要平均那麼多項?到底哪些證據可以支持你使用這樣的方式?如果說最後只看迴歸的誤差,那麼跟我直接拿高次多項式的通過資料點得到誤差是0有什麼不一樣?其實題目要問你的是對未來人口的看法,而不是之前的歷史數據是哪一個函數。綜合以上所說,建議同學們在「展現數學技術或方法」前先告訴我們,為什麼要用這個方法,這個模型?其實後續的擬合,也只是模型中參數搜尋的過程而已。 ::: success Remember, reason comes before modeling methods!。 ::: --- ### 了解所使用的方法 再來談到方法的使用。這次有許多同學使用AI的方法。依照前段的邏輯,建模競賽中同學們是要說服評審的。請同學們可以倒過來想想,你在論文或報告中提出的方法,能夠說服你自己嗎?如果題目變成,要你用這個AI方法來決定你自己是否要開刀,來決定你跟另一半要不要結婚等跟自身相關的重大決定時,同學們真的會丟給機器跑一個答案,然後什麼都不問嗎? ::: warning What do you learn from machine learning? ::: 相信很多使用機器學習方法的團隊都被問了上面這個問題。如果整個建模過程只有機器學習,而我們只是啟動機器,它說怎樣我們就相信是怎樣,那各位在建模過程中的角色定位是什麼。我們該頒獎給同學還是機器?要知道我們與機器不同的地方,就是好奇心;我們會想方設法問清楚,到底為什麼會這樣?舉例來說,這個AI方法的原理是什麼?如DECISION TREE跑出來的表格中,GINI INDEX是什麼?怎麼用這個DECISION TREE來分類?換個ORDER難道不行嗎?PCA又是什麼過程?XGBoost到底是怎麼做的?Random Forest為什麼要Random?舉個例子來說,這次大家常用的AHP,那個AHP矩陣怎麼來的?為什麼要請專家來訂定AHP 矩陣?從矩陣怎麼算出最後的權重?為什麼要算CI、RI?那個意義又是什麼?為什麼大家做出來都是可以接受的?當評審一個人看到10幾個比重不盡相同的AHP矩陣來做同一個問題時,其實那就已經代表,某隊同學所提出的那一個比例或權重,在另一隊來看就是不認同的了。請同學們要想辦法自我提問,提問到自己能夠接受做出來的答案,相信到那時候同學們就會更有自信地站在講台上。 --- ### 熟悉的工具與語言 承上,另一件重要的事,就是希望大家用自己熟悉的工具以及熟悉的語言。如果我們把一個資料,丟給黑盒子,跑出一個答案,即使黑盒子上面寫了,這個可以協助你算出一個答案,你怎麼知道那個黑盒子算的是對的?各位同學若有使用ChatGPT,相信同學們也會在它給你回答時,思考一下ChatGPT是不是言過其實吧?舉例來說,高中階段應該還沒有徹底學習微分方程。而論文時同學說要用PDE來求解問題,那同學知道PDE是在模擬什麼物理現象嗎?同學們有確定要使用PDE做的物理現象預測,跟實際問題是否相同?科學是一個求真的論證過程,數學建模也絕對不是一個計算題,把答案算出來就好了。它還是一個說服的過程,讓你透過一封信,投影片,甚至問答,來說服評審們你的作品是有學理基礎,有數學推導,有模式建構,有資料驗證,經得起考驗的過程。如果同學們無法了解這些AI求解的過程,中間的術語,無法跟我們說明那些是在做什麼,那我們怎麼會相信這個AI的結果呢? ::: info Convince us as best as you can! ::: 說到說服,熟悉的語言就更重要了。評審也知道大家站在上面會很緊張,其實我們站上去也是。IMMC沒有限制一定要用英文,即使是國際賽也可以用中文。那就是因為我們希望各位同學能在台上,或在報告中把自己的想法傳遞清楚。不是看著英文稿子,唸得飛快,投影片在上面不到1秒就換頁,那已經失去了「溝通」、「簡報」甚至「說服」的意義了。我們了解大家真的做了很多結果要來跟評審分享。但飛快的投影片就是什麼都沒分享到。而且因為只有短短幾分鐘,同學們更要懂得把它去蕪存菁,留下最精彩的部分與我們分享,如整個論文的思路架構,甚至是將文字無法完整傳達的想法讓我們知道。大家都是兩岸四地的中國人,雖然這是個國際競賽,但若在場的各位,母語都是中文,沒有一位聽眾是只聽得懂英文的狀況下,我也會以講中文為榮。 --- ### 結論 最後,容我整理一下上述的有感而發,那就是 ::: danger 用你最擅長的語言,先說明建模的理由,再使用能掌握的方法,做出結果,最後反思在這個過程中學到了什麼 ::: 相信透過以上的方式,大家一定能在數學建模競賽中有更多收穫,從中建立起決定自己人生的數學模型。