# 香水百合價量預測 > [time=Sat, Jan 30, 2021 4:56 PM] > [name=JayHsu] ## 目的: 預測特定期間內,十種香水百合的成交價格及成交量。 ![](https://i.imgur.com/PcXkDO5.png =400x) ## 計分方式: MAPE mean absolute percentage error ![](https://i.imgur.com/2zJsezy.png =500x) ## 資料前處理 - 下載花卉交易歷史資料 - 農產品批發市場交易行情站 (https://amis.afa.gov.tw/main/Main.aspx) - Data: 2010~2020花卉交易資料 ![](https://i.imgur.com/ZvTFusR.png =500x) - 定義2000~2021的除夕日 ![](https://i.imgur.com/yBHGXX0.png =100x) ## 模型 / 演算法 ### 模型選擇、描述 #### 1. 模型建立(百分等級) - 1.a 使用預測期間的前四天資料建立參考值(Baseline), 計算2020/2021在過去20年的百分等級. 如下圖所示: - X軸為除夕前N天, Y軸為平均價格. - 圖上的黑色三角形為預測區間(2020年)前四天的白合花(FS443)價格 - 其餘灰色圓點為過去20年的歷史價格. ![](https://i.imgur.com/jRrs1l5.png =700x) - 1.b 計算Baseline的價格均值佔歷史價格的百分等級 - Baseline: 預測期間的前四天資料 - 前四天的價格均值: 4個黑色三角形的平均值 - 歷史價格: 灰色原點 ![](https://i.imgur.com/mB94vpd.png =200x) #### 2. 預測(百分位數) - 2.a 使用預測期間的過去20年歷史資料與上一步驟計算的百分等級計算每天的預測值(百分位數) - 2.b 將預測值與前一年的資料加權平均. - 2.c 如下圖 - 橘色圓點: 2019年的FS443平均價 - 綠色星號: 加權計算後的2020年預測值 - 黑色三角形: 正確答案 ![](https://i.imgur.com/AFn0z4Y.png) ### 參數調校 1. 建立參考百分位數時使用的天數 使用2016~2020的資料回測, 使用4天的資料建立參考值時能得到相對較佳的預測結果. 2. 百分位數預測值和前一年資料的權重調整 使用2016~2020的資料回測, 百分位數預測值和前一年資料的權重分別設定為0.8與0.2能得到相對較佳的預測結果. 3. 因為預測值較實際值大時, 容易讓MAPE大幅上升, 所以可以將預測值乘上0.8, 降低實際值很小但誤差很大的機率. (來不及用在這次比賽) ### 結果說明 - Public Leaderboard - MAPE0.53, 排名21/34 - ![](https://i.imgur.com/gui4BHM.png) - Private Leaderboard - MAPE0.498, ==排名4/34== - ![](https://i.imgur.com/bT0Yvkz.png) ###### tags: `Competition`