# Projects : 利用機器學習進行房價與疫情之間的關係探討與預測 ## Motivation & Process ### Motivation 本課堂進行時間為2021年底,而從2019年尾開始,世界各地都陸續傳出了關於肺炎的疫情。截至目前為止,總共使得全球約3.1億人口確診,將近500多萬的人口死亡。這其中也對社會中大大小小的事物造成了相當大的影響,像是失業率攀升等。而我們想要透過與房價有關的各種資料,試著找出房價與疫情之關係,並試著進行預測,一方面如果再遇到類似疫情時,可以快速地對不動產價格進行預測,一方面也能在研究過程中了解造成房價上下浮動的關鍵因素是什麼。 ### Purpose 透過機器學習方式,比較疫情前後年份(以2018/01-2021/12為資料區間)的各個因素,試著找出對房價影響較強烈的特徵,並試著透過這些特徵來對未來房價進行預測。 ### 疫情對全球產生之影響 * 晶片荒 * 疫情之下歐洲、東南亞等地區的晶片供應商產能受到影響。 * 全球各國均採用遠端辦公,遠端上課的方式避免公眾接觸,導致了筆記型電腦、平板電腦需求量的顯著提升。 * 與線上辦公、線上教學相關的產品(鏡頭、滑鼠、路由器、鍵盤、耳機)等等均出現銷量激增的現象 * 美國政府對中國科技企業的制裁與封禁 * 塞港 * 加強運輸業防疫,導致港口人力與貨櫃短缺,導致各大港口處理容量下降,卸貨進貨緩慢 * 接近年終各國舉辦購物季(聖誕節、黑五、雙11) * 無法出國,使得民眾大量購買消費性商品與囤積生活用品,消費品需求總體上比Covid_19流行前高出22%(2020年2月與2021年8月相比)。玩具、遊戲和體育用品增長74%,家用電器增長49%。 * 歐美國家陸上運輸人力(卡車司機)也出現嚴重短缺,交互影響航運出貨進貨工作時間。 * 台灣股市 * 由於上述晶片荒、塞港的現象,全球半導體產能緊繃,使得台灣受到國際市場上的關注,吸引大量外資進入台股市場。 * 大量外資看好半導體產業,不斷調高目標價。 例如:台積電、聯發科等 * 貨運的部分,由於「需求遠遠大於供給」,導致貨櫃三雄股價飆漲。例如:陽明從2021/3的26元,漲到2021/7月的210元。而台股指數也從疫情前的11000點漲到18000點,表現強勁。 * 台商回流 在疫情影響之下,除了經濟復甦帶來的經濟成長率以及寬鬆貨幣帶來的豐沛低廉資金,還有許多台商帶著大量資金回來投資台灣,這些因素都能使房價水漲船高。《境外資金匯回管理運用及課稅條例》申請已於去年8月落日,財政部統計,截至去年10月,累計已有3,337億元資金實際匯回。已有近三成匯回資金投入實質投資,在這之中,建築物占二成,支出金額為307.75億元。而大量的投資也帶動房價跟著上漲,只是因為這些資料由於個資法政府無法公布實質統計數據,實屬可惜。 ## Research Process ### Features | Macroeconomics | Stock | | ---------------------- | ----- | | 房價所得比 | TAIEX | | 五大行庫平均房貸利率 | Shipping and Transportation| | 經濟成長率 | Semiconductor| | 住宅價格指數 | Iron and Steel| | 勞動參與率(依年齡分) | Electronic Parts Components| | 進出口貿易量及年增率 | | | 消費者物價指數 | | | 躉售物價指數 | | | 營造工程物價指數 | | | 進出口物價基本分類指數 | | | 經季節調整國內生產毛額 | | | 平均每人GNI, GDP, NI | | | 平均每人民間消費支出 | | | 可能成交指數 | | ### Feature Correlation  ### Feature Importance  ## Result ### 疫情前後的feature importance | 疫情前的feature importance | 疫情後_feature importance| | -------------------------- | -------- | | 35-39.1 | 50-54 | | Labor_ratio_total | Saving_ratio | | House_loan_ratio | Shipping | | Saving_ratio |Import price| | Hpi_volumn_total | semiconductor | ### MAE Table 平均絕對值誤差(Mean absolute error,MAE) | Type | MAE | | -------- | -------- | | Trade | 0.5019 | | Stock | 1.0567 | | Top30_feat | 2.5867 | --- **Trade :** * Import, export * Import_rate * Export_rate * Import / Export Price basic index **Stock :** * TAIEX * Shipping_and_Transportation * Semiconductor * Iron_and_Steel * Electronic_Parts_Components **Top30_feat :** * deal_index * house_loan_ratio * economic_growth_rate * gdp * gni * yd * net_saving * saving_ratio * domestic_investment * industry,other * labor_ratio_total * 20-24 * 35-39 * 50-54 * 55-59...... ## Conclusion & Discus ### Conclusion 疫情下,股市相較於總體面的指標,確實對於房價指數的影響比較顯著。推測為由於疫情發生迄今時長仍僅兩年,屬於一個較短期的區間。而股市屬於短期內會反應較劇烈的指標,總體面的因素,如勞動失業率及經濟成長率等,較屬於需要長期時間進行觀測,才能看出較顯著的波動。 ### Discssion 過往研究中,可以分作兩個面向來敘述。首先,以國內研究來說,多數研究為長期下(>=10年)台灣房價或是特定行政區房價的走勢,並未加入特定事件去做分析。再來,以國外研究來看,如中國針對特定區域確診人數與特定區域在疫情情況時期的房價漲跌之間的關係,但反觀至台灣資料的取得,並未能取得疫情發生以來,各行政區的確診人數,因而無法與地區房價指數進行比較。且若考量至總體面的指標,由於以國家為單位,也無法反應至不同行政地區。期許隨著時間的演變,能夠蒐集到更全面的資料,去做往後十年的房價指數訓練,並做預測,期許能夠再加入疫情特定時段的考量,進一步去做模型訓練。 ## Reference * [波士頓房價預測_入門機器學習](https://codingnote.cc/zh-tw/p/4604/ ) * [房價精準預測](https://www.itread01.com/content/1542680851.html ) * [Kaggle 房價預測實作](http://ielab.ie.nthu.edu.tw/109\_IIE\_project/2/109IIE\_proj2\_8_word.pdf ) * [Regression 機器學習](https://medium.com/chung-yi/ml%E5%85%A5%E9%96%80-linear-regression-27cbb50f89e8 )
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up