## 科學探究與實作
## 個人期末報告分享
第 11 組 資工 113 蔡明軒
---
## 實驗主題
- 不同神經網路架構對預測疫情確診人數準確率的影響
---
## 實驗器材
- 一台"好的"電腦
- 每日確診資料集
---
## 實驗步驟
1. 至政府資料開放平台抓取資料集
2. 處理資料,將 2021 年之前的資料作為訓練資料,剩餘做為測試資料
3. 使用不同架構(2x6,3x4,4x3,6x2 全連接)訓練四個模型
4. 用訓練好的模型預測 2022/1/1~2022/5/22 的每日確診人數
5. 計算預測值與實際值的差值,得到準確率
6. 比較各種架構的模型的準確率
---
## 處理資料
- 政府的資料太複雜、有太多多餘的資料,不能直接拿來訓練
- 另外寫程式,轉換成我們想要的形式
----
## Before
![](https://i.imgur.com/0tqCJnB.png =500x)
----
## After
- 第一個欄位: 一年中的第幾天
- 第二個欄位: 當天的總確診人數
![](https://i.imgur.com/LvAYD0r.png =500x)
---
## 訓練模型
- 輸入: 前十天的確診人數
- 輸出: 下一天的預測人數
----
## 神經元
- 每個神經元會有一個或多個輸入
- 每個輸入都會對應一個權重,代表每個輸入的重要比例
- 像是在逼近現實中的確診人數的函數
```
以這次的實驗舉例,前十天的確診人數都會乘上一個數值
相加後將結果輸出就可以當作這一天的預測值
```
----
![](https://i.imgur.com/uDb3t9f.png =600x)
----
## 神經網路架構
- 可以把很多的神經元接在一起
- 神經元的數量、排列會影響準確值
- 固定神經元的數量,用不同的排列的模型來預測人數
----
![](https://i.imgur.com/NeM3X2K.png =600x)
---
## 評估準確率
- 計算測試資料中每天的準確率
- 把每天的準確率加起來取平均,用平均的準確來評估模型的好壞
$1-\frac{|實際確診人數 - 預測人數|}{實際確診人數}$
---
## 參考資料
- 政府資料開放平台 - 確定病名、個案研判日、縣市、鄉鎮、性別、是否為境外移入、年齡層、確定病例數
- https://data.gov.tw/dataset/120711
- 李弘毅老師的 Youtube 頻道 - 【機器學習2021】預測本頻道觀看人數 (上) - 機器學習基本概念簡介
- https://www.youtube.com/watch?v=Ye018rCVvOo&t=42s&ab_channel=Hung-yiLee
{"metaMigratedAt":"2023-06-17T01:56:59.597Z","metaMigratedFrom":"YAML","title":"科學探究與實作","breaks":"true","slideOptions":"{\"theme\":\"moon\"}","contributors":"[{\"id\":\"e66eff6e-ecb8-470a-a384-ea2a02e04747\",\"add\":1306,\"del\":29}]"}