# 秉鈞學長空汙染資料 :::success 空汙資料 https://drive.google.com/drive/folders/1DUvsB9L1ViBqQXBrO682am9YBQrmQBwi?usp=sharing :exclamation: 嘗試輸出 2018 年埔里 PM2.5 資料(2018micro.csv),但是和秉鈞學長輸出的數值不太一樣,數值普遍較高(多 5~15) ::: - [空氣品質即時地圖](https://www.airq.org.tw/) > 如果在網站上還有數據,就代表 sensor 還活著,網站上的數據都會存進戴老師的資料庫 environmentdata - [觀測資料查詢系統](https://e-service.cwb.gov.tw/HistoryDataQuery/) > 如果需要抓其他天氣因子的資料,可以利用爬蟲抓每小時的天氣因子 >> 如果要取得每分鐘天氣因子資料就需要 :money_with_wings: ,印象中每一列 700 元 :scream: >> [name=秉鈞] - [玉兒學姊埔里對照地圖](https://drive.google.com/drive/u/1/folders/1IH97YNl3g_GXWFDIJVw4YPsdhVr2iFkE) ## 其他 - 其他天氣因子的資料從氣象局 load 下來,戴老師只有用 PM2.5 - 戴老師資料庫 PM2.5 編號, 埔里編號 505、545 開頭 > address 在戴老師的 IOT 下的 Station table > :::spoiler > ![](https://i.imgur.com/aVrtVh8.png =300x) > ::: - address.csv 每一年的資料要確認地址,因為每一年都會改變 ## 流程 1. 線性內插 - 抓資料 > 合併 > 線性內插補植完整版 2. 高斯補植 - 抓資料 > 合併 > 高斯補植 > csv 轉 js : 用於 mask 資料傳遞。因為 csv file 檔案很大,資料在傳遞時,執行速度會很慢或是無法成功傳遞,所以用 js 的方式傳到 mask - 抓資料: 從戴老師的資料庫抓下來的資料 - connectDB.ipynb - ![](https://i.imgur.com/acYnwix.png) - 合併: 統一將同一地標的 PM2.5 統整成一列 - combine.ipynb - ![](https://i.imgur.com/P4AkqfP.png) - 補值 - 線性內插完整版.ipynb - 高斯平滑遮罩.ipynb - 目前 10000 代表 Nan ### input & output :::warning address.csv 每年都要更新 ::: - combine.ipynb - input: 抓下來的資料 (2018hour.csv) - output: 2018combine.csv - 線性內插補植完整版 - input: 2018combine.csv and address.csv - output: 2018micro.csv <!-- :::spoiler 每一段輸出 ![](https://i.imgur.com/KkDhhaf.png) ::: --> - 高斯平滑遮罩 - input: 2018合併.csv & address.csv - output: 2018micro高斯new.csv <!-- :::spoiler 每一段輸出 ![](https://i.imgur.com/N0OUj7C.png) ![](https://i.imgur.com/LEiZ9AZ.png) ::: --> - data 轉 JS - input - output ## Question ### 線性內插 - 如果每小時的 sensor 資料不足夠 3 個,加權分數設定為 0 ,output 會不換和埔里實際的 PM2.5 產生巨大的偏差值? ![](https://i.imgur.com/ncYllYe.png) - 33個是測站嗎? ![](https://i.imgur.com/VUXMhbH.png) > 補值 - 輸出和原本的不同 ### 高斯 埔里切割的格子變成 12* 12 嗎? ![](https://i.imgur.com/4PwyBfl.png)