# 醫學影像系統 Dataset 相關筆記
## Covid-19 Dataset on Github
- [COVID Dataset on Github 連結](https://github.com/ieee8023/covid-chestxray-dataset)
- Project Summary:
To build a public open dataset of chest X-ray and CT images of patients which are positive or suspected of **COVID-19 or other viral and bacterial pneumonias**

- Images got PA, AP, and AP Supine views
- 每張圖片會有
- Annotation
- 應定義出左肺(1)及右肺(2)的 bounding box 擊其他資訊
- 圖片本身
- 於 `metadata.csv` 有一列
- patientid
- sex,
- age,
- finding 找到的病因
- 通常每列都有,於 annotation 也會找到
- mask
- 於 `covid-severity-scores.csv` 中會有該圖片的geographic_mean 和 opacity_mean
## 圖片擴增程式
- 我之前專題和同學用的程式
- [imgaug](https://github.com/aleju/imgaug)
- 裡面有定義了很多擴增用的程式
- 主要是擴增同時產出 annotations
- 一些會影響 bounding box 的擴增方式 會讓annotaion中的bounding box座標隨之改變
- 擴增可以疊加(gaussian + histogram 之類的)
- 要的話也可以用介面呈現擴增狀況
- 應會著重於 histogram 方法對 dataset 的影響
- CLAHE 於 imgaug 也可以找到
- 