Illumina / HIPPA / 個資盤點
===
###### tags: `Illumina`, `HIPPA`, `個資盤點`
<br>
**目錄**
[TOC]
<br>
## 進入主題前,先問問:
- 現在經手的業務(或是設計的系統),有用到哪些「個資」?
- 「個資」的重要性如何?敏感度如何?
- 「個資」會經過哪些流程?
<br>
## 何謂 個資盤點
- ### 簡單講:==「分析個資的用途」==
- 不同領域的術語
- 分析系統 -> breakdown
- 分析流程 -> breakdown
- e.g. BOW (Work Breakdown Structure, 工作分解結構)
- 分析個資 -> 盤點
- 分析程式 -> 使用 Lint tool
- ### 更細一點,就是:
- 在一系統中,列出哪些地方有使用個資?
- 他們是何種個資類別?用途是什麼?
- 會面臨哪些「外在威脅」與「內在弱點」?
<br>
<hr>
<br>
## P.22 演練一:業務流程分析
### 國網三期基因案(B案):==基因分析平台架構圖==

| 編號 | 作業項目 | 作業流程名稱 | 負責單位 | 特定目的 | 個資(Y/N) | 特種各資(Y/N) | 保有依據 |
| ----| ------- | --------- | -------- | ------ | -------- | -------------| ------- |
| 001 | 國網三期基因案<br>基因分析平台 | LIMS 平台 | Illumina | LIMS 用戶管理&試劑管理&基台管理 | Y | N | LIMS 服務條款和私隱政策 |
| 002 | 國網三期基因案<br>基因分析平台 | BSSH 平台 | Illumina | BSSH 用戶管理&基因專案管理 | Y | Y | BSSH 服務條款和私隱政策 |
| 003 | 國網三期基因案<br>基因分析平台 | IAP 平台 | Illumina | 基因分析流程指令控制 | N | N | BSSH 服務條款和私隱政策 |
| 004 | 國網三期基因案<br>基因分析平台 | 使用 S3 進行基因儲存 | Illumina | 基因體保存 | Y | Y | 國衛院與參與者簽訂的合約 |
| 005 | 國網三期基因案<br>基因分析平台 | 使用 DRAGEN 進行基因分析 | Illumina | 基因體分析 | Y | Y | 國衛院與參與者簽訂的合約 |
- 備註
- 使用 S3 進行基因儲存,這個環節倒底是算國網的?還是 illumina 的?
- 國網:資源提供者
- illumina:資源使用者
- 兩者都有可能產生資料外洩
<br>
## P.25 個資盤點範例:新進人員聘僱流程

- 求職者求職,可透過:
- 遞送紙本履歷(paper)給 HR
- 遞送電子履歷(E-file)給 HR
- 透過公司履歷系統,填寫履歷繳交
- 透過人力銀行系統,填寫履歷繳交
- 履歷表,轉到 HR
- 履歷表,轉到部門主管
- 部門同意僱用後,履歷表轉到「人資系統:新進員工資料」儲存
<br>
## P.26 演練二:個人資訊流程圖
> 選擇演練一中含有個人資料之業務作業流程來分析,並繪出個人資訊流程圖

資料來源:**SOW_9.基因分析平台_v1.1_0823**
1. 通過定序實驗室資訊管理系統(BaseSpace Clarity LIMS)來管理實驗室的樣本,並將樣本信息生成 Sample Sheet v1
2. 實驗室定序設備串接到 BaseSpace 鹼基序列匯流(BSSH),將定序設備 Run 數據檔案(BCL)和 LIMS 生成的 Sample Sheet v1 上載到國網中心儲存空間;
3. 當定序設備開始 Run, BSSH 向 Illumina 分析平台基因組數據儲存服務 Genomic Data Storage - GDS 請求儲存地址;
4. GDS 提供儲存路徑;
5. 定序設備開始上載數據到指定路徑;
6. (6&7.) 當定序設備 Run 上載完成, 工作流執行服務 Workflow Execution Service - WES
7.
8. 任務執行服務 Task Execution Service-TES 調度 DRAGEN 伺服器進行數據分析;
9. NCHC_專案工作說明書_20200701_V1數據分析完成後把 VCF 檔案保存到國網中心儲存空間。工作流程期間的事件由事件通知服務(ENS)負責處理。
<br>
## P.31 演練三:個人資訊內容盤點-PART1
> 依據演練二所繪製的個人資訊流程圖,試著分析找出個人資料盤點項目欄位,包括
> - 作業活動
> - 個資來源
> - 個人資料檔案名稱
> - 範例
> [](https://i.imgur.com/tR3FZpW.png)
:::spoiler 點此查看「類別補充說明」
- ### 作業項目
- 大類別
- 例如:[人力資源管理,包含數個大類別](https://medium.com/@edisonlin_95473/c7bda970fea8):
1. 人力資源規劃
2. 招募任用
3. 訓練發展
4. 薪酬管理
5. 績效評估
6. 員工關係
- ### 作業流程名稱
- 某個類別是由數個流程組成
- 例如,「招募任用」包含:
1. 人員聘僱流程
2. 對外尋找優質人員的流程
3. 與獵人頭合作的流程
4. 等等
- ### 作業活動
- 流程中的一個處理單元
- 例如,「人員聘僱流程」包含:
1. 接收資料
2. 資料建檔
3. 面試
4. 等等
:::
- ### 基因分析平台 / 帳戶註冊流程
| 作業項目 | 作業流程名稱 | 作業活動 | 個資來源 | 個人資料檔案名稱 |
| -------- | ----------- | ------- | -------- | --------------- |
| 基因分析平台 | 帳戶註冊流程 | 建立 LIMS 帳號 | 醫療機構、學術單位 | 帳戶基本資料 |
| 基因分析平台 | 帳戶註冊流程 | 建立 BSSH 帳號 | 醫療機構、學術單位 | 帳戶基本資料 |
| 基因分析平台 | 帳戶註冊流程 | 登錄&管理定序儀(機台) | 機台 | 機台資料 |
- ### 基因分析平台 / 基因體定序流程(數位化流程)
| 作業項目 | 作業流程名稱 | 作業活動 | 個資來源 | 個人資料檔案名稱 |
| -------- | ----------- | ------- | -------- | --------------- |
| 基因分析平台 | 基因體定序流程 | 前製作業+定序 | 患者 | IN:DNA, OUT:bcl |
- ### 基因分析平台 / 基因體儲存流程
| 作業項目 | 作業流程名稱 | 作業活動 | 個資來源 | 個人資料檔案名稱 |
| -------- | ----------- | ------- | -------- | --------------- |
| 基因分析平台 | 基因體儲存流程 | 將基因體同步上傳雲端 | 患者 | bcl |
| 基因分析平台 | 基因體儲存流程 | 對基因體解多工處理 | 患者 | IN:bcl, OUT:fastq |
| 基因分析平台 | 基因體儲存流程 | 將基因體寫入儲存體S3 | 患者 | fastq |
- ### 基因分析平台 / 基因體分析流程
| 作業項目 | 作業流程名稱 | 作業活動 | 個資來源 | 個人資料檔案名稱 |
| -------- | ----------- | ------- | -------- | --------------- |
| 基因分析平台 | 基因體分析流程 | DRAGEN 從儲存體S3讀取基因體 | 患者 | fastq |
| 基因分析平台 | 基因體分析流程 | DRAGEN 對基因體執行比對 | 患者 | IN:fastq, OUT:BAM |
| 基因分析平台 | 基因體分析流程 | DRAGEN 對基因體執行優化 | 患者 | IN:BAM, OUT:CRAM/BAM |
| 基因分析平台 | 基因體分析流程 | DRAGEN 對基因體執行變異分析 | 患者 | IN:BAM, OUT:VCF |
| 基因分析平台 | 基因體分析流程 | DRAGEN 將 VCF 寫入儲存體S3 | 患者 | VCF |
:::warning
:confused: **Question1** :question:
個資內容,
是以功能面(表觀流程、PM的角度)為視角?
還是以實作面(技術細節流程、工程師的角度)為視角?
亦或是兩者皆需?
<br>
**備註**:IAP 平台是跨「基因體儲存流程」&「基因體分析流程」
:::
<br>
## P.33 演練三:個人資訊內容盤點-PART2
> 接續 Part1 所分析出的個人資料檔案名稱,進一步填寫個人檔案相關內容資訊,包括
> - 個資蒐集/處理/利用動作
> - 個資資料類別、範圍
> - 檔案型態
> - 保存地點
> - 存取方式/控管方式
> - 保存期限
> - 使用應用系統名稱
- ### 個人檔案相關內容資訊
| 個人資料<br>檔案名稱 | 個資蒐集/<br>處理/利用 | 個資資料類別 | 個資範圍 | 檔案型態 | 保存地點 | 存取方式/控管方式 | 保存年限 | 使用應用<br>系統名稱 | 保存依據 |
| ------------|--------------------|-------------|-------------|----------|----------|------------------|---------|---------------|---------|
| 帳戶基本資料 | 蒐集(註冊)<br>&<br>利用(帳戶登入) | C001(辨識個人者)<br>C011(個人描述) | 一般個資:<br>- 帳密<br>- 姓名<br>- E-mail<br>- 國家<br>- 機構名稱&職稱 | 資料庫 | BSSH, LIMS<br>帳戶資料庫 | 系統 APIs/系統授權 | 直到帳戶刪除<br>或系統下架 | BSSH, LIMS | BSSH, LIMS 服務條款和私隱政策 |
| DNA | 蒐集 | C113<br>(種族或血統來源) | 特種個資:基因 | 生物檢體 | 機構實驗室 | 各實驗室<br>集中管控 | 檢體有效期限/<br>依合約中止 | 無 | 依合約 |
| bcl,fastq, bam, cram, vcf | 處理 | C113<br>(種族或血統來源) | 特種個資:基因 | 電子檔 | 儲存體S3 | S3 APIs/授權存取 | 永久/依合約中止 | TWCC | 依合約 |
- ### BSSH 平台上的個資

- ### 參考資料
- 法規名稱:[個人資料保護法之特定目的及個人資料之類別](https://mojlaw.moj.gov.tw/LawContent.aspx?LSID=FL010631) (2012年)
- 代號 識別類:
- C○○一 辨識個人者:姓名、職稱、工作地址、電子郵遞地址
- C○○二 辨識財務者
- C○○三 政府資料中之辨識者
- 代號 特徵類:
- C○一一 個人描述:國籍
- C○一二 身體描述
- C○一三 習慣
- C○一四 個性
- ...
- 代號 健康與其他:
- C一一一 健康紀錄
- C一一三 種族或血統來源
- 去氧核糖核酸資料等
<br>
:::warning
:confused: **Question2** :question:
公司名稱,歸類為「雇主」?或是「工作地址」?
:::
:::warning
:confused: **Question3** :question:
C○○一 (辨識個人者) 有職稱、工作地址
C○六一 (現行之受僱情形) 亦有僱主、工作職稱、工作地點
兩者如何區別?
:::
<br>
## P.42 演練四:適法性與隱私衝擊評估
- ### 個資使用的目的?期限?
- 依照國衛院合約
- ### 個資是如何蒐集的?
- ### 法規要求的書面授權是以何種方式進行?如何保存?
- ### 哪些系統與個資有關?
- TWCC S3, illumina BSSH
- ### 誰可以存取這些個資?存取方式為何?
- 集中管控與授權
- 存取方式為使用 TWCC S3 APIs
- ### 有對哪些第三方揭露個資?揭露之目的為何?
- 第三方醫療機構實驗室、學術單位
- 目的為研究之用
- ### 個資以哪種形式進行儲存?(電子或紙本)
- 電子
- ### 個資儲存在那?用哪些方式保護?保存期限?
- 儲存在 [TWCC S3](https://www.twcc.ai/doc?page=object&euqinu=true)
- ### 超過保存期限的個資如何處理?
- 依合約處理
<br>
## P.55 資訊資產與弱點的對應表
[](https://i.imgur.com/QPSeYbr.png)
<br>
## P.56 資訊資產弱點與威脅的對應表
[](https://i.imgur.com/n6wXnuq.png)
- 弱點與威脅是成對關係
<br>
## P.57 資產費別與弱點、威脅關聯表
- C (Confidentiality, 機密性)
- I (Integreity, 完整性)
- A (Availability, 可用性)
- L (Liability, 義務)
- ## [資訊資產健康指標 CIAL 定義](https://www.bsmi.gov.tw/wSite/public/Attachment/f1410502077840.PDF)
- C 洩密造成競爭對手搶手客戶
- I 個資資訊不正確,影響公司營運
- A 個資遺失,導致取用中斷
- L 洩密行為牴觸個資法或公司業務執行安全規範
- ### [資通安全管理法及子法彙編](https://nicst.ey.gov.tw/File/939F61F0EC63C411) (from gov.tw)

<br>
## P.58 演練五:識別資訊安全風險項目&演練六:分析與評估資訊安全風險
> 選 3 項討論
| 資產名稱 | 資產價值 | 弱點 | 威脅 | 對於 CIA 造成的後果<br>影響程度 | 弱點程度 | 威脅機率 | ==風險值== | 風險處置 |
|---------|----------|------|------|-------|----------|----------|----------|----------|
| TWCC S3 | 4 | 缺乏安全意識 | 使用者資安不足 | 取得類管理員權限<br>導致資料外洩 | 1 (不容易被利用) | 4 (發生可能性極高) | 16<br>(=4x1x4) | 未超過 27 分 |
| TWCC S3 | 4 | 未控制複製 | 機房進出控制不足 | 內部人員拷貝硬碟<br>導致資料失竊 | 1 (不容易被利用) | 2 (發生可能性中度) | 8<br>(=4x1x2) | 未超過 27 分 |
| TWCC 網路 | 1 | 多家實驗室同時下載大量基因體<br>導致**網路流量超過負荷** | 網路服務失效 | 下載速度緩慢<br>或經常斷線(timeout)<br>或無回應 | 2 (有時可能被利用) | 2 (發生可能性中度) | 4<br>(=1x2x2) | 未超過 27 分 |
- ### 公式
```
資產價值 = max(機密性, 完整性, 可用性)
```
```
風險值 = 資產價值 x 弱點程度 x 威脅機率
```
:::warning
:confused: **Question4** :question:
(P.64)課本的公式是:
資產價值 = 機密性 + 完整性 + 可用性

:::
- ### 資產價值
- ==**機密性**評估標準== (參考資料:[資產價值鑑別, P11](https://pims.ocu.edu.tw/ezfiles/47/1047/attach/43/pta_14382_1677305_10030.pdf))
| 評估標準 | 數值 |
| ------ | -------- |
| 一般:此資訊資產無特殊之機密性要求 | 1 |
| 限閱:此資訊資產含敏感資訊,但無特殊之機密性要求,<br>且僅供組織內部人員或被授權之外部單位使用 | 2 |
| 敏感:此資訊資產僅供內部相關業務承辦人員存取 | 3 |
| 機密:此資訊資產所包含資訊為組織或法律所規範的機密資訊 | 4 |
- ==**完整性**評估標準== (參考資料:[資產價值鑑別, P11](https://pims.ocu.edu.tw/ezfiles/47/1047/attach/43/pta_14382_1677305_10030.pdf))
| 評估標準 | 數值 |
| ------ | -------- |
| 資產本身完整性要求極低 | 1 |
| 資產本身具有完整性要求,但是完整性被破壞不會對本會造成傷害 | 2 |
| 資產具有完整性要求,且完整性被破壞會對組織造成傷害,但不至於太嚴重 | 3 |
| 資產具有完整性要求,且完整性被破壞會對組織造成傷害,甚至會造成業務終止 | 4 |
- ==**可用性**評估標準== (參考資料:[資產價值鑑別, P12](https://pims.ocu.edu.tw/ezfiles/47/1047/attach/43/pta_14382_1677305_10030.pdf))
| 評估標準 | 數值 |
| ------ | -------- |
| 該資訊資產容許失效 3 天以上,不用被修復或是尋找替代品。| 1 |
| 該資訊資產容許失效 8 小時以上,3 天以下,不用被修復或是尋找替代品。| 2 |
| 該資訊資產容許失效 4 小時以上,8 小時以下,不用被修復或是尋找替代品。| 3 |
| 該資訊資產容許失效 4 小時內不用被修復或是尋找替代品。| 4 |
- ### 弱點程度 (課本P61:資訊資產弱點脆弱度評估標準)

- ### 威脅機率 (課本P62:資訊資產威脅發生機率評估標準)

- ### [參考資料] [資產價值鑑別 P21](https://www.ilrc.edu.tw/data/1030305.pdf)

- ### [參考資料] [風險值的計算 P20](https://pims.ocu.edu.tw/ezfiles/47/1047/attach/43/pta_14382_1677305_10030.pdf)

<br>
## P.81 演練七:規劃資訊安全處理計畫
| 資產名稱 | 資產價值 | 弱點 | 威脅 | 對於 CIA 造成的後果<br>影響程度 | 弱點程度 | 威脅機率 | ==風險值== | 風險處置 | ◎弱點程度 | ◎威脅機率 | ==◎風險值== |
|---------|----------|------|------|-------|----------|----------|----------|----------|----------|----------|----------|
| TWCC S3 | 4 | 缺乏安全意識 | 使用者資安不足 | 取得類管理員權限<br>導致資料外洩 | 1 (不容易被利用) | 4 (發生可能性極高) | 16<br>(=4x1x4) | **系統軟體強制類管理者<br>使用「高強度密碼」<br>(大小寫英文、數字及特殊符號)** | 1 (不容易被利用) | 1 (發生可能性低或無) | 4 |
| TWCC S3 | 4 | 未控制複製 | 機房進出控制不足 | 內部人員拷貝硬碟<br>導致資料失竊 | 1 (不容易被利用) | 2 (發生可能性中度) | 8<br>(=4x1x2) | **資料庫加密<br>&進出刷卡管制** | 1 (不容易被利用) | 1 (發生可能性低或無) | 4 |
| TWCC 網路 | 1 | 多家實驗室同時下載大量基因體<br>導致**網路流量超過負荷** | 網路服務失效 | 下載速度緩慢<br>或經常斷線(timeout)<br>或無回應 | 2 (有時可能被利用) | 2 (發生可能性中度) | 4<br>(=1x2x2) | **加大頻寬** | 2 (有時可能被利用) | 1 (發生可能性低或無) | 2 |
<br>
<br>
<hr>
<hr>
<br>
<br>
## 先進人工智慧大數據計算主機與儲存系統需求書 (RFP)
### 3.2.2 資訊安全平台
#### 3.2.2.1 法規遵循

<br>
<br>
<hr>
<hr>
<br>
<br>
## 書本風險重點

<br>

- 風險調整 (Risk modification)
- 風險自留 (Risk retention)
- 風險避免 (Risk avoidance)
- 風險分攤 (Risk sharing)
<br>
<br>
<hr>
<hr>
<br>
<br>
## 參考資料
- ### [取法HIPAA 落實醫療資安防護](https://www.informationsecurity.com.tw/article/article_detail.aspx?t3id=10&aid=145)
> HIPAA(Health Insurance Portability and Accountability,
> ...,
> 對於醫療資訊的應用、交換機制及保護規範的非常詳盡,已經成為世界各國訂定相關法規參考的重要標準。
- ### [個資盤點的3大原則](https://www.ithome.com.tw/news/88871)

- ### [[台灣] 新版個資法上路,4個重點、8大案例,認識網路個人資料保護問題](https://www.techbang.com/posts/10878-law-of-personal-data-protection-of-the-interests-of-you-and-me-on-several-networks-of-common-funding-legal-issues-pchome-201-science-and-technology)
- #### 新舊版個資法差異

- #### 處理個人資料的三個層次

- #### 個資外洩的舉證責任
> 回到了企業團體身上,企業需證明是否已對個人資料善盡保管之責
- #### 各國個資狀況
> 葉律師解釋,目前個資法最完備、標準最高,執行也最徹底的地方,其實是在歐盟,
>
> 日本現今的法律與我們新版的個資法差不多,雖未到歐盟的標準,但也相當接近了,
>
> 而美國對於個人資料的保護,是分散在各法規之中,並無獨立的專法,
>
> 所以我國新版個資法已相當先進,應可處理絕大部分的個資問題。
>
- 美國+醫療:HIPAA
- 歐盟:[GDPR(General Data Protection Regulation, 一般資料保護規範)](https://zh.wikipedia.org/zh-tw/%E6%AD%90%E7%9B%9F%E4%B8%80%E8%88%AC%E8%B3%87%E6%96%99%E4%BF%9D%E8%AD%B7%E8%A6%8F%E7%AF%84)
- ### [從歐盟GDPR看資料治理與隱私保護](https://s.itho.me/cybersec/2019/slides/320/J_%E4%B8%96%E8%B2%BF%E7%AC%AC%E4%BA%94/0320J41610%E9%AD%AF%E5%90%9B%E7%A6%AE.pdf)

<br>
