研究基因體,為何需要雲端平台? === ###### tags: `基因體`, `雲端平台` <br> ## 硬體設施 - ### 大量的記憶體 - 能載入大量的基因序列 - ### 大量的儲存空間 - 能存放龐大的基因體 - [SRA: PRJNA319058](https://www.ncbi.nlm.nih.gov/Traces/study/?acc=PRJNA319058&o=acc_s%3Aa) 檔案大小以 GB 起跳 (SRA: 用來收錄全世界所產生的公開定序原始資料) <br> ## 軟體設施 - #### 需要支援 FTP - 上傳大量的基因體或其他生物資料庫,無法在短時間內完成,需要支援續傳功能 - 上傳的過程中,可能面臨網路突然斷線的問題,需要支援續傳功能 - #### 提供方便的公開資料集 - 將定序序列參考到全基因體上,需要對應版本的參考基因體資訊 - 在做 SNP 分析時,需要有各用途的生物資料庫 根據群體的發生頻率來決定是否有致病的可能性 - #### 需要使用表單來操作工具,來降低使用工具的門檻 - 最佳的例子:Galaxy - 一個工具通常帶有多個參數,每個參數設定的複雜性不一 初次入門的使用者,對參數的使用可能不甚理解 - 使用者不需要學習太多的 Linux 指令,只要了解生物計算的流程即可 - #### 提供工作流程的串接 - 做分析時,需要串接多個工具 - #### 安全性要高 - 基因體資訊,可能涉及到個人/病人的隱私 - #### 結論 - 完善的平台、操作便利,將可以提供給更多人來使用