--- tags: 討論議程 --- # 05/05 ## 輪流講講這週進度&下週打算做什麼 ### Mika * 第二題,講Dask,OpenUCX,UCX-py是甚麼軌,下周研究code ### Jocelin * DASK, UCX, UCX-py 安裝OK 應該是改 DASK 安裝檔裡的內容(與通信相關 但還不確定改哪裏) * 猜安裝前要改python檔。知道要怎麼安裝,但不知道要改什麼 ### 淑微 * 看論文&模型 51筆關於基因排序的資料 * valid 28 * test 23 * 資料集:身體不同部位的核甘酸基因 * DNase-seq:提取特徵值 * DNA sequence: TACG轉成數字(one-hot-encoding) * 報告:講module;下週看code cell-type specific TF? * Reference 資料集: https://www.synapse.org/#!Synapse:syn6176232 論文的Code: https://github.com/GuanLab/Leopard ### 霖均 * 解釋基因轉錄機制(? * RNA-seq * 轉錄因子是蛋白質,要找轉錄因子會附著在哪段基因上 * 題目目的:用mpi建module>更好或更快的找到 TF binding * 資料: Chip-seq: https://www.youtube.com/watch?v=nkWGmaYRues DNase-seq: https://www.youtube.com/watch?v=4VE44dAOe-g RNA-seq: https://www.youtube.com/watch?v=tlf6wYJrwKY PCA(一種資料分析方法): https://www.youtube.com/watch?v=_UVHneBUBW0 ### 子瑜 * 第三題論文翻譯、大概看架構(前面的別人的研究,有講到TF binding主要結合在開放染色體、不同細胞類型會不同 * 第一題 看了Install 跟input card * input card:https://www.youtube.com/watch?v=9jD1KY426EM * 報告:WRF;下周看QE能算什麼、轉錄因子是什麼 ### Steven * CP,內容要再研究 * 報告:PW流程、理論(密度泛涵 * input:可以優化control card, system card等的部分 ### 要有人做的部分: * 1.理解轉錄因子的作用、是不是要找特定的 * 2.Dask benchmark哪些是範例哪些是解答 * 3.第三題要用horovod嗎?還是只用mpi就可以? ## 雲端有各個題目的資料夾 & 要不要每個題目創一個Line群? (怎麼樣資訊比較流通?) 不用,怕分散=>放雲端 hackMD(分題目開 ## 覺得完成"可以跑mpi"這個目標,各個題目的時限分別要多久? * 第二題 跑mpi感覺不是這題的目標 * 第一題 1個月 * 第三題 2個月 ## 明天的報告(大家有東西可以報告嗎?討論內容、分工......) ## 其它