Illumina / DRAGEN === ###### tags: `Illumina`, `基因體` <br> **目錄** [TOC] <br> ## [產品介紹](https://www.illumina.com/products/by-type/informatics-products/dragen-bio-it-platform.html) - DRAGEN Germline Pipeline [![](https://i.imgur.com/MEkTZ3V.png)](https://i.imgur.com/MEkTZ3V.png) <br> ## 實際操作測試 ### 組態設定(Configuration) 1. ### 分析的名稱 <img src="https://i.imgur.com/h95thiO.png" style="border: solid 1px #666;" /> 2. ### 將分析結果存回 <img src="https://i.imgur.com/zpvEmjn.png" style="border: solid 1px #666;" /><br><br> - 如果你只是 viewer (READ ONLY),會有如下的錯誤訊息: ![](https://i.imgur.com/GTfTBY8.png) - **解決方法一**: 用戶甲:專案擁有者 用戶乙:用戶甲將專案分享給他人 用戶乙需另外開新的資料夾,來儲存變異分析結果 - **解決方法二**: 擁有者將權限 Read Only 變更為 Write ![](https://i.imgur.com/3fYgf7h.png) 3. ### 從生物樣本清單中,選擇基因序列檔案 [![](https://i.imgur.com/jjK1OQo.png)](https://i.imgur.com/jjK1OQo.png) - 有 3 種格式 - FASTQ - BAM - CRAM - 最後一欄:性別 4. ### 管線組態設定 ![](https://i.imgur.com/FZwPzSG.png) - Map/Align Only (比對到全基因體) - Map/Align + VariantCaller (比對到全基因體+變異分析) 5. ### 參考基因體 ![](https://i.imgur.com/JC64541.png) | Label | value | | ----- | ----- | | Human (UCSC hg19) | hg19-altaware-cnv-anchor.v7 | | Human (Ensembl GRCh37) | grch37-cnv-anchor.v7 | | Human (hg38 Alt-Aware, with HLAs) | hg38-altaware-cnv-anchor.v7 | | Human (hg38 Alt-Aware, No HLAs) | hg38-altaware-nohla-cnv-anchor.v7 | | Human (Ensembl hs37d5: GRCh37+decoy) | hs37d5-cnv-anchor.v7 | | Custom | custom.v7 | 1. [最新人類參考序列的兩個版本NCBI(GRCh38)和UCSC(hg38)有什麼差異?](https://kknews.cc/news/lngvmeg.html) - GRCh38 多了 - #### EBV (Epstein-Barr Virus) 序列 - EBV 本身不是人所有的 - 許多通過細胞系測序而來的數據中(比如海拉細胞系),就會混有這個序列 - #### Decoy 序列 + HLA 分型序列 - Decoy序列:其他人群特有的人類序列 - #### 簡併鹼基的表達方式不同 - [用一个符号代替某两个或者更多碱基](https://baike.baidu.com/item/%E7%AE%80%E5%B9%B6%E7%A2%B1%E5%9F%BA) > 编译丙氨酸的可以有4个密码子:GCU\GCC\GCA\GCG,这时生物学上为了方便,用字母N指代UCAG四个碱基,故说编译丙氨酸的密码子是GCN,其中N就是简并碱基。 - #### Y 軟色體上的 PAR (偽染色體序列) 1. [[wiki] 海拉細胞系](https://zh.wikipedia.org/wiki/%E6%B5%B7%E6%8B%89%E7%BB%86%E8%83%9E) - [有的人死了,可细胞还活着](http://zqb.cyol.com/content/2010-03/31/content_3160886.htm) > 如今,海拉细胞已经成为医学研究中非常重要的工具。无论是治疗疱疹、白血病、流感、血友病,或者帕金森氏病,还是研发小儿麻痹症的疫苗,都离不开基于海拉细胞的研究。 > > 一些科学家把它们暴露在放射性或者有毒物质中,希望找到一种方法,只杀死癌细胞,却不伤害正常细胞。 > 现在,海拉细胞已经成为生物学研究中的标准细胞。“在基础医学的研究领域,几乎每一篇重要的论文,背后都包含用海拉细胞所做的实验。”刘振云说。 > > 盖伊在研究小儿麻痹症疫苗时发现,海拉细胞不仅容易感染病毒,而且在感染后随着它们的不断分裂,它们还像一台“疫苗生产器”一样,造出了更多的病毒。 - [这些细胞害死了主人之后,又在实验室里繁殖了18000代](https://zhuanlan.zhihu.com/p/38857803) 1. [[wiki] 細胞系](http://cht.a-hospital.com/w/%E7%BB%86%E8%83%9E%E7%B3%BB) - 細胞系 - 泛指一般可能傳代的細胞 - 其中能夠連續傳代的細胞,叫做「連續細胞系」或「無限細胞系」 - 不能連續培養的稱為有限細胞系 - 大多數二倍體細胞為有限細胞系 - 細胞株 - 通過選擇法或克隆形成法,從原代培養物或細胞系中 獲得具有特殊性質或標誌物的培養物稱為細胞株 1. [GRC](https://wenlongshen.github.io/2020/03/26/Reference-Genome/) - 目前发布的人类参考基因组,主要包含以下序列: - **Assembled chromosomes** 22+XY+M,即23对染色体和线粒体基因组,作为日常研究分析的主要序列 - **Unlocalized sequences** 已被定为到某条染色体上,但方向或具体位置仍未确定,以_random结尾 - **Unplaced sequences** 尚未被定位到某条染色体,以chrUn_开头 - **Alternate loci** 不同的单倍体型,一般以_alt结尾,也包括HLA序列 - **EBV & decoy sequences** 不属于人类基因组,但是高通量测序时会被测到的序列,标注为chrEBV及以_decoy结尾的序列 1. HLA - [從古代的親子鑑定談現代的人類白血球抗原「HLA」](http://foundation.nmns.edu.tw/writing/hotnews2_detail.php?gid=8&id=631) - 使用 「人類白血球抗原」(HLA)作為親子鑑定的依據,,鑑別度90% 如果沒有血緣關係,很難找到二個人的細胞表現出相同的 HLA 分子組合 - HLA 是人類的主要組織相容性複合體(Major Histocompatibility Complex, MHC) - HLA 位於第六號染色體的短臂上 - HLA 目前已知的人類染色體中基因密度最高,也是多型性最為豐富的區域,可以作為每個生物體與生俱來所獨有的生化指紋。 - 更多資訊 [[hackmd] 基因體 / 科普知識](/W8jsCuM4QwWlNHSA20M_4A) 1. pending - [「生資無價系列專題」- 使用次世代定序技術來分析基因體的變異點前應該要知道的幾件事](https://medium.com/@chungtsai/_-9c7c9521059d) ![](https://i.imgur.com/HRSkwzg.png) <br> ![](https://i.imgur.com/C9abJzy.png) - [人類參考基因體 (Human Reference Genome) ](http://toolsbiotech.blog.fc2.com/blog-entry-119.html?sp) - [2020-01-15 了解人类不同版本参考基因组及如何选择](https://www.codenong.com/jse65115b4633a/) - [关于人参考基因组fasta文件的组成部分说明](https://www.jianshu.com/p/5b73773e30ef) - [The decoy genome](https://www.cureffi.org/2013/02/01/the-decoy-genome/) - [Haplotypes and patches](http://m.ensembl.org/info/genome/genebuild/haplotypes_patches.html) - [What are the alternate loci?](https://www.researchgate.net/post/What_are_the_alternate_loci) - [[gatk] GRCh37 hg19 b37 humanG1Kv37 - Human Reference Discrepancies](https://gatk.broadinstitute.org/hc/en-us/articles/360035890711-GRCh37-hg19-b37-humanG1Kv37-Human-Reference-Discrepancies#humanG1Kv37) - [[gatk] Human genome reference builds - GRCh38 or hg38 - b37 - hg19](https://gatk.broadinstitute.org/hc/en-us/articles/360035890951-Human-genome-reference-builds-GRCh38-or-hg38-b37-hg19) - [基因型鑑定](https://sites.google.com/a/metek-lab.com.tw/metek/product/genotyping) - [植物的微小 RNA](https://highscope.ch.ntu.edu.tw/wordpress/?p=73326) - [(How to) Map reads to a reference with alternate contigs like GRCH38](https://gatk.broadinstitute.org/hc/en-us/articles/360037498992--How-to-Map-reads-to-a-reference-with-alternate-contigs-like-GRCH38) - [The decoy genome](https://www.cureffi.org/2013/02/01/the-decoy-genome/) > But the EBV genome is only ~170kb, while the full decoy genome is ~36Mb. <br> ## tmp ![](https://i.imgur.com/s4Y1pVc.png) <br> ## 參考資料 - ### [Illumina DRAGEN Bio-IT Platform / Support Resources](https://support.illumina.com/sequencing/sequencing_software/dragen-bio-it-platform.html) - ### [Illumina DRAGEN Bio-IT Platform / Intro](https://www.illumina.com/products/by-type/informatics-products/dragen-bio-it-platform.html) ![](https://i.imgur.com/VcC8aXo.png) ![](https://i.imgur.com/AwqEudi.png) - ### 2019/04/29 - [DRAGEN v3.3.7 Software Release Notes ](https://support.illumina.com/content/dam/illumina-support/documents/downloads/software/dragen/1000000086188_00_Dragen-v3-3-7-Customer%20Release%20Notes.pdf) - ### [[AWS] DRAGEN Complete Suite](https://aws.amazon.com/marketplace/pp/B07CZ3F5HY?qid=1580928621564&sr=0-1&ref_=srh_res_product_title) ![](https://i.imgur.com/xWBnEpf.png) - ### [[DRAGEN優勢] 覺得分析太平凡?! 構造改革你的基因分析](https://www.prismabiotech.com.tw/post/覺得分析太平凡-構造改革你的基因分析)