Illumina / DRAGEN
===
###### tags: `Illumina`, `基因體`
<br>
**目錄**
[TOC]
<br>
## [產品介紹](https://www.illumina.com/products/by-type/informatics-products/dragen-bio-it-platform.html)
- DRAGEN Germline Pipeline
[](https://i.imgur.com/MEkTZ3V.png)
<br>
## 實際操作測試
### 組態設定(Configuration)
1. ### 分析的名稱
<img src="https://i.imgur.com/h95thiO.png" style="border: solid 1px #666;" />
2. ### 將分析結果存回
<img src="https://i.imgur.com/zpvEmjn.png" style="border: solid 1px #666;" /><br><br>
- 如果你只是 viewer (READ ONLY),會有如下的錯誤訊息:

- **解決方法一**:
用戶甲:專案擁有者
用戶乙:用戶甲將專案分享給他人
用戶乙需另外開新的資料夾,來儲存變異分析結果
- **解決方法二**:
擁有者將權限 Read Only 變更為 Write

3. ### 從生物樣本清單中,選擇基因序列檔案
[](https://i.imgur.com/jjK1OQo.png)
- 有 3 種格式
- FASTQ
- BAM
- CRAM
- 最後一欄:性別
4. ### 管線組態設定

- Map/Align Only (比對到全基因體)
- Map/Align + VariantCaller (比對到全基因體+變異分析)
5. ### 參考基因體

| Label | value |
| ----- | ----- |
| Human (UCSC hg19) | hg19-altaware-cnv-anchor.v7 |
| Human (Ensembl GRCh37) | grch37-cnv-anchor.v7 |
| Human (hg38 Alt-Aware, with HLAs) | hg38-altaware-cnv-anchor.v7 |
| Human (hg38 Alt-Aware, No HLAs) | hg38-altaware-nohla-cnv-anchor.v7 |
| Human (Ensembl hs37d5: GRCh37+decoy) | hs37d5-cnv-anchor.v7 |
| Custom | custom.v7 |
1. [最新人類參考序列的兩個版本NCBI(GRCh38)和UCSC(hg38)有什麼差異?](https://kknews.cc/news/lngvmeg.html)
- GRCh38 多了
- #### EBV (Epstein-Barr Virus) 序列
- EBV 本身不是人所有的
- 許多通過細胞系測序而來的數據中(比如海拉細胞系),就會混有這個序列
- #### Decoy 序列 + HLA 分型序列
- Decoy序列:其他人群特有的人類序列
- #### 簡併鹼基的表達方式不同
- [用一个符号代替某两个或者更多碱基](https://baike.baidu.com/item/%E7%AE%80%E5%B9%B6%E7%A2%B1%E5%9F%BA)
> 编译丙氨酸的可以有4个密码子:GCU\GCC\GCA\GCG,这时生物学上为了方便,用字母N指代UCAG四个碱基,故说编译丙氨酸的密码子是GCN,其中N就是简并碱基。
- #### Y 軟色體上的 PAR (偽染色體序列)
1. [[wiki] 海拉細胞系](https://zh.wikipedia.org/wiki/%E6%B5%B7%E6%8B%89%E7%BB%86%E8%83%9E)
- [有的人死了,可细胞还活着](http://zqb.cyol.com/content/2010-03/31/content_3160886.htm)
> 如今,海拉细胞已经成为医学研究中非常重要的工具。无论是治疗疱疹、白血病、流感、血友病,或者帕金森氏病,还是研发小儿麻痹症的疫苗,都离不开基于海拉细胞的研究。
>
> 一些科学家把它们暴露在放射性或者有毒物质中,希望找到一种方法,只杀死癌细胞,却不伤害正常细胞。
> 现在,海拉细胞已经成为生物学研究中的标准细胞。“在基础医学的研究领域,几乎每一篇重要的论文,背后都包含用海拉细胞所做的实验。”刘振云说。
>
> 盖伊在研究小儿麻痹症疫苗时发现,海拉细胞不仅容易感染病毒,而且在感染后随着它们的不断分裂,它们还像一台“疫苗生产器”一样,造出了更多的病毒。
- [这些细胞害死了主人之后,又在实验室里繁殖了18000代](https://zhuanlan.zhihu.com/p/38857803)
1. [[wiki] 細胞系](http://cht.a-hospital.com/w/%E7%BB%86%E8%83%9E%E7%B3%BB)
- 細胞系
- 泛指一般可能傳代的細胞
- 其中能夠連續傳代的細胞,叫做「連續細胞系」或「無限細胞系」
- 不能連續培養的稱為有限細胞系
- 大多數二倍體細胞為有限細胞系
- 細胞株
- 通過選擇法或克隆形成法,從原代培養物或細胞系中
獲得具有特殊性質或標誌物的培養物稱為細胞株
1. [GRC](https://wenlongshen.github.io/2020/03/26/Reference-Genome/)
- 目前发布的人类参考基因组,主要包含以下序列:
- **Assembled chromosomes**
22+XY+M,即23对染色体和线粒体基因组,作为日常研究分析的主要序列
- **Unlocalized sequences**
已被定为到某条染色体上,但方向或具体位置仍未确定,以_random结尾
- **Unplaced sequences**
尚未被定位到某条染色体,以chrUn_开头
- **Alternate loci**
不同的单倍体型,一般以_alt结尾,也包括HLA序列
- **EBV & decoy sequences**
不属于人类基因组,但是高通量测序时会被测到的序列,标注为chrEBV及以_decoy结尾的序列
1. HLA
- [從古代的親子鑑定談現代的人類白血球抗原「HLA」](http://foundation.nmns.edu.tw/writing/hotnews2_detail.php?gid=8&id=631)
- 使用 「人類白血球抗原」(HLA)作為親子鑑定的依據,,鑑別度90%
如果沒有血緣關係,很難找到二個人的細胞表現出相同的 HLA 分子組合
- HLA 是人類的主要組織相容性複合體(Major Histocompatibility Complex, MHC)
- HLA 位於第六號染色體的短臂上
- HLA 目前已知的人類染色體中基因密度最高,也是多型性最為豐富的區域,可以作為每個生物體與生俱來所獨有的生化指紋。
- 更多資訊
[[hackmd] 基因體 / 科普知識](/W8jsCuM4QwWlNHSA20M_4A)
1. pending
- [「生資無價系列專題」- 使用次世代定序技術來分析基因體的變異點前應該要知道的幾件事](https://medium.com/@chungtsai/_-9c7c9521059d)

<br>

- [人類參考基因體 (Human Reference Genome)
](http://toolsbiotech.blog.fc2.com/blog-entry-119.html?sp)
- [2020-01-15 了解人类不同版本参考基因组及如何选择](https://www.codenong.com/jse65115b4633a/)
- [关于人参考基因组fasta文件的组成部分说明](https://www.jianshu.com/p/5b73773e30ef)
- [The decoy genome](https://www.cureffi.org/2013/02/01/the-decoy-genome/)
- [Haplotypes and patches](http://m.ensembl.org/info/genome/genebuild/haplotypes_patches.html)
- [What are the alternate loci?](https://www.researchgate.net/post/What_are_the_alternate_loci)
- [[gatk] GRCh37 hg19 b37 humanG1Kv37 - Human Reference Discrepancies](https://gatk.broadinstitute.org/hc/en-us/articles/360035890711-GRCh37-hg19-b37-humanG1Kv37-Human-Reference-Discrepancies#humanG1Kv37)
- [[gatk] Human genome reference builds - GRCh38 or hg38 - b37 - hg19](https://gatk.broadinstitute.org/hc/en-us/articles/360035890951-Human-genome-reference-builds-GRCh38-or-hg38-b37-hg19)
- [基因型鑑定](https://sites.google.com/a/metek-lab.com.tw/metek/product/genotyping)
- [植物的微小 RNA](https://highscope.ch.ntu.edu.tw/wordpress/?p=73326)
- [(How to) Map reads to a reference with alternate contigs like GRCH38](https://gatk.broadinstitute.org/hc/en-us/articles/360037498992--How-to-Map-reads-to-a-reference-with-alternate-contigs-like-GRCH38)
- [The decoy genome](https://www.cureffi.org/2013/02/01/the-decoy-genome/)
> But the EBV genome is only ~170kb, while the full decoy genome is ~36Mb.
<br>
## tmp

<br>
## 參考資料
- ### [Illumina DRAGEN Bio-IT Platform / Support Resources](https://support.illumina.com/sequencing/sequencing_software/dragen-bio-it-platform.html)
- ### [Illumina DRAGEN Bio-IT Platform / Intro](https://www.illumina.com/products/by-type/informatics-products/dragen-bio-it-platform.html)


- ### 2019/04/29 - [DRAGEN v3.3.7 Software Release Notes ](https://support.illumina.com/content/dam/illumina-support/documents/downloads/software/dragen/1000000086188_00_Dragen-v3-3-7-Customer%20Release%20Notes.pdf)
- ### [[AWS] DRAGEN Complete Suite](https://aws.amazon.com/marketplace/pp/B07CZ3F5HY?qid=1580928621564&sr=0-1&ref_=srh_res_product_title)

- ### [[DRAGEN優勢] 覺得分析太平凡?! 構造改革你的基因分析](https://www.prismabiotech.com.tw/post/覺得分析太平凡-構造改革你的基因分析)