基因體術語
===
###### tags: `基因體`
###### tags: `生物資訊`, `基因體`, `術語`
<br>
[TOC]
<br>
### ATAC-seq
- ### [ATAC-seq著色非編碼DNA 繪出人類癌症染色質圖譜](https://geneonline.news/atac-seq-mapping-the-chromatin-landscape-of-human-cancers/)
- 類似於 DNA 噴漆的技術
- 準確地了解哪些 DNA 的部位是活躍的
### CombineGVCFs
- ### [GATK / Tool Index / 4.0.1.1 / CombineGVCFs ](https://gatk.broadinstitute.org/hc/en-us/articles/360037053272-CombineGVCFs)
- Input
Two or more HaplotypeCaller GVCFs to combine.
- Output
A combined multi-sample gVCF.
- 流程似乎是
1. HaplotypeCaller -> gvcf1, gvcf2, gvcf3
2. gvcf1, gvcf2, gvcf3 -> CombineGVCFs -> gvcf
3. gvcf -> [GenotypeGVCFs](https://gatk.broadinstitute.org/hc/en-us/articles/360041417092-GenotypeGVCFs) -> vcf
<br>
### fusion gene (融合基因)
- [融合基因(fusion gene) 簡介](https://yourgene.pixnet.net/blog/post/70857951)
<br>
### Genotype (Ref:[Genotyping](#Genotyping))
- [Genotyping: Terms to know](https://sg.idtdna.com/pages/education/decoded/article/genotyping-terms-to-know)
[](https://i.imgur.com/sqhOjkW.png)
<br>
### GenotypeGVCFs #GenotypeGVCFs
- ### [GATK / Tool Index / 4.1.6.0 / GenotypeGVCFs ](https://gatk.broadinstitute.org/hc/en-us/articles/360041417092-GenotypeGVCFs)
- ### [GATK 4.0 WGS germline call variant](https://www.bioinfo-scrounger.com/archives/622/)
<br>
### Genotyping
- [[wiki] 基因型分型](https://zh.wikipedia.org/wiki/基因型分型)
- **基因型分型(英語:genotyping)** 是一個通過生物檢定法檢測某一個體的DNA序列,並對比參照其他個體的基因型或序列的過程,可用於顯示該個體等位基因從其父母遺傳而來的情況.
- [Genotyping: Terms to know](https://sg.idtdna.com/pages/education/decoded/article/genotyping-terms-to-know)
- **Genotyping** is the process of determining the DNA sequence—the genotype—at specific positions within a gene of an individual.
**基因分型**是決定基因型 DNA 序列的一個過程,該基因型位於某一個體中的一組基因的多個特定位置。
- keywords
- Allele
- Polyallelic
- Locus
- Haplotype
- Zygosity
- Dominant allele (B)
- Recessive allele (b)
- Homozygous (BB, bb)
- Heterozygous (Bb)
- Hemizygous (B, b)
- Genotype
- phenotype
- Allele frequency
- ...
- [What is genotyping?](https://sg.idtdna.com/pages/applications/genotyping)
- **Genotyping** is the experimental procedure that identifies the differences in DNA sequence among individuals or populations.
基因分型是確定個體或群體之間 DNA 序列差異的實驗程序。
<br>
### GVCF #GVCF #g.VCF
- ### [GVCF - Genomic Variant Call Format Avatar](https://gatk.broadinstitute.org/hc/en-us/articles/360035531812-GVCF-Genomic-Variant-Call-Format)
- ### [GATK 4.0 WGS germline call variant](https://www.bioinfo-scrounger.com/archives/622/)
- 为了加快速度,可以采用下述分染色体来call variant(也就是一个染色体生成一个VCF文件,22条常染色体 + XY性染色体,总共24个VCF文件)
#for-loop #forloop
- g.vcf简单的说是储存了所有位点的变异信息(不做任何可信度等的过滤)的vcf文件
- 按照以前的思路,将多个样本的g.vcf文件一起通过的GenotypeGVCFs进行joint genotyping
- 你在用GenotypeGVCFs前需要将多个样本的g.vcf文件用CombineGVCFs方式或者GenomicsDBImport方式合并成一个文件
- ### [GenomeWarp: 不同 assembly 之间高效转换 gVCF 文件的坐标](http://wap.sciencenet.cn/blog-656335-1170131.html?mobile=1)
[](https://i.imgur.com/m5T10j5.png)
<br>
### Haplotype (Ref:[Genotyping](#Genotyping))
- [Genotyping: Terms to know](https://sg.idtdna.com/pages/education/decoded/article/genotyping-terms-to-know)
- Haplotype 單倍型
A set of DNA variations (polymorphisms such as SNPs and indels) adjacent to one another at the same locus that tend to be inherited together (Figure 1). This set of alleles is often referred to as linked polymorphisms.
一組 DNA 變異(多態性,如SNP和插入缺失)在同一位點上彼此相鄰,並且傾向於一起遺傳(圖 1)。這組等位基因通常稱為連鎖多態性。

| List | Unique |
| --- | ------- |
| AGT | AGT |
| GTA | GTA |
| AGT | |
| AGA | AGA |
| GTA | |
| GTA | |
#[Haplogroup (單倍群)](https://yourgene.pixnet.net/blog/post/117862887)
<br>
### HaplotypeCaller
- ### [GATK之HaplotypeCaller](https://www.itread01.com/content/1563186003.html)
- HC有一個GVCF模式,產生各個樣本的中間基因組檔案(gVCF),然後用於多樣本的聯合基因定型(joint genotyping),效率很高呢。
- ### [alling variants on cohorts of samples using the HaplotypeCaller in GVCF mode](https://sites.google.com/a/broadinstitute.org/legacy-gatk-forum-discussions/methods-and-algorithms/3893-Calling-variants-on-cohorts-of-samples-using-the-HaplotypeCaller-in-GVCF-mode) #GATK #GenotypeGVCFs
[](https://i.imgur.com/ueGkiqR.png)
<br>
### Joint genotyping
- ### [alling variants on cohorts of samples using the HaplotypeCaller in GVCF mode](https://sites.google.com/a/broadinstitute.org/legacy-gatk-forum-discussions/methods-and-algorithms/3893-Calling-variants-on-cohorts-of-samples-using-the-HaplotypeCaller-in-GVCF-mode) #GATK #GenotypeGVCFs
[](https://i.imgur.com/ueGkiqR.png)
---

- 3. Joint genotyping
> Take the outputs from step 2 (or step 1 if dealing with fewer samples) and run GenotypeGVCFs on all of them together to create the raw SNP and indel VCFs that are usually emitted by the callers.
> 獲取第 2 步(如果處理較少樣本,則為第 1 步)的輸出,並在所有這些輸出上運行 GenotypeGVCF,以創建通常由調用者發出的原始 SNP 和 indel VCF。
<br>
### Open reading frame, ORF
> - #基因預測#gene prediction
> - 如何判讀一個序列有無基因?
- [開放讀序框架 (Open reading frame)](https://highscope.ch.ntu.edu.tw/wordpress/?p=52906)
- DNA上會產生蛋白質部分稱為open reading frame(ORF)
- 起始密碼子在DNA上通常是ATG,但也有例外
- 終止密碼子在DNA上通常是TAA、TAG或TGA
- 基因
找到一段DNA前有起始密碼子,後有終止密碼子,且長度超過50個密碼子

- 內含子通常為一段以GT開頭、以AG結尾的片段
<br>
### PCR (#模板 #引子 #探針 #螢光 #DNA聚合酶 #CT)
- ### [即時定量PCR (Real-time PCR)](http://chuangfield.blogspot.com/2019/09/pcr-real-time-pcr.html) :+1: :+1: :100:
- 原理:
為PCR的另一種應用
- 螢光檢測方法
- ### 非探針型

<br>
- ### 探針型

- reporter 發出螢光訊號
- quencher 抑制螢光訊號
- 特性
- 探針型專一性較高
- DNA濃度越高,PCR循環數(Cycles)越少便能偵測到螢光訊號。
- 達到預設螢光強度所需要的Cycles (cycle threshold value, Ct值),與樣本原本DNA濃度成反比。
- 搭配已知核酸濃度與Ct值間反比的檢量線,便能畫出檢量線,利用此檢量線可計算出未知樣品的核酸濃度。
- ### [即時聚合酶連鎖反應(Real-time PCR)在植物病蟲害檢測上之應用](https://www.coa.gov.tw/ws.php?id=13001&print=Y)
- 「非探針型」的系統
就是在反應中加入會與雙股DNA嵌合而釋放出螢光的物質,目前最常被使用的螢光染劑是SYBR-green I
- 「探針型」系統
- 反應中除了要有專一性的引子對之外,
- 還要在引子對之間DNA序列中找到具有專一性的片段來作為探針
[](https://www.newton.com.tw/wiki/DNA%E6%8E%A2%E9%87%9D)
- ==**如果不是目標物種來做偵測,探針就不會雜合到核酸上,之後也就不會釋放出螢光而被偵測到**==
- 應用
- 植物蟲害
- 植物病害
- 開發了多組的引子對及探針,快速而精準的鑑定亞洲型及美洲型的黃龍病菌
[](http://chuangfield.blogspot.com/2019/09/pcr-real-time-pcr.html)
- ### [淺談COVID19(SARS-CoV 2)的檢驗方法](https://www.labmed.org.tw/knowledge_1.asp?mno=110)
\#社團法人台灣醫事檢驗學會
<br>
### PON (Panel Of Normal):
- 正常 VCF 數據集
- 功用
- 若體細胞變異位點在 PON 中,則視為雜訊
- 參考資料
- [使用GATK4 Mutect2 检测体细胞突变](https://zhuanlan.zhihu.com/p/63899960)
- PoN(正常样本callset)定义了一个预过滤变异位点集。②展示了如何创建一个PoN文件。PoN不仅呈现了通常的germline变异位点,也呈现了测序数据引入的噪音,如测序bias或比对bias。
1. 默认情况下,出现在PoN中的变异位点不认为是tumor样本的somatic变异也不会进行重组装。
2. 参数--genotype-pon-sites可以得到PoN位点的基因型信息
3. 如果tumor位点和PoN位点变异不是精确匹配,Mutect2会重新组装此区域,在变异文件中输出此位点,并在INFO列标记为“IN_PON”
- [「生資無價系列專題」- 在缺少正常組織的檢體時,該如何有效分析癌症病人的體細胞變異 (Somatic Mutation)? (以 Mutect2 為例)](https://chungtsai.medium.com/656ad90265ac)
<br>
### Sex Chromosomes 性染色體
- ### [一下2-3人類的遺傳(下列關於人類染色體的敍述,何者錯誤?)](http://wuchu0408.blogspot.com/2013/04/2-3_13.html)
- 不論是皮膚細胞,即便神經細胞、肌肉細胞、內臟細胞.....等等任何細胞(沒有細胞核的細胞,比如成熟紅血球細胞,當然就連染色體都沒有,不予考慮啦~)每個細胞核都有「性染色體」啦!
- 不是只有「性器官」才有性染色體喔!全身每個細胞都有性染色體的。(當然無細胞核之細胞例外~)
<br>
### Virus
- [[ptt] Re: [問卦] 基因定序一樣=同一個來源?](https://www.ptt.cc/bbs/Gossiping/M.1620922747.A.F91.html)
- 武漢肺炎病毒
- 南非: K417N, E484K. N501Y
- 英國: N501Y
- 印度: E484Q, L452R
<br>
### VQSR (Variant Quality Score Recalibration)
- ### [GATK 4.0 WGS germline call variant / GTAK的VQSR质控](https://www.bioinfo-scrounger.com/archives/622/) :+1: :100:
- 理解简单的说
1. GATK认为VQSR比根据各种annotations进行hard-filtering过滤要好,减少了人为阈值的局限性,避免了一刀切的弊端,从而在[sensitivity](http://doctor.get.com.tw/m/Journal/detail.aspx?no=405145)和[specificity](http://doctor.get.com.tw/m/Journal/detail.aspx?no=405145)之间达到一定的平衡
2. VQSR根据机器学习算法从highly validated变异位点数据集(每个位点的annotation profile,一般使用5-8个annotation)中获取到good variants/bad variants
3. 根据上述的位点从我们自己数据集中挑选出一个变异子集(probably true positives)来建模训练,获得一个可识别good variants的模型;bad variants的模型也是如此获得
4. 然后根据上述获得的模型,对自己数据集的每个变异位点进行一个总的打分
5. 最后根据设定的sensitivity阈值对变异位点进行过滤
- 更简单的说:
> 利用自身数据和已知变异位点集的overlap,通过GMM模型构建一个分类器来对变异数据进行打分,从而评估每个位点的可行度
<br>
### Zygosity (Ref:[Genotyping](#Genotyping))
- [Genotyping: Terms to know](https://sg.idtdna.com/pages/education/decoded/article/genotyping-terms-to-know)

- Zygosity 接合性
- The genotypes at 3 different loci show examples of homozygosity for both a dominant and recessive allele, as well as heterozygosity.
3 個不同位點的基因型顯示了顯性和隱性等位基因的純合性以及雜合性的例子。
<br>
### 同源染色體
- 同源 = 相同來源/相同起源 = 共同祖先
- [同源染色體的「同源」怎麼理解?](https://kknews.cc/science/epgvbvn.html)
> 同源染色體指的是減數第一次分裂期開始不久,初級精母細胞中原來分散的染色體進行兩兩配對。配對的兩條染色體,形狀和大小一般都相同,一條來自父方,一條來自母方,叫做同源染色體
> 同源染色體可定義為「存在於或來於同一物種,進化上有共同祖先、起源相同的染色體」
<br>
### 多倍體 #單倍體 #二倍體 #三倍體 #四倍體 #六倍體 #八倍體
- ### 單倍體
- [這些遺傳病,傳男不傳女!](https://kknews.cc/baby/e8bq3lq.html)
- X染色體
- 血友病
- 禿頂(雄激素源性脫髮),是一種常見的毛髮疾患

- 紅綠色盲
色盲基因只存在於X染色體上,Y染色體上沒有

- Y染色體
- 無精子症與嚴重少精子症
- 外耳道多毛症

- 蹼趾 (鸭蹼病)

- [這個家族140人都長著鴨蹼手 怕詛咒不做手術](https://kknews.cc/zh-hk/news/688n25m.html)

- 箭豬病(一種很罕見的皮膚病)
- [Y染色體遺傳病](http://cht.a-hospital.com/w/Y%E6%9F%93%E8%89%B2%E4%BD%93%E9%81%97%E4%BC%A0%E7%97%85)
> 致病基因都在Y染色體上,所以X染色體中沒有相對應的基因,沒有顯,隱性之分,所以患病的都是男性
- [[wiki] 人類的Y染色體](https://zh.wikipedia.org/wiki/Y%E6%9F%93%E8%89%B2%E9%AB%94)
- 人類的Y染色體除了在端粒上的擬常染色體區的少部分片段(只占有染色體長度約5%)能與相應的X染色體發生重組,其外都不能發生重組。
- 這些片區是由原本X染色體與Y染色體同源的片段遺留下來的。
- Y染色體中不能發生重組的其他部分被稱為「NRY區」(non-recombining region,非重組區)[38]
- 或稱「男性特異性區域」(Male-specific region of the Y chromosome, MSY)
- ### 三倍體
- [香蕉也有身分證!找到抗黃葉病品種的 DNA 特徵,保護台蕉專利權](https://research.sinica.edu.tw/banana-panama-disease-ho-ming-chen/)
- [馬祖沿近海地區之三倍體生蠔掛養苗最佳體長研究計畫](https://www.matsu.gov.tw/upload/f-20210901165301.pdf)
- ### 多倍體
- [同源多倍體](https://zh.wikipedia.org/zh-tw/%E5%90%8C%E6%BA%90%E5%A4%9A%E5%80%8D%E4%BD%93)
- 三倍體:擁有三套染色體,如無籽西瓜以及一些緩步動物門的動物[1]。
- 四倍體:擁有四套染色體,如陸地棉[2]和鮭魚[3]。
- 六倍體:如普通小麥、奇異果[4]
- 八倍體:如中華鱘、大麗菊
- 十倍體:某些草莓
- 十二倍體:青葙、大米草[5]以及兩棲動物烏干達爪蛙
- [加班也要學會的新技能| 多倍體重測序](https://www.163.com/dy/article/CNDDC98R0511CRIU.html)

- 二倍體
- 同源
- 西瓜(11對染色體)
- 三倍體
- 同源
- 香蕉
- 四倍體
- 同源
- 西瓜
- 馬鈴薯
- 異源
- 棉花
- 油菜
- 花生
- 異源六倍體
- 小麥
- 八倍體
- 小黑麥
- [高中生物:普通六倍體小麥、八倍體小黑麥、黑麥都啥關係](https://kknews.cc/science/gbmmjze.html)
- [一文读懂多倍体](https://zhuanlan.zhihu.com/p/91689320)

#同源 #異源
<br>
### 核酸萃取
- ### [[分子診斷產品] 世基病毒核酸萃取套組(未滅菌)]
- 產品特點
> 世基病毒核酸萃取套組是用於從血清,血漿和無細胞體液樣本中,經由世基全自動核酸萃取儀全自動的純化分離出病毒去氧核醣核酸(DNA)和病毒氧核醣核酸(RNA)
- 型號
> MVN400-03 (36 tests) / MVN400-04 (96 tests) 試劑卡匣編號202
- 原理
> 檢體先經由溶解液處理後,將檢體中所含之細胞溶解並降低蛋白質含量。細胞溶解後,檢體內含之病毒 DNA 和 RNA 即可利用特殊之磁珠吸附系統將DNA和RNA吸附於磁珠上。利用清洗液將汙染物沖洗掉後,純化的DNA和RNA可經由萃取液或去離子水將之萃取至收集管內。純化的DNA和RNA適合聚合酶連鎖反應(PCR)及其他相關分子生物反應應用。
<br>
### 病毒株分離, 分離病毒株
- [【新型冠狀病毒每日問】0205~為何病毒株分離對疫苗研發很重要](https://www.facebook.com/watch/?v=2431428973852928&t=0) :+1: :+1: :100:
- [台灣成功分離武漢肺炎病毒株 專家:5年內有機會做出疫苗](https://rcevi.cgu.edu.tw/p/16-1030-71186.php?Lang=zh-tw)
> 在分離出病毒株之前,研究團隊根本不知道病毒「長什麼樣子」,任何相關研究都如大海撈針,現在找到病毒株就如同找到病毒的樣本,可藉此瞭解敵人的全貌,包括該病毒的基因序列、病毒特定、產生蛋白質的特徵等,透過病毒培養也能掌握病毒生長的狀況以及用於培養病毒的細胞株。
<br>