clinvar
===
###### tags: `基因體/三級分析/資料庫`
###### tags: `基因體`, `SNP`, `dbSNP`, `Variant`
<br>
[TOC]
<br>
## 基本資訊
- **介紹**
- [NCBI 相關](https://my.oschina.net/u/3732258/blog/3130703)
紀錄遺傳變異,以及其臨床表徵關係的資料庫。
- **Web**
- https://www.ncbi.nlm.nih.gov/clinvar/
- **FTP**
- https://ftp.ncbi.nih.gov/pub/clinvar/ (舊版)
- https://ftp.ncbi.nlm.nih.gov/pub/clinvar/ (新版,多了 nlm )
- **ClinVar submissions**
> https://www.ncbi.nlm.nih.gov/clinvar/submitters/
>

<br>
## [常用搜尋](https://www.ncbi.nlm.nih.gov/clinvar/docs/help/)
> ==**常用搜尋,就是必要欄位**==
- 基因名稱, e.g. [PTEN](https://www.ncbi.nlm.nih.gov/clinvar/?term=pten)
- 基因名稱和(編碼變異序列or蛋白質變異序列), e.g., [mutyh c.1187g>a](https://www.ncbi.nlm.nih.gov/clinvar/?term=%22mutyh%20c.1187g%3Ea%22)
- 位置/染色體坐標, e.g., [chr1:11,102,837-11,267,747, 2:144,213,941 - 144,690,824](https://www.ncbi.nlm.nih.gov/clinvar/?term=chr1%3A11%2C102%2C837-11%2C267%2C747), etc.
- HGVS 表達式, e.g. [NM_000314.4:c.395G>T](https://www.ncbi.nlm.nih.gov/clinvar?term=NM_000314.4:c.395G%3ET)
- 蛋白質變化, e.g. [G132V](https://www.ncbi.nlm.nih.gov/clinvar?term=G132V)
- RS 登錄號, e.g. [rs180177042](https://www.ncbi.nlm.nih.gov/clinvar?term=rs180177042)
- 疾病, e.g. [cystic fibrosis](https://www.ncbi.nlm.nih.gov/clinvar/?term=cystic+fibrosis)
<br>
## 線上教學
- ### 2021/12/30 - [[Youtube] How to Search ClinVar](https://www.youtube.com/watch?v=B1Jq00En3WA)
<br>
## 註釋欄位
> - 透過 pbrun vcfanno 標注
> - 版本
> ```
> ##fileformat=VCFv4.1
> ##fileDate=2022-12-17
> ##source=ClinVar
> ##reference=GRCh38
> ##ID=<Description="ClinVar Variation ID">
> ```
> - uniq 屬性值 (範例)
> `cat output-by-clinvar.vcf | egrep "clinvar_CLNVC=[^;]+" -o | sort | uniq | more`
- ### 移除屬性
| Property | Value |
|----------|-----------|
| fileformat | VCFv4.2 |
- 範例:`##fileformat=VCFv4.2`
- ### 新增 FILTER 欄位
| ID | Description |
|----|-------------|
| PASS | All filters passed |
- 範例:`##FILTER=<ID=PASS,Description="All filters passed">`
- ### 新增 contig 欄位
| ID | length |
|----|--------|
| (略) | (略) |
- 範例:`##contig=<ID=chr1,length=248956422>`
- ### 新增 INFO 欄位 (`clinvar_` 為自定義 prefix)
> <span style="color: red">紅色名稱</span>:為必要
| ID | Number / Type / Full Name<br>Description<br>- example1<br>- example2<br>- example3 |
|----|-----------------------------|
| clinvar_AF_ESP | 1 / Float / NHLBI GO Exome Sequencing Project(國家心肺和血液研究所外顯子組定序計劃)<br>allele frequencies from GO-ESP<br>**來自 [GO-ESP](https://esp.gs.washington.edu/drupal/) 資料庫的等位基因頻率**<br>(心臟、肺和血液疾病相關的外顯子資料庫) |
| clinvar_AF_EXAC | 1 / Float<br>allele frequencies from ExAC<br>**來自 [ExAC](https://exac.broadinstitute.org/) 資料庫的等位基因頻率**<br>ExAC: Exome Aggregation Consortium(外顯子聚合聯盟)<br>(有六萬人的外顯子體資料庫,已合併到 gnomAD) |
| clinvar_AF_TGP | 1 / Float<br>allele frequencies from TGP<br>**來自 [TGP](https://ega-archive.org/studies/phs000495) 資料庫的等位基因頻率**<br>研究基因和環境對兒童健康和疾病的貢獻<br>(與兒童健康表徵有關的資料庫) |
| clinvar_ALLELEID | 1 / Integer<br>the ClinVar Allele ID<br>**clinvar 資料庫的等位基因 ID**,如 某個變異ID(=[1153723](https://www.ncbi.nlm.nih.gov/clinvar/variation/1153723/))下,有一個等位基因ID(=1147572),在基因上的位置為chr17:68523763 (GRCh38.p13),其對應SNP則是 [rs1411849784](https://www.ncbi.nlm.nih.gov/snp/rs1411849784) |
| clinvar_CLNDISDB | . / String / ClinVar Disease DB<br>Tag-value pairs of disease database name and identifier, e.g. OMIM:NNNNNN<br>**疾病資料庫和ID的標記值對**<br>- MONDO:MONDO:0014052,<br>- MedGen:C3808739,<br>- OMIM:615120\|MedGen:CN169374 |
| clinvar_CLNDISDBINCL | . / String / **ClinVar Disease DB ++Incl++uded**<br>For included Variant: Tag-value pairs of disease database name and identifier, e.g. OMIM:NNNNNN<br>**對於包含的變異:疾病資料庫和 ID 的標記值對**<br>- MONDO:MONDO:0007240<br>- MedGen:C1879286,OMIM:113900 |
| clinvar_CLNDN | . / String / **ClinVar Disease Name**<br>ClinVar's preferred disease name for the concept specified by disease identifiers in CLNDISDB<br>**ClinVar 對 CLNDISDB 中疾病 ID 所指定的概念之首選疾病名稱**<br>- not_provided<br>- not_specified<br>- Autosomal_dominant_Robinow_syndrome_2<br>- Congenital_myasthenic_syndrome_8<br>- Harel-Yoon_syndrome<br>- Idiopathic_generalized_epilepsy<br>- Mendelian_susceptibility_to_mycobacterial_diseases_due_to_complete_ISG15_deficiency<br>- Neutrophil_inclusion_bodies<br>- Pontocerebellar_hypoplasia,\_hypotonia,\_and_respiratory_insufficiency_syndrome,\_neonatal_lethal<br>- Renal_tubular_epithelial_cell_apoptosis |
| clinvar_CLNDNINCL | . / String / **ClinVar Disease Name ++Incl++uded**<br>For included Variant : ClinVar's preferred disease name for the concept specified by disease identifiers in CLNDISDB<br>**對於包含的變異:ClinVar 對 CLNDISDB 中疾病 ID 所指定的概念之首選疾病名稱**<br><br>i.e.<br>說明了 ClinVar 首選的疾病名稱,該疾病名稱是根據 CLNDISDB (ClinVar Disease Database) 中與該變異相關的疾病 ID 所指定的概念而確定的。簡單來說,這個說明是關於 ClinVar 資料庫中某一變異對應的疾病名稱的來源和基礎。(by ChatGPT)<br><br>更白話一點,疾病名稱,就是根據疾病 ID 從 CLNDISDB 取得 |
| <span style="color: red">clinvar_CLNHGVS</span> | . / String / ClinVar Human Genome Variation Society (人類基因體變異協會)<br>Top-level (primary assembly, alt, or patch) HGVS expression.<br>**最上層的 HGVS 表達式** (HGVS: 人類基因體變異協會)<br>- CLNHGVS=NC_000001.11:g.100011686ATTT[10]<br>- CLNHGVS=NC_000001.11:g.100015152C>T<br>- CLNHGVS=NC_000001.11:g.100103203C>G<br>- CLNHGVS=NC_000001.11:g.100110377G>A |
| <span style="color: red">clinvar_CLNREVSTAT</span> | . / String<br>ClinVar review status for the Variation ID<br>變異 ID 的審核狀態 |
| <span style="color: red">clinvar_CLNSIG</span> | . / String<br>Clinical significance for this single variant; multiple values are separated by a vertical bar |
| clinvar_CLNSIGCONF | . / String<br>Conflicting clinical significance for this single variant; multiple values are separated by a vertical bar |
| clinvar_CLNSIGINCL | . / String<br>Clinical significance for a haplotype or genotype that includes this variant. Reported as pairs of VariationID:clinical significance; multiple values are separated by a vertical bar |
| <span style="color: red">clinvar_CLNVC</span> | 1 / String<br>Variant type<br>**變異類型**<br>- Deletion<br>- Duplication<br>- Insertion<br>- Microsatellite<br>- single_nucleotide_variant |
| clinvar_CLNVCSO | 1 / String<br>Sequence Ontology id for variant type |
| clinvar_CLNVI | . / String<br>the variant's clinical sources reported as tag-value pairs of database and variant identifier |
| clinvar_DBVARID | . / String<br>nsv accessions from dbVar for the variant |
| <span style="color: red">clinvar_GENEINFO</span> | 1 / String<br>Gene(s) for the variant reported as gene symbol:gene id. The gene symbol and id are delimited by a colon (:) and each pair is delimited by a vertical bar (\|) |
| clinvar_MC | . / String<br>comma separated list of molecular consequence in the form of Sequence Ontology ID\|molecular_consequence |
| clinvar_ORIGIN | . / String<br>Allele origin. One or more of the following values may be added: 0 - unknown; 1 - germline; 2 - somatic; 4 - inherited; 8 - paternal; 16 - maternal; 32 - de-novo; 64 - biparental; 128 - uniparental; 256 - not-tested; 512 - tested-inconclusive; 1073741824 - other |
| <span style="color: red">clinvar_RS</span> | . / String / Reference SNP cluster (aka refSNP)<br>dbSNP ID (i.e. rs number)<br>**dbSNP 登錄號**<br>- [10001](https://www.ncbi.nlm.nih.gov/clinvar?term=rs10001) |
| clinvar_SSR | 1 / Integer<br>Variant Suspect Reason Codes. One or more of the following values may be added: 0 - unspecified, 1 - Paralog, 2 - byEST, 4 - oldAlign, 8 - Para_EST, 16 - 1kg_failed, 1024 - other |
- ### 新增其他資訊
- `##bcftools_normVersion=`
`1.7+htslib-1.9`
- `##bcftools_normCommand=`
`norm -m- -o 00953a737f095cb62c7b1ff943e09d8e1bd10432.norm.vcf /workspace/datasets/germline/HG002/wes-output/output.vcf; Date=Wed Dec 28 10:45:56 2022`
<br>
## 標注範例
> #CHROM POS ID REF ALT QUAL FILTER INFO FORMAT sample
> chr1 942451 . T C 472.1 . AC=2;AF=1;AN=2;DP=16;ExcessHet=3.0103;FS=0;MLEAC=2;MLEAF=1;MQ=60;QD=29.5;SOR=1.609;clinvar_ALLELEID=1153723;clinvar_CLNDN=not_provided;clinvar_CLNDISDB=MedGen:CN517202;clinvar_CLNHGVS=NC_000001.11:g.942451T>C;clinvar_CLNREVSTAT=criteria_provided,_single_submitter;clinvar_CLNSIG=Benign;clinvar_CLNVC=single_nucleotide_variant;clinvar_CLNVCSO=SO:0001483;clinvar_GENEINFO=SAMD11:148398;clinvar_MC=SO:0001583|missense_variant;clinvar_ORIGIN=1 GT:AD:DP:GQ:PL 1/1:0,16:16:48:486,48,0
| Column | value |
|--------|-------|
| #CHROM | chr1 |
| POS | 942451 |
| ID | . |
| REF | T |
| ALT | C |
| QUAL | 472.1 |
| FILTER | . |
| INFO | (見下表展開) |
| FORMAT | GT:AD:DP:GQ:PL |
| sample | 1/1:0,16:16:48:486,48,0 |
| INFO | value |
|------|-------|
| AC | 2 |
| AF | 1 |
| AN | 2 |
| DP | 16 |
| ExcessHet | 3.0103 |
| FS | 0 |
| MLEAC | 2 |
| MLEAF | 1 |
| MQ | 60 |
| QD | 29.5 |
| SOR | 1.609 |
| clinvar_ALLELEID | [1153723](https://www.ncbi.nlm.nih.gov/clinvar/variation/1153723/) |
| clinvar_CLNDN | not_provided |
| clinvar_CLNDISDB | MedGen:CN517202 |
| clinvar_CLNHGVS | [NC_000001.11](https://www.ncbi.nlm.nih.gov/nuccore/NC_000001.11):g.942451T>C |
| clinvar_CLNREVSTAT | criteria_provided,\_single_submitter |
| clinvar_CLNSIG | Benign |
| clinvar_CLNVC | single_nucleotide_variant |
| clinvar_CLNVCSO | SO:0001483 |
| clinvar_GENEINFO | SAMD11:148398<br>[[NCBI]](https://www.ncbi.nlm.nih.gov/gene/148398) [[BioGPS]](http://biogps.org/#goto=genereport&id=148398) |
| clinvar_MC | SO:0001583\|missense_variant |
| clinvar_ORIGIN | 1 |
<br>
## 欄位詳細解釋
### CLNSIG | . | str
> example values: Likely pathogenic, Pathogenic, Drug-response related
- Clinical significance 臨床意義, 臨床顯著性
- Clinical significance for this single variant; multiple values are separated by a vertical bar
單變異的臨床意義; 可由垂直線分隔多個值
- https://www.snpedia.com/index.php/ClinVar
| CLNSIG # | ClinVar Definition |
|----------|--------------------|
| 0 | Uncertain 不確定 |
| 1 | Not provided 未提供 |
| 2 | Benign 良性 |
| 3 | Likely benign 可能是良性的 |
| 4 | Likely pathogenic 可能致病 |
| 5 | Pathogenic 致病的 |
| 6 | Drug-response related 與藥物反應相關 |
| 7 | Histocompatibility-related 與組織相容性相關 |
| 255 | Other (conflicts, flips, etc) 其他 (衝突、翻轉等等) |
- 實際值
> source: HG002.hiseqx.pcr-free.30x.R_-annotated.vcf
```
$ ... | egrep "clinvar_CLNSIG=[^;]+" -o | sort | uniq
clinvar_CLNSIG=Affects
clinvar_CLNSIG=Benign
clinvar_CLNSIG=Benign,Benign
clinvar_CLNSIG=Benign,Conflicting_interpretations_of_pathogenicity
clinvar_CLNSIG=Benign,Likely_benign
clinvar_CLNSIG=Benign,Uncertain_significance
clinvar_CLNSIG=Benign/Likely_benign
clinvar_CLNSIG=Benign/Likely_benign,Benign
clinvar_CLNSIG=Benign/Likely_benign,Benign/Likely_benign
clinvar_CLNSIG=Benign|association
clinvar_CLNSIG=Benign|confers_sensitivity
clinvar_CLNSIG=Benign|drug_response
clinvar_CLNSIG=Benign|other
clinvar_CLNSIG=Benign|risk_factor
clinvar_CLNSIG=Conflicting_interpretations_of_pathogenicity
clinvar_CLNSIG=Conflicting_interpretations_of_pathogenicity,Conflicting_interpretations_of_pathogenicity
clinvar_CLNSIG=Conflicting_interpretations_of_pathogenicity,Uncertain_significance
clinvar_CLNSIG=Conflicting_interpretations_of_pathogenicity|other
clinvar_CLNSIG=Conflicting_interpretations_of_pathogenicity|protective
clinvar_CLNSIG=Conflicting_interpretations_of_pathogenicity|risk_factor
clinvar_CLNSIG=Likely_benign
clinvar_CLNSIG=Likely_benign,Benign
clinvar_CLNSIG=Likely_benign,Likely_benign
clinvar_CLNSIG=Likely_pathogenic
clinvar_CLNSIG=Likely_risk_allele
clinvar_CLNSIG=Pathogenic
clinvar_CLNSIG=Pathogenic|protective
clinvar_CLNSIG=Pathogenic|risk_factor
clinvar_CLNSIG=Uncertain_risk_allele
clinvar_CLNSIG=Uncertain_risk_allele|protective
clinvar_CLNSIG=Uncertain_risk_allele|risk_factor
clinvar_CLNSIG=Uncertain_significance
clinvar_CLNSIG=Uncertain_significance,Benign
clinvar_CLNSIG=Uncertain_significance,Likely_benign
clinvar_CLNSIG=Uncertain_significance,Uncertain_significance
clinvar_CLNSIG=Uncertain_significance|association
clinvar_CLNSIG=Uncertain_significance|drug_response
clinvar_CLNSIG=association
clinvar_CLNSIG=association_not_found
clinvar_CLNSIG=association|drug_response|risk_factor
clinvar_CLNSIG=confers_sensitivity
clinvar_CLNSIG=drug_response
clinvar_CLNSIG=not_provided
clinvar_CLNSIG=other
clinvar_CLNSIG=protective
clinvar_CLNSIG=protective|risk_factor
clinvar_CLNSIG=risk_factor
```
<br>
### CLNREVSTAT | . | str
> example values: Likely pathogenic, Pathogenic, Drug-response related
- https://www.ncbi.nlm.nih.gov/clinvar/docs/review_status/
```
clinvar_CLNREVSTAT=criteria_provided,_conflicting_interpretations
clinvar_CLNREVSTAT=criteria_provided,_conflicting_interpretations,criteria_provided,_conflicting_interpretations
clinvar_CLNREVSTAT=criteria_provided,_conflicting_interpretations,criteria_provided,_single_submitter
clinvar_CLNREVSTAT=criteria_provided,_multiple_submitters,_no_conflicts
clinvar_CLNREVSTAT=criteria_provided,_multiple_submitters,_no_conflicts,criteria_provided,_multiple_submitters,_no_conflicts
clinvar_CLNREVSTAT=criteria_provided,_multiple_submitters,_no_conflicts,criteria_provided,_single_submitter
clinvar_CLNREVSTAT=criteria_provided,_single_submitter
clinvar_CLNREVSTAT=criteria_provided,_single_submitter,criteria_provided,_conflicting_interpretations
clinvar_CLNREVSTAT=criteria_provided,_single_submitter,criteria_provided,_single_submitter
clinvar_CLNREVSTAT=criteria_provided,_single_submitter,no_assertion_criteria_provided
clinvar_CLNREVSTAT=no_assertion_criteria_provided
clinvar_CLNREVSTAT=no_assertion_provided
clinvar_CLNREVSTAT=no_interpretation_for_the_single_variant
clinvar_CLNREVSTAT=reviewed_by_expert_panel
```
<br>
## 阿茲海默症(Alzheimer) 資料
### 摘要:[clinvar] 透過疾病名稱找出相關基因
- **例如 Alzheimer (阿茲海默症) 關鍵字會出現在 CLNDN 欄位,極少部份沒寫在 CLNDN 而是寫在 CLNDNINCL**
- 有些疾病名稱會比較複雜:
- Primary_degenerative_dementia_of_the_Alzheimer_type
阿茲海默症類型原發性退化性失智症
- **適當的上位名稱 -> 可找到範圍更廣的基因名稱清單**
- 阿茲海默症的上位名稱:失智症 (Dementia)
- 阿茲海默症會引起失智
- 發生失智時,並不全然是由 阿茲海默症 引起,比例好像佔 5, 6 成,還有其他可能疾病原因
- 帕金森氏症 (Parkinson) 也會伴隨 失智,但也不全然會引起失智
- **找出相關基因 (比較好的作法)**
- CLNDN= ==`"*Dementia*"`== > ==`"*Alzheimer*"`== > ==`"*Parkinson*"`==
這樣會找出相當多基因
- 再透過 CLNSIG 條件限縮:risk_factor(危險因子), Likely_pathogenic, Pathogenic
前提:先針對 CLNDN 各關鍵字,找出所有的 CLNSIG,再從中觀察比較嚴重的說法,像 risk_factor 就沒有出現在官方清單上
- [**早發型失智症 - 新境界**](https://adrc.hosp.ncku.edu.tw/var/file/77/1077/img/184553429.pdf)
- 原發性退化性失智症 (primary degenerative dementia)
- 失智症類型:阿茲海默症、路易氏體症、巴金森氏症、庫賈氏症、威爾森氏症

<br>
### [檢驗項目- 臺中 - 台中榮總](https://www.vghtc.gov.tw/UnitPage/RowViewDetail?WebRowsID=1d9434b8-9b44-41f0-b166-c7c3975b718c&UnitID=3607794c-42f0-4147-88eb-74404636cd6f&CompanyID=e8e0488e-54a0-44bf-b10c-d029c423f6e7&UnitDefaultTemplate=1)

APOE, APP, C9orf72, CSF1R, DNMT1, EIF4G1, GBA, GRN, MAPT, PRNP, PSEN1, PSEN2, SNCA, SNCB, TREM2, TYROBP
### 交叉比對
| 基因 | 台中榮總 | CLNDN=<br>`"*Alzheimer*"` | CLNDN=<br>`"*Dementia*"` | CLNDN=<br>`"*Parkinson*"` |
|-----|---------|-------|----------|-----|
| APOE |V| APOE:348 | APOE:348 |
| APP |V| APP:351 | APP:351 |
| C9orf72|V| - | C9orf72:203228 |
| CSF1R |V| CSF1R:1436 | CSF1R:1436 | CSF1R:1436\|LOC111188154:111188154 |
| DNMT1 |V| - | DNMT1:1786<br>DNMT1:1786<br>\|LOC107080555:107080555<br>DNMT1:1786<br>\|SHFL:55337 |
| EIF4G1<br>[帕金森氏症<br>(Parkinson's disease)<br>PD](https://zh.wikipedia.org/zh-tw/%E5%B8%95%E9%87%91%E6%A3%AE%E6%B0%8F%E7%97%87) |V| - | - | EIF4G1:1981 |
| GBA |V| - | GBA1:2629<br>GBA1:2629<br>\|LOC106627981:106627981 | GBA1:2629<br>GBA1:2629<br>\|LOC106627981:106627981 |
| GRN |V| GRN:2896 | GRN:2896 | GRN:2896 |
| MAPT |V| MAPT:4137 | MAPT:4137<br>MAPT:4137\|MAPT-AS1:100128977 | MAPT:4137 |
| PRNP |V| PRNP:5621 | PRNP:5621 |
| PSEN1 |V| PSEN1:5663 | PSEN1:5663 |
| PSEN2 |V| PSEN2:5664 | PSEN2:5664 |
| SNCA |V| - | SNCA:6622 | SNCA:6622\|SNCA-AS1:644248 |
| SNCB |V| - | SNCB:6620 |
| TREM2 |V| - | TREM2:54209 |
| TYROBP |V| - | TYROBP:7305 |
| 其他(交集) |X| ABCA7<br>GRID2IP<br>LRRK2<br>PLCD1<br>SORL1<br>TM2D3<br>TNF<br>TNK1<br>VCP<br>VPS13C | ABCA7<br>GRID2IP<br>LRRK2<br>PLCD1<br>SORL1<br>TM2D3<br>TNF<br>TNK1<br>VCP<br>VPS13C | 不納入比較 |
| 其他(無交集) |X| ADAM10<br>CLU<br>HFE<br>HFE\|HFE-AS1<br>MPO<br>MPO<br>\|LOC106694315<br>MT-ND1<br>NOS3<br>PCDH11X<br>PLAU\|C10orf55<br>PLD3<br>SORCS1<br>TF<br>UNC13C | ABI3<br>ANG\|RNASE4\|EGILA<br>ARSA<br>C1R<br>CACNA1A<br>CCM2<br>CCNF<br>CHCHD10<br>CHMP2B<br>CHRNA4<br>CHRNB4<br>COL4A1<br>COL4A2\|COL4A2-AS1<br>COLGALT1<br>CYLD<br>DCTN1<br>DIAPH1<br>DNAJC13<br>ERBB4<br>FUS<br>GLT8D1<br>GRIN2A<br>HNRNPA1<br>HNRNPA2B1<br>HTRA1<br>ITM2B<br>KIF5A<br>KRIT1<br>MARCHF4<br>MEF2C<br>MME<br>MRE11<br>MT-ND4<br>MTHFR<br>NMNAT2<br>NOTCH3<br>NPPA\|NPPA-AS1\|LOC114827827<br>OPTN\|LOC108903148<br>PARK7<br>PCNT<br>POLG<br>POU1F1\|CHMP2B<br>SETX<br>SLC20A2<br>SLC25A24<br>SMAD4<br>SPG7<br>SQSTM1<br>TARDBP<br>TARDBP\|MASP2<br>TBK1<br>THSD1<br>TIA1<br>TMEM106B<br>TREX1\|ATRIP\|ATRIP-TREX1<br>TRPM7<br>TSC2<br>TUBA4A<br>TUBB2A<br>UBQLN2<br>VPS13A | 不納入比較 |
### filter: CLNDN
- Alzheimer_disease
- Alzheimer_disease_2
- Alzheimer_disease_3
- Alzheimer_disease_4
- Alzheimer_disease_6
- Alzheimer_disease_9
- Alzheimer_disease_18
- Alzheimer_disease_19
- Alzheimer_disease_familial_3
- Alzheimer_disease_type_1
- Early_onset_Alzheimer_disease_with_behavioral_disturbance
- Early-onset_autosomal_dominant_Alzheimer_disease
- Primary_degenerative_dementia_of_the_Alzheimer_type
### filter: CLNDNINCL
> 19 44908684 694742 T . . . AF_EXAC=0.81567;AF_TGP=0.84944;ALLELEID=682795;CLNHGVS=NC_000019.10:g.44908684%3D;CLNREVSTAT=no_interpretation_for_the_single_variant;CLNVC=single_nucleotide_variant;CLNVCSO=SO:0001483;CLNVI=APOE_database:APOE_000000|OMIM_Allelic_Variant:107741.0015;GENEINFO=APOE:348;MC=SO:0002073|no_sequence_alteration;ORIGIN=1;RS=429358;CLNDISDBINCL=.|.; ==CLNDNINCL=APOE3_ISOFORM|**Alzheimer_disease_3**==,_protection_against,_due_to_APOE3-Christchurch;CLNSIGINCL=17863:Pathogenic|694585:protective
> 19 44908756 17850 C A . . ALLELEID=32889;CLNDISDB=MONDO:MONDO:0018473,MedGen:C0020479,OMIM:617347,Orphanet:ORPHA412,SNOMED_CT:398796005; ==CLNDN=**Familial_type_3_hyperlipoproteinemia**;== CLNHGVS=NC_000019.10:g.44908756C>A;CLNREVSTAT=no_assertion_criteria_provided;CLNSIG=Pathogenic;CLNVC=single_nucleotide_variant;CLNVCSO=SO:0001483;CLNVI=OMIM_Allelic_Variant:107741.0003|UniProtKB_(protein):P02649#VAR_000656;GENEINFO=APOE:348;MC=SO:0001583|missense_variant;ORIGIN=1;RS=121918393;CLNDISDBINCL=.;CLNDNINCL= ==**Alzheimer_disease_3**==,_protection_against,_due_to_APOE3-Christchurch;CLNSIGINCL=694585:protective
> 19 44908822 694741 C . . . ALLELEID=32902;CLNHGVS=NC_000019.10:g.44908822%3D;CLNREVSTAT=no_interpretation_for_the_single_variant;CLNVC=Variation;CLNVCSO=SO:0001059;CLNVI=OMIM_Allelic_Variant:107741.0015;GENEINFO=APOE:348;MC=SO:0002073|no_sequence_alteration;ORIGIN=1;CLNDISDBINCL=.|.;CLNDNINCL=APOE3_ISOFORM| ==**Alzheimer_disease_3**== ,_protection_against,_due_to_APOE3-Christchurch;CLNSIGINCL=17863:Pathogenic|694585:protective
### filter: APOE
- Abnormal_circulating_lipid_concentration
- Alzheimer_disease
- Alzheimer_disease_2
- Alzheimer_disease_4
- APOE2-DUNEDIN
- APOE2_VARIANT
- APOE3(-)-FREIBURG
- APOE4(+)
- APOE4_VARIANT
- APOE5_VARIANT
- atorvastatin_response_-_Efficacy
- Cardiovascular_phenotype
- Coronary_artery_disease,_severe,_susceptibility_to
- Familial_hypercholesterolemia
- Familial_type_3_hyperlipoproteinemia
- Hypercholesterolemia
- Hyperlipoproteinemia
- HYPERLIPOPROTEINEMIA,_TYPE_III,_AND_ATHEROSCLEROSIS_ASSOCIATED_WITH_APOE5
- HYPERLIPOPROTEINEMIA,_TYPE_III,_ASSOCIATED_WITH_APOE3(WASHINGTON)
- Hyperlipoproteinemia,_type_III,_due_to_APOE2
- Lipoprotein_glomerulopathy
- Major_depressive_disorder
- Primary_degenerative_dementia_of_the_Alzheimer_type,_presenile_onset
- Sea-blue_histiocyte_syndrome
- Warfarin_response
### filter: Dementia
> `cat clinvar.vcf | grep -i Dementia | egrep "GENEINFO=[^;]+" -o |sort | uniq`
- GENEINFO=ABCA7:10347
- GENEINFO=ABI3:51225
- GENEINFO=ANG:283|RNASE4:6038|EGILA:116435281
- GENEINFO=APOE:348
- GENEINFO=APP:351
- GENEINFO=ARSA:410
- GENEINFO=C1R:715
- GENEINFO=C9orf72:203228
- GENEINFO=CACNA1A:773
- GENEINFO=CCM2:83605
- GENEINFO=CCNF:899
- GENEINFO=CHCHD10:400916
- GENEINFO=CHMP2B:25978
- GENEINFO=CHRNA4:1137
- GENEINFO=CHRNB4:1143
- GENEINFO=COL4A1:1282
- GENEINFO=COL4A2:1284|COL4A2-AS1:100874203
- GENEINFO=COLGALT1:79709
- GENEINFO=CSF1R:1436
- GENEINFO=CYLD:1540
- GENEINFO=DCTN1:1639
- GENEINFO=DIAPH1:1729
- GENEINFO=DNAJC13:23317
- GENEINFO=DNMT1:1786
- GENEINFO=DNMT1:1786|LOC107080555:107080555
- GENEINFO=DNMT1:1786|SHFL:55337
- GENEINFO=ERBB4:2066
- GENEINFO=FUS:2521
- GENEINFO=GBA1:2629
- GENEINFO=GBA1:2629|LOC106627981:106627981
- GENEINFO=GLT8D1:55830
- GENEINFO=GRID2IP:392862
- GENEINFO=GRIN2A:2903
- GENEINFO=GRN:2896
- GENEINFO=HNRNPA1:3178
- GENEINFO=HNRNPA2B1:3181
- GENEINFO=HTRA1:5654
- GENEINFO=ITM2B:9445
- GENEINFO=KIF5A:3798
- GENEINFO=KRIT1:889
- GENEINFO=LRRK2:120892
- GENEINFO=MAPT:4137
- GENEINFO=MAPT:4137|MAPT-AS1:100128977
- GENEINFO=MARCHF4:57574
- GENEINFO=MEF2C:4208
- GENEINFO=MME:4311
- GENEINFO=MRE11:4361
- GENEINFO=MT-ND4:4538
- GENEINFO=MTHFR:4524
- GENEINFO=NMNAT2:23057
- GENEINFO=NOTCH3:4854
- GENEINFO=NPPA:4878|NPPA-AS1:100379251|LOC114827827:114827827
- GENEINFO=OPTN:10133|LOC108903148:108903148
- GENEINFO=PARK7:11315
- GENEINFO=PCNT:5116
- GENEINFO=PLCD1:5333
- GENEINFO=POLG:5428
- GENEINFO=POU1F1:5449|CHMP2B:25978
- GENEINFO=PRNP:5621
- GENEINFO=PSEN1:5663
- GENEINFO=PSEN2:5664
- GENEINFO=SETX:23064
- GENEINFO=SLC20A2:6575
- GENEINFO=SLC25A24:29957
- GENEINFO=SMAD4:4089
- GENEINFO=SNCA:6622
- GENEINFO=SNCB:6620
- GENEINFO=SORL1:6653
- GENEINFO=SPG7:6687
- GENEINFO=SQSTM1:8878
- GENEINFO=TARDBP:23435
- GENEINFO=TARDBP:23435|MASP2:10747
- GENEINFO=TBK1:29110
- GENEINFO=THSD1:55901
- GENEINFO=TIA1:7072
- GENEINFO=TM2D3:80213
- GENEINFO=TMEM106B:54664
- GENEINFO=TNF:7124
- GENEINFO=TNK1:8711
- GENEINFO=TREM2:54209
- GENEINFO=TREX1:11277|ATRIP:84126|ATRIP-TREX1:111822955
- GENEINFO=TRPM7:54822
- GENEINFO=TSC2:7249
- GENEINFO=TUBA4A:7277
- GENEINFO=TUBB2A:7280
- GENEINFO=TYROBP:7305
- GENEINFO=UBQLN2:29978
- GENEINFO=VCP:7415
- GENEINFO=VPS13A:23230
- GENEINFO=VPS13C:54832
<br>
## 欄位值
### "Not provided" vs "Not specified"
> "Not provided" 和 "Not specified" 雖然看起來相似,但含義上有所不同。
>
> "Not provided" 通常表示缺少必要的資訊,因此無法提供相關的數據。例如,在某些問卷調查中,如果參與者沒有提供某些必要的個人資訊,調查人員就可能使用 "Not provided" 來表示缺少該資訊。
>
> "Not specified" 則意味著未指定特定的選項或細節。例如,在醫學報告中,如果未指定某些實驗參數的詳細資訊,則可以使用 "Not specified" 來表示未指定該參數的值或選項。
>
> 簡單來說,"Not provided" 表示缺少必要的資訊,而 "Not specified" 表示未指定特定的選項或細節。(by ChatGPT) <!-- Q: not provided 和 not specified ,含意上差在哪裡? -->
### Primary_degenerative_dementia_of_the_Alzheimer_type
> "Primary degenerative dementia of the Alzheimer type" 是指阿茲海默症(Alzheimer's disease),它是一種逐漸惡化的腦部疾病,會影響思考能力、記憶和行為。
>
> 這個術語是由幾個詞彙組成的:
>
> - "Primary"[ˋpraɪ͵mɛrɪ] 表示該病變是原發性的,即病變不是由其他疾病或因素引起的。
> - "Degenerative"[dɪˋdʒɛnə͵retɪv] 表示病情會逐漸惡化,即患者的神經細胞會不斷受損,進而導致認知和行為的惡化。
> - "Dementia"[dɪˋmɛnʃɪə] 表示失智症,指的是一種會影響記憶、思考、判斷、行為和情感的病症。
> - "Alzheimer[ˋɑlts͵haɪmɚ] type" 表示這種失智症與阿茲海默症有關。
>
> 綜合起來,"Primary degenerative dementia of the Alzheimer type" 意指一種由於神經細胞損傷引起的逐漸惡化的失智症,其症狀與阿茲海默症有關。(by ChatGPT) <!-- Primary_degenerative_dementia_of_the_Alzheimer_type ,怎麼解釋? -->
<br>
## 其他類型文件
### VCF
- ClinVar 的 vcf 格式文件,有哪些註釋欄位?哪個註釋欄位有提供變異類型的資訊?
[ChatGPT]
ClinVar 的 VCF(Variant Call Format)格式文件通常包含以下註釋欄位,用於描述變異的不同屬性和相關信息:
- **CHROM**: 染色體名稱。
- **POS**: 變異的起始位置。
- **ID**: 變異的唯一識別號。
- **REF**: 參考基因體的碱基序列。
- **ALT**: 變異基因體的碱基序列。
- **QUAL**: 變異的質量分數。
- **FILTER**: 過濾標記,表示是否通過質量篩選。
- **INFO**: 包含多種變異相關的信息,可能包括 ClinVar 相關的數據。
- **FORMAT**: 定義 VCF 文件中的樣本數據格式。
- **Sample Data**: 樣本數據,例如基因型和基因變異的相關信息。
在 ClinVar 的 VCF 文件中,變異類型的資訊通常可以在 INFO 欄位中找到。INFO 欄位可能包含多個子欄位,以描述變異的不同特徵,其中可能包括變異類型(例如 "CLNSIG"、"CLNREVSTAT" 等)。這些子欄位提供了有關變異臨床和生物學意義的詳細信息,以幫助解釋變異的效應和相關證據。
請注意,ClinVar 數據的格式可能因版本和文件而略有不同,因此查閱相關文檔和說明可以幫助你確定所需的註釋欄位以及如何解釋它們。
### RCV
- [[illumina] Version: 3.22 (unreleased) - ClinVar](https://illumina.github.io/NirvanaDocumentation/data-sources/clinvar/)
- [examle](https://illumina.github.io/NirvanaDocumentation/assets/files/clinvar-rcv-example-4e0a2f2ac6c70acd0ce41410690b683b.xml)
- [Identifiers in ClinVar](https://www.ncbi.nlm.nih.gov/clinvar/docs/identifiers/#rcv)
- calculated by ClinVar to aggregate information from all submitted records
- ### ClinVar有哪些註釋欄位?哪個註釋欄位有提供變異類型的資訊?
[ChatGPT]
ClinVar 是一個用於存儲基因變異相關信息的公共資源,它提供了多個註釋欄位,以幫助解釋變異的臨床和生物學意義。以下是 ClinVar 常見的一些註釋欄位:
- **VariationID**: 變異的唯一識別號。
- **Type**: 變異的類型,例如 "single nucleotide variant"、"insertion"、"deletion" 等。
- **Name**: 變異的名稱,可能是 rsID 或其他命名。
- **GeneID**: 受影響基因的識別號。
- **ClinicalSignificance**: 變異的臨床意義,如 "pathogenic"、"likely pathogenic"、"benign" 等。
- **ReviewStatus**: 變異的審查狀態,是否經過審查。
- **AssertionMethod**: 判斷變異臨床意義的方法,例如實驗室測試、計算預測等。
- **AlleleID**: 變異的等位基因識別號。
- **Assembly**: 基因組版本。
- **ChromosomeAccession**: 染色體的識別號。
- **Start**: 變異的起始位置。
- **Stop**: 變異的終止位置。
- **ReferenceAllele**: 參考基因體的碱基序列。
- **AlternateAllele**: 變異基因體的碱基序列。
- **ClinVarAccession**: ClinVar 記錄的識別號。
變異類型的資訊通常可以在 "Type" 欄位中找到。這個欄位描述了變異的類型,可以是 "missense_variant"、"nonsynonymous_variant" 等,以幫助解釋變異對基因功能的影響。請注意,ClinVar 的數據可能會因版本而略有不同,因此查找資訊時最好查閱相關文檔和說明。
<br>
## 參考資料 (待消化)
- [NCBI 相關](https://my.oschina.net/u/3732258/blog/3130703)
- [Clinvar数据库](https://www.jianshu.com/p/c98aeb9c59b3)
- [[UCSC] ClinVar Variants 20220313](https://genome.ucsc.edu/cgi-bin/hgc?hgsid=1362499739_oe6JXO0ZtqLsEwecAIEap9JbLirA&db=hub_3267197_GCA_009914755.4&c=CP068277.2&l=15482388&r=15512097&o=15489776&t=15489777&g=hub_3267197_clinVar20220313&i=T%2FG)
- [[UCSC] Sample Rows](https://genome.ucsc.edu/cgi-bin/hgTables?db=hub_3267197_GCA_009914755.4&hgta_group=varRep&hgta_track=hub_3267197_clinVar20220313&hgta_table=hub_3267197_clinVar20220313&hgta_doSchema=describe+table+schema)