ANNOVAR for susScr11
===
###### tags: `基因體/三級分析`
###### tags: `生物資訊`, `基因體`, `三級分析`, `Annovar`, `Sus scrofa`
<br>
[TOC]
<br>
## 標記對象

- 學名
- Sus scrofa (野豬,又名山豬)
- Wiki
- https://zh.wikipedia.org/wiki/%E9%87%8E%E8%B1%AC
<br>
## Genomics(基龍米克斯)
### VCF file
```vcf
##fileformat=VCFv4.2
##FILTER=<ID=PASS,Description="All filters passed">
##contig=<ID=1,length=274330532>
##contig=<ID=2,length=151935994>
##contig=<ID=3,length=132848913>
##contig=<ID=4,length=130910915>
##contig=<ID=5,length=104526007>
##contig=<ID=6,length=170843587>
##contig=<ID=7,length=121844099>
##contig=<ID=8,length=138966237>
##contig=<ID=9,length=139512083>
##contig=<ID=10,length=69359453>
##contig=<ID=11,length=79169978>
##contig=<ID=12,length=61602749>
##contig=<ID=13,length=208334590>
##contig=<ID=14,length=141755446>
##contig=<ID=15,length=140412725>
##contig=<ID=16,length=79944280>
##contig=<ID=17,length=63494081>
##contig=<ID=18,length=55982971>
##contig=<ID=X,length=125939595>
##contig=<ID=Y,length=43547828>
##contig=<ID=MT,length=16613>
##contig=<ID=AEMK02000452.1,length=3843259>
...
##contig=<ID=AEMK02000519.1,length=15096>
##FORMAT=<ID=GT,Number=1,Type=String,Description="Genotype">
##FORMAT=<ID=IGC,Number=1,Type=Float,Description="Illumina GenCall Confidence Score">
##FORMAT=<ID=BAF,Number=1,Type=Float,Description="B Allele Frequency">
##FORMAT=<ID=LRR,Number=1,Type=Float,Description="Log R Ratio">
##FORMAT=<ID=NORMX,Number=1,Type=Float,Description="Normalized X intensity">
##FORMAT=<ID=NORMY,Number=1,Type=Float,Description="Normalized Y intensity">
##FORMAT=<ID=R,Number=1,Type=Float,Description="Normalized R value">
##FORMAT=<ID=THETA,Number=1,Type=Float,Description="Normalized Theta value">
##FORMAT=<ID=X,Number=1,Type=Integer,Description="Raw X intensity">
##FORMAT=<ID=Y,Number=1,Type=Integer,Description="Raw Y intensity">
```
[](https://i.imgur.com/ZeRY9Hh.png)
- **D**: 杜洛克(Duroc) (主要終端公豬 -> Good, 萬能豬種)
- **L**: 藍瑞斯(Landrace)
<br>
### 輸入指令
```
annovar$ ./convert2annovar.pl --format vcf4 Genomics1152samples_c2_10.vcf > Genomics1152samples_c2_10.vcf.avinput
```
- ```./convert2annovar.pl```
- ```--format vcf4``` (輸入格式)
- ```Genomics1152samples_c2_10.vcf```
- ```Genomics1152samples_c2_10.vcf.avinput```
輸出結果
```
1 49384 49384 G A hom .
1 70683 70683 T C hom .
1 142764 142764 T C het .
1 205163 205163 C T het .
1 239523 239523 C T het .
1 261794 261794 C T hom .
1 289363 289363 G A het .
1 309120 309120 A G het .
1 356646 356646 G A hom .
1 373626 373626 C T het .
```
- hom: 同型合子(homozygous)/純合子, TT / tt
- het: 異型合子(heterozygous)/雜合子, Tt / tT
比對原始輸入資料:

<br>
### ANNOVAR
- [[Articles] VCF pre-processing](http://annovar.openbioinformatics.org/en/latest/articles/VCF/)
- [[UserGuide] Format Conversion](http://annovar.openbioinformatics.org/en/latest/user-guide/input/)
<br>
## 參考資料
- [電腦選豬仔 (超級賽亞豬)](https://hackmd.io/xMMX0fh_RxWtYJbGtbBcOw)