ANNOVAR for susScr11 === ###### tags: `基因體/三級分析` ###### tags: `生物資訊`, `基因體`, `三級分析`, `Annovar`, `Sus scrofa` <br> [TOC] <br> ## 標記對象 ![](https://upload.wikimedia.org/wikipedia/commons/thumb/1/1c/Wildschweinbache_mit_vier_ihrer_Frischlinge.JPG/1280px-Wildschweinbache_mit_vier_ihrer_Frischlinge.JPG) - 學名 - Sus scrofa (野豬,又名山豬) - Wiki - https://zh.wikipedia.org/wiki/%E9%87%8E%E8%B1%AC <br> ## Genomics(基龍米克斯) ### VCF file ```vcf ##fileformat=VCFv4.2 ##FILTER=<ID=PASS,Description="All filters passed"> ##contig=<ID=1,length=274330532> ##contig=<ID=2,length=151935994> ##contig=<ID=3,length=132848913> ##contig=<ID=4,length=130910915> ##contig=<ID=5,length=104526007> ##contig=<ID=6,length=170843587> ##contig=<ID=7,length=121844099> ##contig=<ID=8,length=138966237> ##contig=<ID=9,length=139512083> ##contig=<ID=10,length=69359453> ##contig=<ID=11,length=79169978> ##contig=<ID=12,length=61602749> ##contig=<ID=13,length=208334590> ##contig=<ID=14,length=141755446> ##contig=<ID=15,length=140412725> ##contig=<ID=16,length=79944280> ##contig=<ID=17,length=63494081> ##contig=<ID=18,length=55982971> ##contig=<ID=X,length=125939595> ##contig=<ID=Y,length=43547828> ##contig=<ID=MT,length=16613> ##contig=<ID=AEMK02000452.1,length=3843259> ... ##contig=<ID=AEMK02000519.1,length=15096> ##FORMAT=<ID=GT,Number=1,Type=String,Description="Genotype"> ##FORMAT=<ID=IGC,Number=1,Type=Float,Description="Illumina GenCall Confidence Score"> ##FORMAT=<ID=BAF,Number=1,Type=Float,Description="B Allele Frequency"> ##FORMAT=<ID=LRR,Number=1,Type=Float,Description="Log R Ratio"> ##FORMAT=<ID=NORMX,Number=1,Type=Float,Description="Normalized X intensity"> ##FORMAT=<ID=NORMY,Number=1,Type=Float,Description="Normalized Y intensity"> ##FORMAT=<ID=R,Number=1,Type=Float,Description="Normalized R value"> ##FORMAT=<ID=THETA,Number=1,Type=Float,Description="Normalized Theta value"> ##FORMAT=<ID=X,Number=1,Type=Integer,Description="Raw X intensity"> ##FORMAT=<ID=Y,Number=1,Type=Integer,Description="Raw Y intensity"> ``` [![](https://i.imgur.com/ZeRY9Hh.png)](https://i.imgur.com/ZeRY9Hh.png) - **D**: 杜洛克(Duroc) (主要終端公豬 -> Good, 萬能豬種) - **L**: 藍瑞斯(Landrace) <br> ### 輸入指令 ``` annovar$ ./convert2annovar.pl --format vcf4 Genomics1152samples_c2_10.vcf > Genomics1152samples_c2_10.vcf.avinput ``` - ```./convert2annovar.pl``` - ```--format vcf4``` (輸入格式) - ```Genomics1152samples_c2_10.vcf``` - ```Genomics1152samples_c2_10.vcf.avinput``` 輸出結果 ``` 1 49384 49384 G A hom . 1 70683 70683 T C hom . 1 142764 142764 T C het . 1 205163 205163 C T het . 1 239523 239523 C T het . 1 261794 261794 C T hom . 1 289363 289363 G A het . 1 309120 309120 A G het . 1 356646 356646 G A hom . 1 373626 373626 C T het . ``` - hom: 同型合子(homozygous)/純合子, TT / tt - het: 異型合子(heterozygous)/雜合子, Tt / tT 比對原始輸入資料: ![](https://i.imgur.com/XiJv5dC.png) <br> ### ANNOVAR - [[Articles] VCF pre-processing](http://annovar.openbioinformatics.org/en/latest/articles/VCF/) - [[UserGuide] Format Conversion](http://annovar.openbioinformatics.org/en/latest/user-guide/input/) <br> ## 參考資料 - [電腦選豬仔 (超級賽亞豬)](https://hackmd.io/xMMX0fh_RxWtYJbGtbBcOw)