# Análise de cromatogramas com **phredPhrap** A seguir serão executados os passos básicos para a análise de cromatogramas (eletroferogramas) gerados por sequenciamento Sanger. O programa utilizado é o [**phredPhrap**](http://www.phrap.org/phredphrapconsed.html), um *script pipeline* (código com instruções para execução de tarefas sequenciais). ![](https://i.imgur.com/RwO5cgz.png) ![](https://i.imgur.com/7jlxnIz.png) 1. Ir para o diretório HOME do usuário: ```bash= cd ~/ ``` 2. Criar, neste diretório, um subdiretório onde será executada a análise: ```bash= mkdir ./XAC1041 ``` 3. Ir para o diretório recém criado: ```bash= cd ./XAC1041 ``` 4. Criar o diretório chromat_dir onde serão depositados os arquivos *\*.ab1*: ```bash= mkdir ./chromat_dir ``` :::warning Este diretório **./chromat_dir** deve ser criado exatamente com este nome e em seu conteúdo devem estar todos os arquivos sem subdiretórios. ::: 5. Ir para o diretório ./chromat_dir: ```bash= cd ./chromat_dir ``` 6. Baixar o arquivo com os arquivos contendo os cromatogramas compactados (*.zip*): ```bash= wget --user=biomol --password=b10m0l ftp://hammer.fcav.unesp.br/XAC1041.zip ``` ::: info O local ou forma de obtenção dos dados irá variar de acordo com a *facility* de sequenciamento. ::: 7. Descompactar arquivo *.zip*: ```bash= unzip XAC1041.zip ``` :::info O nome do arquivo *.zip* e a forma como foram compactados os arquivos *.ab1* dependerá da *facility* de sequenciamento. ::: 8. Listar o conteúdo do diretório atual: ```bash= ls ``` 9. Voltar ao diretório anterior: ```bash= cd ../ ``` 10. Criar os diretórios **./edit_dir** e **./poly_dir** onde serão criados arquivos resultantes: ```bash= mkdir ./edit_dir mkdir ./poly_dir ``` 11. Ir para o diretório **./edit_dir**: ```bash= cd ./edit_dir ``` 12. Invocar o programa *phredPhrap*: ```bash= phredPhrap ``` :::warning Caso tenha problemas relacionados ao identificador dos parâmetros do sequenciamento. Editar o arquivo phredpar.dat: 1. Iniciamente identificar o caminho. Ele estará indicado na mensagem de erro. <pre> unable to match primer ID string: skipping chromatogram unknown chemistry (KB_3730_POP7_BDTv3.mob) in chromat ../chromat_dir/SEQ-A793_E07_3C3-3CR_055.ab1 add a line of the form "KB_3730_POP7_BDTv3.mob" <chemistry> <dye type> <machine type> to the file /usr/local/bioinfo/consed/lib/phredpar.dat type `phred -doc' for more information </pre> 2. Abrir o arquivo para a edição: ```bash= nano /usr/local/bioinfo/consed/lib/phredpar.dat ``` 3. Incluir as informações relacionadas aos reagentes e equipamento (Ctrl+c & Ctrl+v): Por exemplo: <pre> "KB_3730_POP7_BDTv3.mob" terminator big-dye ABI_3700 </pre> 4. Salvar o arquivo (Ctrl+O) e sair (Ctrl+X). ::: ::: warning Também será criado no diretório anterior o subdiretório **../phd_dir**. ::: 13. Abrir o programa *consed*: ```bash= consed ``` ::: warning O programa *consed* deve ser executado a partir do diretório **edit_dir** apenas quando já o programa *phredPhrap* já tiver sido executado com sucesso. ::: 14. Visualizar qualidade geral das sequências contíguas (*contigs*): ![](https://i.imgur.com/h1rZkJx.png) ```bash= phrapview XAC1041.fasta.screen.view ``` 15. Clique no arquivo correspondente à montagem (sequência contígua - *contig*) e depois no botão **Open**: ![Consed1](https://i.imgur.com/ydeJZOQ.png) 16. Selecione o contig com maior número de leituras (*reads*) - sequências que foram utilizadas na montagem da sequência contígua (*contig*) e depois no botão **Show contig**: ![](https://i.imgur.com/on135pn.png) 17. Visualizar o alinhamento das *reads*: ![](https://i.imgur.com/ew8WQJF.png) 18. Visualizar os sinais dos cromatogramas (picos de intensidade de luminescência com as cores correspondentes a cada base): ::: info Clique com o botão direito em uma das posições (bases) das *reads* e selecione **Display traces for all reads**. ![](https://i.imgur.com/cmuyi9v.png) ::: ::: info Clique com o botão do meio do *mouse* para visualizar apenas uma *read*: ![](https://i.imgur.com/OsY86z8.png) * Notar a marcação do programa **polyphred**, indicando que há uma base divergente de alta qualidade porém um sinal homogêneo indicando "homozigose". ::: ::: danger Para fechar as janelas utilizar o botão **Dismiss**. ::: 19. Edição de uma porção da sequência consenso: É possível podar a porção à direita da sequência consenso. ::: info - Posicione o cursor na posição da sequência que deseja remover as bases à direita a partir desta posição. ![](https://i.imgur.com/fItn034.png) - Utilize a opção no menu **Misc**: **Trim consensus at the right side of the cursor** ::: ... ou substituir a extremidade esquerda ou direita com X: ::: info - Posicione o cursor na posição da sequência que deseja remover as bases à esquerda a partir desta posição. ![](https://i.imgur.com/CTAeNj4.png) - Utilize a opção no menu **Misc**: **Change to X's to the left in All reads** ::: 20. Salve as alterações na montagem e a sequência consenso: ::: info Clique no menu **File** e **Save assembly**, depois clique no mesmo menu a opção **Export consensus sequence**. ![](https://i.imgur.com/fCoJ58M.png) Selecione o nome e depois clique no botão **OK**. ::: 21. Alinhamento da sequência consenso com a referência genômica - Acessar o link da ferramenta [BLAST](https://blast.ncbi.nlm.nih.gov/Blast.cgi): - Selecionar a opção **BLASTN**: ![](https://i.imgur.com/3O2AVwu.png) * Na opção **BLASTN**. ![](https://i.imgur.com/LvJo9mP.png) * Seguir os passos: * Escolher a sequência consenso do *Contig5* para alinhamento (Arquivo salvo: *Contig5.fasta*): * **Choose File** * Escolher o banco de dados (**Database**): *Reference genomic sequences (refeseq_genomic)* * Escolher o genoma (**Genome**) *Xanthomonas axonopodis pv. citri str. 306 (taxid:190486)* * Marque a opção: **Show results in a new window** * Clique em **BLAST** para iniciar 22. Analisar o resultado: ![](https://i.imgur.com/fS8xYXW.png) Note que há 1 *HIT* (correspondência) e dois *HSP* (*High-scoring segment pair*) mais relevantes e um terceiro que pode ser ignorado neste caso: | HSP 1 | HSP 2 | HSP 3 | | -------- | -------- | -------- | | ![](https://i.imgur.com/UA3HJdK.png) | ![](https://i.imgur.com/iaopuvF.png) | ![](https://i.imgur.com/x9d521W.png) | Anote os números de início e final da sequência consulta (*Query*) e da sequência do banco de dados (*Subject*) nos dois HSPs mais relevantes: * HSP1 Q: 772..1598 S: 1203387..1204213 * HSP2 Q: 1..771 S: 1201233..1202003 <pre> não há interrupção /\ 1..771 772..1598 1201233..1202003--1203387..1204213 \/ região de deleção Tamanho: 1203387-1202003-1=1383 </pre> Tamanho da deleção: **1383 pb** 23. Visualização no [Ensemble](https://bacteria.ensembl.org/): * Pode fazer a busca na página principal ou usar o link direto para ir para a página relacionada à bactéria [*Xanthomonas axonopodis pv. citri str. 306*](https://bacteria.ensembl.org/Xanthomonas_axonopodis_pv_citri_str_306/Info/Index). ![](https://i.imgur.com/z9g3wXj.png) * Clicar em **BLAST**: ![](https://i.imgur.com/2622XNo.png) * Clicar em **New job**: ![](https://i.imgur.com/fAOc4fC.png) * Configurar as opções de BLAST, escolhendo a sequência (*Contig5.fasta*), o tipo dessa sequência (*DNA*) e o banco de dados (*DNA*) e finalmente **RUN**: ![](https://i.imgur.com/m7XQJrg.png) * Clicar em **View results**: ![](https://i.imgur.com/unmuokC.png) * Clicar na localização genômica do primeiro *HIT*: ![](https://i.imgur.com/L3HwtuC.png) * Navegar no genoma ![](https://i.imgur.com/wFlxqBX.png) ::: info Para selecionar a região genômica (**Location**) inserir o seguinte texto *Chromosome:1201305-1204086* e, então, clicar em **GO**: ![](https://i.imgur.com/1vMgQnd.png) :::