# Análise de cromatogramas com **phredPhrap**
A seguir serão executados os passos básicos para a análise de cromatogramas (eletroferogramas) gerados por sequenciamento Sanger.
O programa utilizado é o [**phredPhrap**](http://www.phrap.org/phredphrapconsed.html), um *script pipeline* (código com instruções para execução de tarefas sequenciais).


1. Ir para o diretório HOME do usuário:
```bash=
cd ~/
```
2. Criar, neste diretório, um subdiretório onde será executada a análise:
```bash=
mkdir ./XAC1041
```
3. Ir para o diretório recém criado:
```bash=
cd ./XAC1041
```
4. Criar o diretório chromat_dir onde serão depositados os arquivos *\*.ab1*:
```bash=
mkdir ./chromat_dir
```
:::warning
Este diretório **./chromat_dir** deve ser criado exatamente com este nome e em seu conteúdo devem estar todos os arquivos sem subdiretórios.
:::
5. Ir para o diretório ./chromat_dir:
```bash=
cd ./chromat_dir
```
6. Baixar o arquivo com os arquivos contendo os cromatogramas compactados (*.zip*):
```bash=
wget --user=biomol --password=b10m0l ftp://hammer.fcav.unesp.br/XAC1041.zip
```
::: info
O local ou forma de obtenção dos dados irá variar de acordo com a *facility* de sequenciamento.
:::
7. Descompactar arquivo *.zip*:
```bash=
unzip XAC1041.zip
```
:::info
O nome do arquivo *.zip* e a forma como foram compactados os arquivos *.ab1* dependerá da *facility* de sequenciamento.
:::
8. Listar o conteúdo do diretório atual:
```bash=
ls
```
9. Voltar ao diretório anterior:
```bash=
cd ../
```
10. Criar os diretórios **./edit_dir** e **./poly_dir** onde serão criados arquivos resultantes:
```bash=
mkdir ./edit_dir
mkdir ./poly_dir
```
11. Ir para o diretório **./edit_dir**:
```bash=
cd ./edit_dir
```
12. Invocar o programa *phredPhrap*:
```bash=
phredPhrap
```
:::warning
Caso tenha problemas relacionados ao identificador dos parâmetros do sequenciamento. Editar o arquivo phredpar.dat:
1. Iniciamente identificar o caminho. Ele estará indicado na mensagem de erro.
<pre>
unable to match primer ID string: skipping chromatogram
unknown chemistry (KB_3730_POP7_BDTv3.mob) in chromat ../chromat_dir/SEQ-A793_E07_3C3-3CR_055.ab1
add a line of the form
"KB_3730_POP7_BDTv3.mob" <chemistry> <dye type> <machine type>
to the file /usr/local/bioinfo/consed/lib/phredpar.dat
type `phred -doc' for more information
</pre>
2. Abrir o arquivo para a edição:
```bash=
nano /usr/local/bioinfo/consed/lib/phredpar.dat
```
3. Incluir as informações relacionadas aos reagentes e equipamento (Ctrl+c & Ctrl+v):
Por exemplo:
<pre>
"KB_3730_POP7_BDTv3.mob" terminator big-dye ABI_3700
</pre>
4. Salvar o arquivo (Ctrl+O) e sair (Ctrl+X).
:::
::: warning
Também será criado no diretório anterior o subdiretório **../phd_dir**.
:::
13. Abrir o programa *consed*:
```bash=
consed
```
::: warning
O programa *consed* deve ser executado a partir do diretório **edit_dir** apenas quando já o programa *phredPhrap* já tiver sido executado com sucesso.
:::
14. Visualizar qualidade geral das sequências contíguas (*contigs*):

```bash=
phrapview XAC1041.fasta.screen.view
```
15. Clique no arquivo correspondente à montagem (sequência contígua - *contig*) e depois no botão **Open**:

16. Selecione o contig com maior número de leituras (*reads*) - sequências que foram utilizadas na montagem da sequência contígua (*contig*) e depois no botão **Show contig**:

17. Visualizar o alinhamento das *reads*:

18. Visualizar os sinais dos cromatogramas (picos de intensidade de luminescência com as cores correspondentes a cada base):
::: info
Clique com o botão direito em uma das posições (bases) das *reads* e selecione **Display traces for all reads**.

:::
::: info
Clique com o botão do meio do *mouse* para visualizar apenas uma *read*:

* Notar a marcação do programa **polyphred**, indicando que há uma base divergente de alta qualidade porém um sinal homogêneo indicando "homozigose".
:::
::: danger
Para fechar as janelas utilizar o botão **Dismiss**.
:::
19. Edição de uma porção da sequência consenso:
É possível podar a porção à direita da sequência consenso.
::: info
- Posicione o cursor na posição da sequência que deseja remover as bases à direita a partir desta posição.

- Utilize a opção no menu **Misc**:
**Trim consensus at the right side of the cursor**
:::
... ou substituir a extremidade esquerda ou direita com X:
::: info
- Posicione o cursor na posição da sequência que deseja remover as bases à esquerda a partir desta posição.

- Utilize a opção no menu **Misc**:
**Change to X's to the left in All reads**
:::
20. Salve as alterações na montagem e a sequência consenso:
::: info
Clique no menu **File** e **Save assembly**, depois clique no mesmo menu a opção **Export consensus sequence**.

Selecione o nome e depois clique no botão **OK**.
:::
21. Alinhamento da sequência consenso com a referência genômica
- Acessar o link da ferramenta [BLAST](https://blast.ncbi.nlm.nih.gov/Blast.cgi):
- Selecionar a opção **BLASTN**:

* Na opção **BLASTN**.

* Seguir os passos:
* Escolher a sequência consenso do *Contig5* para alinhamento (Arquivo salvo: *Contig5.fasta*):
* **Choose File**
* Escolher o banco de dados (**Database**): *Reference genomic sequences (refeseq_genomic)*
* Escolher o genoma (**Genome**) *Xanthomonas axonopodis pv. citri str. 306 (taxid:190486)*
* Marque a opção: **Show results in a new window**
* Clique em **BLAST** para iniciar
22. Analisar o resultado:

Note que há 1 *HIT* (correspondência) e dois *HSP* (*High-scoring segment pair*) mais relevantes e um terceiro que pode ser ignorado neste caso:
| HSP 1 | HSP 2 | HSP 3 |
| -------- | -------- | -------- |
|  |  | 
|
Anote os números de início e final da sequência consulta (*Query*) e da sequência do banco de dados (*Subject*) nos dois HSPs mais relevantes:
* HSP1
Q: 772..1598
S: 1203387..1204213
* HSP2
Q: 1..771
S: 1201233..1202003
<pre>
não há interrupção
/\
1..771 772..1598
1201233..1202003--1203387..1204213
\/
região de deleção
Tamanho: 1203387-1202003-1=1383
</pre>
Tamanho da deleção: **1383 pb**
23. Visualização no [Ensemble](https://bacteria.ensembl.org/):
* Pode fazer a busca na página principal ou usar o link direto para ir para a página relacionada à bactéria [*Xanthomonas axonopodis pv. citri str. 306*](https://bacteria.ensembl.org/Xanthomonas_axonopodis_pv_citri_str_306/Info/Index).

* Clicar em **BLAST**:

* Clicar em **New job**:

* Configurar as opções de BLAST, escolhendo a sequência (*Contig5.fasta*), o tipo dessa sequência (*DNA*) e o banco de dados (*DNA*) e finalmente **RUN**:

* Clicar em **View results**:

* Clicar na localização genômica do primeiro *HIT*:

* Navegar no genoma

::: info
Para selecionar a região genômica (**Location**) inserir o seguinte texto *Chromosome:1201305-1204086* e, então, clicar em **GO**:

:::