
---
Inferência Bayesiana no MrBayes com um marcador - Preparando arquivos no Mesquite
===
**Passo 1: Abra o software Mesquite**
Vá em *File > Open file* e abra a sua matriz alinhada pós-*trimming* ...

...no formato FASTA e com sequências de DNA...

...no Mesquite. Aqui o software Mesquite abrirá uma nova janela mostrando seu alinhamento.

**Nota:** O Mesquite sempre pede para salvar uma cópia do seu arquivo antes de abrir! Salve este novo arquivo no formato NEXUS (.nex) e remova do nome do arquivo a referência à FASTA.
**Passo 2: Exporte do software Mesquite**
Com o arquivo aberto é hora de exportá-lo em novo formato - o formato para análise de Inferência Bayesiana. Vá em *File > Export* e na caixa de texto que irá abrir, selecione *"Export NEXUS for MrBayes"*

**Passo 3: Abra o arquivo no bloco de notas**
Usando o Explorer do computador, encontre seu arquivo **.nex** e peça para abrir o arquivo usando bloco de notas. Note que na parte superior do seu arquivo há agora o seguinte cabeçalho:
```
BEGIN DATA;
DIMENSIONS NTAX=XX NCHAR=YY;
FORMAT DATATYPE = DNA GAP = - MISSING = ?;
MATRIX
```
Neste cabeçalho, **NTAX=** é o número total de táxons da sua matriz e **NCHAR=** é o número total de caractereres da sua matriz.
**Passo 4: Edite o bloco de comando**
Ao final deste mesmo arquivo, o processo de exportar acrescentou um bloco de comando para o MrBayes:
```
;
END;
begin mrbayes;
set autoclose=yes nowarn=yes;
lset nst=6 rates=invgamma;
unlink statefreq=(all) revmat=(all) shape=(all) pinvar=(all);
prset applyto=(all) ratepr=variable;
mcmcp ngen= 100000 relburnin=yes burninfrac=0.25 printfreq=1000 samplefreq=1000 nchains=4 savebrlens=yes;
mcmc;
sumt;
end;
```
Aqui precisamos editar as informações quanto a escolha do modelo de substituição de nucleotídeos: em **"lset"** vamos definir os modelos de substituição de nucleotídeos a serem utilizados e em **"rates="** vamos ajustar a frequência de nucleotídeos (+G, +I, I+G, equal).
Temos que usar os códigos do MrBayes para designar essas informações:
* Modelo de substituição de nucleotídeos em **lset**:
F81=1, HKY=2, GTR=6
* frequência de nucleotídeos em **rates**:
G=GAMMA, I=propinv, I+G=INVGAMMA, nada=equal
*PS.: use a análise feita no IqTree para conferir o melhor modelo de substituição de nucleotídeos dentro dos aceitos pelo MrBayes*
Salve o arquivo.
---
Inferência Bayesiana no MrBayes com um marcador - Alternativa: Preparando arquivos no bloco de notas
===
**Passo 1: Removendo os símbolos de >**
Abra a sua matriz em bloco de notas e remova todos os símbolos de > que estão na frente dos nomes dos táxons.Dê um 'Tab' na frente de cada nome de táxon.
**Passo 2: Identificação da matriz**
Abra a sua matriz no arquivo de edição de texto. Na primeira linha deste arquivo vamos inserir uma identificação. **Entre colchetes**, coloque o nome da região correspondente à matriz, o número total de caracteres da matriz e o modelo de substituição de nucleotídeos correspondente, como no exemplo: **[ITS nchar=745 HKY+G]**
**Passo 3: O cabeçalho da matriz**
A matriz, para rodar no MrBayes, deve ter o seguinte cabeçalho:
```
BEGIN DATA;
DIMENSIONS NTAX=XX NCHAR=YY;
FORMAT DATATYPE = DNA GAP = - MISSING = ?;
MATRIX
[Onde NTAX= será o número total de táxons da sua matriz e NCHAR= terá o número total de caractereres da sua matriz.]
```
Copie e cole esse cabeçalho no arquivo de texto da sua matriz e o edite, deixando-o adequado aos seus dados.
**Passo 4: O bloco de comando do MrBayes**
Ao final da matriz, cole o bloco de comando abaixo.
```
;
END;
begin mrbayes;
set autoclose=yes nowarn=yes;
[F81=1, HKY=2, GTR=6, G=GAMMA, I=propinv, I+G=INVGAMMA, nada=equal]
lset nst=? rates=?;
unlink statefreq=(all) revmat=(all) shape=(all) pinvar=(all);
prset applyto=(all) ratepr=variable;
mcmcp ngen= 10000000 relburnin=yes burninfrac=0.25 printfreq=1000 samplefreq=1000 nchains=4 savebrlens=yes;
mcmc;
sumt;
end;
```
* Em **"lset"** vamos definir os modelos de substituição de nucleotídeos a serem utilizados. Use **"rates="** para mudar a frequência de nucleotídeos (+G, +I, I+G, equal)
* Salve o arquivo.
---
# Inferência Bayesiana no MrBayes com matriz concatenada - Preparando arquivos no Mesquite
Se a matriz é uma matriz concatenada obtida a partir de marcadores diferentes (análise de evidência total), devemos ter todas as informações quanto a posição de cada marcador dentro dessa matriz concatenada (lembre-se: na análise de matriz concatenada devemos utilizar modelos evolutivos distintos para cada conjunto de dados!).
Para executar essa etapa, você precisará que suas **matrizes alinhadas e pós-triming em formato .nex**, além **do modelo evolutivo de cada matriz já selecionado**.
**Passo 1:** Para criar a matriz concatenada, abra suas **matrizes alinhadas** em formato **.nex** no Mesquite. *PS.: Para tutorial sobre como concatenar as matrizes no Mesquite, veja [aqui](https://hackmd.io/@ana-moraes/Concat).*
**Passo 2:** O Mesquite, após concatenar os alinhamentos, irá te oferecer uma opção *Export Nexus for MrBayes*. O arquivo gerado terá cabeçalho e bloco de comando, mas será necessário editar os parâmetros da Inferência Bayesiana.
<p align="center"> <img width="400" height="400" src=https://i.imgur.com/KQXMh4Y.jpg>
**Passo 3:** A matriz particionada para rodar no MrBayes deve ter o seguinte cabeçalho:
```
#NEXUS
BEGIN data;
DIMENSIONS NTAX=XX NCHAR=YY;
FORMAT DATATYPE = DNA GAP = - MISSING = ? INTERLEAVE=YES;
MATRIX
[Onde NTAX= será o número total de táxons da sua matriz e NCHAR= terá o número total de caractereres da sua matriz.]
```
PS.: No exemplo anterior, com um único marcador, a opção INTERLEAVE estava como NO, mas quando a matriz é particionada, essa opção deve estar em YES.
**Passo 4:** Ao final da matriz, edite o bloco de comando abaixo:
```
end;
[BAYESIANA]
Begin mrbayes;
charset NOMEDAREGIAO1=1-745;
charset NOMEDAREGIAO2=746-1230;
charset NOMEDAREGIAO3=1231-2152;
partition genes=3:NOMEDAREGIAO1,NOMEDAREGIAO2,NOMEDAREGIAO3;
set partition=genes;
```
* Em **"charset"** inclua o nome da região e após o sinal de igual (=) inclua a posição desse marcador na sua matriz, sendo 1 o início da primeira sequência e após o sinal "-" o fim dessa sequência. A próxima sequência deve iniciar no próximo caracter (segundo charset) e assim sucessivamente.
* Em **"partition genes"**, após 0 sinal de igual, inclua o número de regiões utilizadas e após o símbolo de dois pontos (:), inclua os nomes das regiões da sua matriz.
* Em **"set partition"**, deixe *"=genes"*.
* Em **"lset** vamos definir os modelos de substituição de nucleotídeos a serem utilizados em cada partição.
* Em **applyto="** insira o número da partição e em **nst=** indique o número correspondente ao modelo evolutivo.
* Em **"rates="**, mude a frequência de nucleotídeos (+G, +I, I+G, equal)
```
[F81=1, HKY=2, GTR=6, G=GAMMA, I=propinv, I+G=INVGAMMA, nada=equal]
Lset applyto=(1) nst=2 rates=gamma;
Lset applyto=(2,3) nst=1 rates=gamma;
prset applyto=(all) ratepr=variable;
unlink revmat=(all) shape=(all) pinvar=(all);
mcmc ngen=1000000 samplefreq=200;
end;
```
* Salve o arquivo.