Inferência Bayesiana no MrBayes com um marcador - Preparando arquivos no Mesquite

![](https://i.imgur.com/3mtdFLZ.jpg) --- Inferência Bayesiana no MrBayes com um marcador - Preparando arquivos no Mesquite === **Passo 1: Abra o software Mesquite** Vá em *File > Open file* e abra a sua matriz alinhada pós-*trimming* ... ![](https://i.imgur.com/ET7NviD.png) ...no formato FASTA e com sequências de DNA... ![](https://i.imgur.com/dPPp60C.png) ...no Mesquite. Aqui o software Mesquite abrirá uma nova janela mostrando seu alinhamento. ![](https://i.imgur.com/ILc0XY9.png) **Nota:** O Mesquite sempre pede para salvar uma cópia do seu arquivo antes de abrir! Salve este novo arquivo no formato NEXUS (.nex) e remova do nome do arquivo a referência à FASTA. **Passo 2: Exporte do software Mesquite** Com o arquivo aberto é hora de exportá-lo em novo formato - o formato para análise de Inferência Bayesiana. Vá em *File > Export* e na caixa de texto que irá abrir, selecione *"Export NEXUS for MrBayes"* ![](https://i.imgur.com/pS9YCDf.png) **Passo 3: Abra o arquivo no bloco de notas** Usando o Explorer do computador, encontre seu arquivo **.nex** e peça para abrir o arquivo usando bloco de notas. Note que na parte superior do seu arquivo há agora o seguinte cabeçalho: ``` BEGIN DATA; DIMENSIONS NTAX=XX NCHAR=YY; FORMAT DATATYPE = DNA GAP = - MISSING = ?; MATRIX ``` Neste cabeçalho, **NTAX=** é o número total de táxons da sua matriz e **NCHAR=** é o número total de caractereres da sua matriz. **Passo 4: Edite o bloco de comando** Ao final deste mesmo arquivo, o processo de exportar acrescentou um bloco de comando para o MrBayes: ``` ; END; begin mrbayes; set autoclose=yes nowarn=yes; lset nst=6 rates=invgamma; unlink statefreq=(all) revmat=(all) shape=(all) pinvar=(all); prset applyto=(all) ratepr=variable; mcmcp ngen= 100000 relburnin=yes burninfrac=0.25 printfreq=1000 samplefreq=1000 nchains=4 savebrlens=yes; mcmc; sumt; end; ``` Aqui precisamos editar as informações quanto a escolha do modelo de substituição de nucleotídeos: em **"lset"** vamos definir os modelos de substituição de nucleotídeos a serem utilizados e em **"rates="** vamos ajustar a frequência de nucleotídeos (+G, +I, I+G, equal). Temos que usar os códigos do MrBayes para designar essas informações: * Modelo de substituição de nucleotídeos em **lset**: F81=1, HKY=2, GTR=6 * frequência de nucleotídeos em **rates**: G=GAMMA, I=propinv, I+G=INVGAMMA, nada=equal *PS.: use a análise feita no IqTree para conferir o melhor modelo de substituição de nucleotídeos dentro dos aceitos pelo MrBayes* Salve o arquivo. --- Inferência Bayesiana no MrBayes com um marcador - Alternativa: Preparando arquivos no bloco de notas === **Passo 1: Removendo os símbolos de >** Abra a sua matriz em bloco de notas e remova todos os símbolos de > que estão na frente dos nomes dos táxons.Dê um 'Tab' na frente de cada nome de táxon. **Passo 2: Identificação da matriz** Abra a sua matriz no arquivo de edição de texto. Na primeira linha deste arquivo vamos inserir uma identificação. **Entre colchetes**, coloque o nome da região correspondente à matriz, o número total de caracteres da matriz e o modelo de substituição de nucleotídeos correspondente, como no exemplo: **[ITS nchar=745 HKY+G]** **Passo 3: O cabeçalho da matriz** A matriz, para rodar no MrBayes, deve ter o seguinte cabeçalho: ``` BEGIN DATA; DIMENSIONS NTAX=XX NCHAR=YY; FORMAT DATATYPE = DNA GAP = - MISSING = ?; MATRIX [Onde NTAX= será o número total de táxons da sua matriz e NCHAR= terá o número total de caractereres da sua matriz.] ``` Copie e cole esse cabeçalho no arquivo de texto da sua matriz e o edite, deixando-o adequado aos seus dados. **Passo 4: O bloco de comando do MrBayes** Ao final da matriz, cole o bloco de comando abaixo. ``` ; END; begin mrbayes; set autoclose=yes nowarn=yes; [F81=1, HKY=2, GTR=6, G=GAMMA, I=propinv, I+G=INVGAMMA, nada=equal] lset nst=? rates=?; unlink statefreq=(all) revmat=(all) shape=(all) pinvar=(all); prset applyto=(all) ratepr=variable; mcmcp ngen= 10000000 relburnin=yes burninfrac=0.25 printfreq=1000 samplefreq=1000 nchains=4 savebrlens=yes; mcmc; sumt; end; ``` * Em **"lset"** vamos definir os modelos de substituição de nucleotídeos a serem utilizados. Use **"rates="** para mudar a frequência de nucleotídeos (+G, +I, I+G, equal) * Salve o arquivo. --- # Inferência Bayesiana no MrBayes com matriz concatenada - Preparando arquivos no Mesquite Se a matriz é uma matriz concatenada obtida a partir de marcadores diferentes (análise de evidência total), devemos ter todas as informações quanto a posição de cada marcador dentro dessa matriz concatenada (lembre-se: na análise de matriz concatenada devemos utilizar modelos evolutivos distintos para cada conjunto de dados!). Para executar essa etapa, você precisará que suas **matrizes alinhadas e pós-triming em formato .nex**, além **do modelo evolutivo de cada matriz já selecionado**. **Passo 1:** Para criar a matriz concatenada, abra suas **matrizes alinhadas** em formato **.nex** no Mesquite. *PS.: Para tutorial sobre como concatenar as matrizes no Mesquite, veja [aqui](https://hackmd.io/@ana-moraes/Concat).* **Passo 2:** O Mesquite, após concatenar os alinhamentos, irá te oferecer uma opção *Export Nexus for MrBayes*. O arquivo gerado terá cabeçalho e bloco de comando, mas será necessário editar os parâmetros da Inferência Bayesiana. <p align="center"> <img width="400" height="400" src=https://i.imgur.com/KQXMh4Y.jpg> **Passo 3:** A matriz particionada para rodar no MrBayes deve ter o seguinte cabeçalho: ``` #NEXUS BEGIN data; DIMENSIONS NTAX=XX NCHAR=YY; FORMAT DATATYPE = DNA GAP = - MISSING = ? INTERLEAVE=YES; MATRIX [Onde NTAX= será o número total de táxons da sua matriz e NCHAR= terá o número total de caractereres da sua matriz.] ``` PS.: No exemplo anterior, com um único marcador, a opção INTERLEAVE estava como NO, mas quando a matriz é particionada, essa opção deve estar em YES. **Passo 4:** Ao final da matriz, edite o bloco de comando abaixo: ``` end; [BAYESIANA] Begin mrbayes; charset NOMEDAREGIAO1=1-745; charset NOMEDAREGIAO2=746-1230; charset NOMEDAREGIAO3=1231-2152; partition genes=3:NOMEDAREGIAO1,NOMEDAREGIAO2,NOMEDAREGIAO3; set partition=genes; ``` * Em **"charset"** inclua o nome da região e após o sinal de igual (=) inclua a posição desse marcador na sua matriz, sendo 1 o início da primeira sequência e após o sinal "-" o fim dessa sequência. A próxima sequência deve iniciar no próximo caracter (segundo charset) e assim sucessivamente. * Em **"partition genes"**, após 0 sinal de igual, inclua o número de regiões utilizadas e após o símbolo de dois pontos (:), inclua os nomes das regiões da sua matriz. * Em **"set partition"**, deixe *"=genes"*. * Em **"lset** vamos definir os modelos de substituição de nucleotídeos a serem utilizados em cada partição. * Em **applyto="** insira o número da partição e em **nst=** indique o número correspondente ao modelo evolutivo. * Em **"rates="**, mude a frequência de nucleotídeos (+G, +I, I+G, equal) ``` [F81=1, HKY=2, GTR=6, G=GAMMA, I=propinv, I+G=INVGAMMA, nada=equal] Lset applyto=(1) nst=2 rates=gamma; Lset applyto=(2,3) nst=1 rates=gamma; prset applyto=(all) ratepr=variable; unlink revmat=(all) shape=(all) pinvar=(all); mcmc ngen=1000000 samplefreq=200; end; ``` * Salve o arquivo.