---
title: 'Metagenómica funcional 2024. Tema 4B'
disqus: hackmd
---
Metagenómica Funcional 2024
===
Centro de Investigaciones Biológicas del Noroeste S.C. La Paz, Baja California Sur.
Noviembre 2024
**Dra. E. Ernestina Godoy Lozano** | elizabeth.godoy@insp.mx | tinagodoy@gmail.com
## Tabla de Contenido
[TOC]
# TEMA 4. Reconstrucción de genomas de novo y pangenomas. Parte B
## 4.1. Preparación de espacio de trabajo
```gherkin=
Feature: Generar directorio de trabajo
cd curso_2024
mkdir comparative_genomics && cd comparative_genomics
mkdir pyani
```
## 4.2. PYANI
```gherkin=5
Feature: Activar ambiente conda
conda activate new_env
```
### 4.2.1 Obtencion de referencias
```gherkin=7
Feature: Obtencion de referencias
cd pyani
genbank_get_genomes_by_taxon.py -h
# Instrucción para Bajar todos los genomas del genero "Pelosinus" que tiene el taxid (NCBI) 365348
# nohup genbank_get_genomes_by_taxon.py -o pyani_input -t 365348 -l Pelosinus_downloads.log --email elizabeth.godoy@insp.mx &
# Haremos una copia del directorio de pyani_input
cp -r /Datos/cursoMet/pyani_input/ .
cd pyani_input
Feature: Revisar los archivos log
less Pelosinus_downloads.log
tail Pelosinus_downloads.log
```
### 4.2.2 Modificar archivos de salida
```gherkin=21
Feature: Quitar los genomas comprimidos
cd pyani_input
rm *.fna.gz
Feature: mover los archivos txt a un nivel superior
cat labels.txt
mv labels.txt classes.txt ../.
Feature: Quitar genomas repetidos
rm GCF_900114615.1_IMG-taxon_2636416028_annotated_assembly_genomic.fna GCF_000271485.1_Pelosinus.strR7_v1.0_genomic.fna GCF_900100555.1_IMG-taxon_2642422525_annotated_assembly_genomic.fna GCF_000271665.1_Pelosinus.strJWB45_v1.0_genomic.fna
Feature: Generar liga simbolica dentro de la carpeta de pyani_input del genoma a comparar
ln -s /Datos/cursoMet/cursos/bins_final/bin.3.fa Pelosinus_MAG.fa
Feature: Verificar que la liga simbolica esta activa
ls -l
cd ..
Feature: Modificar el archivo de labels para quitar genomas repetidos y genomas que no se pudieron bajar
nano labels.txt
Feature: Agregar
Pelosinus_MAG Pelosinus MAG
Feature: Borrar las lineas de los genomas repetidos
# GCF_900114615.1_IMG-taxon_2636416028_annotated_assembly_genomic
# GCF_000271485.1_Pelosinus.strR7_v1.0_genomic
# GCF_900100555.1_IMG-taxon_2642422525_annotated_assembly_genomic
# GCF_000271665.1_Pelosinus.strJWB45_v1.0_genomic
```
### 4.2.3 Correr pyani
```gherkin=51
Feature: usar el script average_nucleotide_identity.py
average_nucleotide_identity.py -h
nohup average_nucleotide_identity.py -v -i pyani_input/ -o pyani_output/ -g --gformat png --labels labels.txt &
Feature: Examinar los archivos de salida
cd pyani_output
Feature: borrar nucmer_output.tar.gz
rm nucmer_output.tar.gz
Feature: Copiar archivos de salida a su computadora
# comando en mi computadora
scp -r ebioinfoXX@200.23.162.231:/home/egodoy/curso_2022/comparative_genomics/pyani/pyani_output/ .
```
## 4.3 Pangenomas
```gherkin=64
Feature: Preparar ambiente de trabajo
cd ../..
mkdir proteinOrtho
cd proteinOrtho
```
### 4.3.1 Obtencion de referencias
```gherkin=68
Feature: Generar ligas simbolicas de los proteomas
# a240
ln -s /Datos/cursoMet/cursos/genomas/*.faa .
#a231
ln -s /home/egodoy/database/genomas/*.faa .
# Verificar
ls -l
```
### 4.3.2 Correr ProteinOrtho
```gherkin=72
Feature: Ayuda de proteinortho5.pl
/Datos/cursoMet/scripts/proteinortho_v5.16b/proteinortho5.pl -h
Feature: Correr proteinortho5.pl
nohup /Datos/cursoMet/scripts/proteinortho_v5.16b/proteinortho5.pl -project=Pelosinus -cpus=4 -verbose -step=0 -dups=2 -singles bin_3_Pelosinus.faa Pelosinus_fermentans_JBW45.faa Pelosinus_sp_Bkl1.faa &
```
### 4.3.3 Explorar salida de ProteinOrtho
```gherkin=77
Feature: Usar comando "head" y "cat"
head Pelosinus.proteinortho
head Pelosinus.proteinortho-graph
cat Pelosinus.proteinortho-graph.summary
```
### 4.3.4 Generar cuentas de pangenoma
```gherkin=81
Feature: Contar genes de Core, Shell y Cloud
wc -l Pelosinus.proteinortho
# Core
grep -c '^3' Pelosinus.proteinortho
# Shell
grep -c '^2' Pelosinus.proteinortho
# Cloud
grep -c '^1' Pelosinus.proteinortho
## Extraer genes de Core, Shell y Cloud
# Core
grep '^3' Pelosinus.proteinortho > core.tab
# Shell
grep '^2' Pelosinus.proteinortho > shell.tab
# Cloud
grep '^1' Pelosinus.proteinortho > cloud.tab
### Explorar archivos
less core.tab
less shell.tab
less cloud.tab
### Extraer genes que solo tienen nuestro genoma
cut -f4 cloud.tab| grep -v '*' > cloud_Pelosinus_fermentas_GOM.tab
# Contar numero de genes
wc -l cloud_Pelosinus_fermentas_GOM.tab
# Explorar archivo
less cloud_Pelosinus_fermentas_GOM.tab
```
### 4.3.4 Generar diagrama de Venn
```gherkin=116
Feature: Usar script venn_diagram_Pelosinus.R
conda activate R
Rscript /Datos/cursoMet/scripts/venn_diagram_Pelosinus.R Pelosinus.proteinortho
```