Try   HackMD

Metagenómica Funcional 2024

Centro de Investigaciones Biológicas del Noroeste S.C. La Paz, Baja California Sur.
Noviembre 2024

Dra. E. Ernestina Godoy Lozano | elizabeth.godoy@insp.mx | tinagodoy@gmail.com

Tabla de Contenido

TEMA 4. Reconstrucción de genomas de novo y pangenomas. Parte B

4.1. Preparación de espacio de trabajo

Feature: Generar directorio de trabajo cd curso_2024 mkdir comparative_genomics && cd comparative_genomics mkdir pyani

4.2. PYANI

Feature: Activar ambiente conda conda activate new_env

4.2.1 Obtencion de referencias

Feature: Obtencion de referencias cd pyani genbank_get_genomes_by_taxon.py -h # Instrucción para Bajar todos los genomas del genero "Pelosinus" que tiene el taxid (NCBI) 365348 # nohup genbank_get_genomes_by_taxon.py -o pyani_input -t 365348 -l Pelosinus_downloads.log --email elizabeth.godoy@insp.mx & # Haremos una copia del directorio de pyani_input cp -r /Datos/cursoMet/pyani_input/ . cd pyani_input Feature: Revisar los archivos log less Pelosinus_downloads.log tail Pelosinus_downloads.log

4.2.2 Modificar archivos de salida

Feature: Quitar los genomas comprimidos cd pyani_input rm *.fna.gz Feature: mover los archivos txt a un nivel superior cat labels.txt mv labels.txt classes.txt ../. Feature: Quitar genomas repetidos rm GCF_900114615.1_IMG-taxon_2636416028_annotated_assembly_genomic.fna GCF_000271485.1_Pelosinus.strR7_v1.0_genomic.fna GCF_900100555.1_IMG-taxon_2642422525_annotated_assembly_genomic.fna GCF_000271665.1_Pelosinus.strJWB45_v1.0_genomic.fna Feature: Generar liga simbolica dentro de la carpeta de pyani_input del genoma a comparar ln -s /Datos/cursoMet/cursos/bins_final/bin.3.fa Pelosinus_MAG.fa Feature: Verificar que la liga simbolica esta activa ls -l cd .. Feature: Modificar el archivo de labels para quitar genomas repetidos y genomas que no se pudieron bajar nano labels.txt Feature: Agregar Pelosinus_MAG Pelosinus MAG Feature: Borrar las lineas de los genomas repetidos # GCF_900114615.1_IMG-taxon_2636416028_annotated_assembly_genomic # GCF_000271485.1_Pelosinus.strR7_v1.0_genomic # GCF_900100555.1_IMG-taxon_2642422525_annotated_assembly_genomic # GCF_000271665.1_Pelosinus.strJWB45_v1.0_genomic

4.2.3 Correr pyani

Feature: usar el script average_nucleotide_identity.py average_nucleotide_identity.py -h nohup average_nucleotide_identity.py -v -i pyani_input/ -o pyani_output/ -g --gformat png --labels labels.txt & Feature: Examinar los archivos de salida cd pyani_output Feature: borrar nucmer_output.tar.gz rm nucmer_output.tar.gz Feature: Copiar archivos de salida a su computadora # comando en mi computadora scp -r ebioinfoXX@200.23.162.231:/home/egodoy/curso_2022/comparative_genomics/pyani/pyani_output/ .

4.3 Pangenomas

Feature: Preparar ambiente de trabajo cd ../.. mkdir proteinOrtho cd proteinOrtho

4.3.1 Obtencion de referencias

Feature: Generar ligas simbolicas de los proteomas # a240 ln -s /Datos/cursoMet/cursos/genomas/*.faa . #a231 ln -s /home/egodoy/database/genomas/*.faa . # Verificar ls -l

4.3.2 Correr ProteinOrtho

Feature: Ayuda de proteinortho5.pl /Datos/cursoMet/scripts/proteinortho_v5.16b/proteinortho5.pl -h Feature: Correr proteinortho5.pl nohup /Datos/cursoMet/scripts/proteinortho_v5.16b/proteinortho5.pl -project=Pelosinus -cpus=4 -verbose -step=0 -dups=2 -singles bin_3_Pelosinus.faa Pelosinus_fermentans_JBW45.faa Pelosinus_sp_Bkl1.faa &

4.3.3 Explorar salida de ProteinOrtho

Feature: Usar comando "head" y "cat" head Pelosinus.proteinortho head Pelosinus.proteinortho-graph cat Pelosinus.proteinortho-graph.summary

4.3.4 Generar cuentas de pangenoma

Feature: Contar genes de Core, Shell y Cloud wc -l Pelosinus.proteinortho # Core grep -c '^3' Pelosinus.proteinortho # Shell grep -c '^2' Pelosinus.proteinortho # Cloud grep -c '^1' Pelosinus.proteinortho ## Extraer genes de Core, Shell y Cloud # Core grep '^3' Pelosinus.proteinortho > core.tab # Shell grep '^2' Pelosinus.proteinortho > shell.tab # Cloud grep '^1' Pelosinus.proteinortho > cloud.tab ### Explorar archivos less core.tab less shell.tab less cloud.tab ### Extraer genes que solo tienen nuestro genoma cut -f4 cloud.tab| grep -v '*' > cloud_Pelosinus_fermentas_GOM.tab # Contar numero de genes wc -l cloud_Pelosinus_fermentas_GOM.tab # Explorar archivo less cloud_Pelosinus_fermentas_GOM.tab

4.3.4 Generar diagrama de Venn

Feature: Usar script venn_diagram_Pelosinus.R conda activate R Rscript /Datos/cursoMet/scripts/venn_diagram_Pelosinus.R Pelosinus.proteinortho