Centro de Investigaciones Biológicas del Noroeste S.C. La Paz, Baja California Sur.
Noviembre 2024
Dra. E. Ernestina Godoy Lozano | elizabeth.godoy@insp.mx | tinagodoy@gmail.com
Feature: Generar directorio de trabajo
cd curso_2024
mkdir comparative_genomics && cd comparative_genomics
mkdir pyani
Feature: Activar ambiente conda
conda activate new_env
Feature: Obtencion de referencias
cd pyani
genbank_get_genomes_by_taxon.py -h
# Instrucción para Bajar todos los genomas del genero "Pelosinus" que tiene el taxid (NCBI) 365348
# nohup genbank_get_genomes_by_taxon.py -o pyani_input -t 365348 -l Pelosinus_downloads.log --email elizabeth.godoy@insp.mx &
# Haremos una copia del directorio de pyani_input
cp -r /Datos/cursoMet/pyani_input/ .
cd pyani_input
Feature: Revisar los archivos log
less Pelosinus_downloads.log
tail Pelosinus_downloads.log
Feature: Quitar los genomas comprimidos
cd pyani_input
rm *.fna.gz
Feature: mover los archivos txt a un nivel superior
cat labels.txt
mv labels.txt classes.txt ../.
Feature: Quitar genomas repetidos
rm GCF_900114615.1_IMG-taxon_2636416028_annotated_assembly_genomic.fna GCF_000271485.1_Pelosinus.strR7_v1.0_genomic.fna GCF_900100555.1_IMG-taxon_2642422525_annotated_assembly_genomic.fna GCF_000271665.1_Pelosinus.strJWB45_v1.0_genomic.fna
Feature: Generar liga simbolica dentro de la carpeta de pyani_input del genoma a comparar
ln -s /Datos/cursoMet/cursos/bins_final/bin.3.fa Pelosinus_MAG.fa
Feature: Verificar que la liga simbolica esta activa
ls -l
cd ..
Feature: Modificar el archivo de labels para quitar genomas repetidos y genomas que no se pudieron bajar
nano labels.txt
Feature: Agregar
Pelosinus_MAG Pelosinus MAG
Feature: Borrar las lineas de los genomas repetidos
# GCF_900114615.1_IMG-taxon_2636416028_annotated_assembly_genomic
# GCF_000271485.1_Pelosinus.strR7_v1.0_genomic
# GCF_900100555.1_IMG-taxon_2642422525_annotated_assembly_genomic
# GCF_000271665.1_Pelosinus.strJWB45_v1.0_genomic
Feature: usar el script average_nucleotide_identity.py
average_nucleotide_identity.py -h
nohup average_nucleotide_identity.py -v -i pyani_input/ -o pyani_output/ -g --gformat png --labels labels.txt &
Feature: Examinar los archivos de salida
cd pyani_output
Feature: borrar nucmer_output.tar.gz
rm nucmer_output.tar.gz
Feature: Copiar archivos de salida a su computadora
# comando en mi computadora
scp -r ebioinfoXX@200.23.162.231:/home/egodoy/curso_2022/comparative_genomics/pyani/pyani_output/ .
Feature: Preparar ambiente de trabajo
cd ../..
mkdir proteinOrtho
cd proteinOrtho
Feature: Generar ligas simbolicas de los proteomas
# a240
ln -s /Datos/cursoMet/cursos/genomas/*.faa .
#a231
ln -s /home/egodoy/database/genomas/*.faa .
# Verificar
ls -l
Feature: Ayuda de proteinortho5.pl
/Datos/cursoMet/scripts/proteinortho_v5.16b/proteinortho5.pl -h
Feature: Correr proteinortho5.pl
nohup /Datos/cursoMet/scripts/proteinortho_v5.16b/proteinortho5.pl -project=Pelosinus -cpus=4 -verbose -step=0 -dups=2 -singles bin_3_Pelosinus.faa Pelosinus_fermentans_JBW45.faa Pelosinus_sp_Bkl1.faa &
Feature: Usar comando "head" y "cat"
head Pelosinus.proteinortho
head Pelosinus.proteinortho-graph
cat Pelosinus.proteinortho-graph.summary
Feature: Contar genes de Core, Shell y Cloud
wc -l Pelosinus.proteinortho
# Core
grep -c '^3' Pelosinus.proteinortho
# Shell
grep -c '^2' Pelosinus.proteinortho
# Cloud
grep -c '^1' Pelosinus.proteinortho
## Extraer genes de Core, Shell y Cloud
# Core
grep '^3' Pelosinus.proteinortho > core.tab
# Shell
grep '^2' Pelosinus.proteinortho > shell.tab
# Cloud
grep '^1' Pelosinus.proteinortho > cloud.tab
### Explorar archivos
less core.tab
less shell.tab
less cloud.tab
### Extraer genes que solo tienen nuestro genoma
cut -f4 cloud.tab| grep -v '*' > cloud_Pelosinus_fermentas_GOM.tab
# Contar numero de genes
wc -l cloud_Pelosinus_fermentas_GOM.tab
# Explorar archivo
less cloud_Pelosinus_fermentas_GOM.tab
Feature: Usar script venn_diagram_Pelosinus.R
conda activate R
Rscript /Datos/cursoMet/scripts/venn_diagram_Pelosinus.R Pelosinus.proteinortho
downloadsbuildchat
Dec 3, 2024downloadsbuildchat
Nov 19, 2024Centro de Investigaciones Biológicas del Noroeste S.C. La Paz, Baja California Sur.Noviembre 2024
Nov 19, 2024downloadsbuildchat
Nov 13, 2024or
By clicking below, you agree to our terms of service.
New to HackMD? Sign up