--- title: 'Metagenómica funcional 2025. Tema 3' disqus: hackmd --- Metagenómica Funcional 2025 === Centro de Investigaciones Biológicas del Noroeste S.C. La Paz, Baja California Sur. Noviembre 2025 **Dra. E. Ernestina Godoy Lozano** | elizabeth.godoy@insp.mx | tinagodoy@gmail.com ## Tabla de Contenido [TOC] # Tema 3. Reconstrucción del perfil taxonómico ## 3.1. Preparación de espacio de trabajo ```gherkin= Feature: Generar directorio de trabajo cd curso_2025 mkdir assembly ``` ## 3.2. Reconstruccion de metagenoma ```gherkin=4 Feature: activar ambiente conda source /opt/anaconda3/bin/activate conda activate metawrap-env Feature: Generar ligas simbolicas de archivos limpios cd assembly ln -s ../quality_control/READ_QC/mock_reads/*.fastq . Feature: Generar ensamble # Opcion1: Continuar con pipeline de metawrap # Usando metaspades #nohup metawrap assembly -1 final_pure_reads_1.fastq \ #-2 final_pure_reads_2.fastq -m 200 -t 4 \ #--metaspades -o ASSEMBLY & # Usando megahit (~37 min) #nohup metawrap assembly -1 final_pure_reads_1.fastq \ #-2 final_pure_reads_2.fastq -m 200 -t 4 \ #--megahit -o ASSEMBLY-M & # Opcion2: megahit (~37 min) #nohup megahit -1 final_pure_reads_1.fastq -2 final_pure_reads_2.fastq \ #-t 4 -o megahit_out & Feature: Copiar ensamble del usuario egodoy cd ASSEMBLY cp -r /home/egodoy/curso_2025/assembly/ASSEMBLY/final_assembly.fasta . cp -r /home/egodoy/curso_2025/assembly/ASSEMBLY/final_assembly.fasta . ``` ## 3.3. Anotacion taxonomica de secuencias crudas y de ensamble metagenomico ```gherkin=27 Feature: Generar espacio de trabajo cd ../taxonomy mkdir KRAKEN && cd KRAKEN Feature: Kraken2 con Secuencias crudas # Generar ligas simbolicas de archivos crudos #ln -s ../../quality_control/READ_QC/mock_reads/*.fastq . #nohup kraken2 --db /Datos/DrRick/databases/kraken2/kraken2_plusPF \ #--threads 4 --report reads.report --use-mpa-style \ #--paired final_pure_reads_1.fastq final_pure_reads_2.fastq & Feature: Kraken2 con ensamble # Generar liga simbólica de ensamble #ln -s ../../assembly/ASSEMBLY/final_assembly.fasta #nohup kraken2 --db /Datos/DrRick/databases/kraken2/kraken2_plusPF \ #--threads 4 --report contigs.report --use-mpa-style \ #final_assembly.fasta & Feature: Copiar resultados de Kraken2 cp -r /Datos/curso_metagenomica/curso_2025/taxonomy/KRAKEN/contigs.report . cp -r /Datos/curso_metagenomica/curso_2025/taxonomy/KRAKEN/reads.report . Feature: Formateando las salidas para KronaTools cat reads.report | awk -F"\t" '{ print $2 "\t" $1}' | sed 's/[dk]__//;s/|[pcofgs]__/\t/g' > kt_reads.report cat contigs.report | awk -F"\t" '{ print $2 "\t" $1}' | sed 's/[dk]__//;s/|[pcofgs]__/\t/g' > kt_contigs.report Feature: Generando Kronas # Asegurate de estar en el ambiente conda metawrap-env ktImportText -o mock_krona.html kt_contigs.report,mock_contigs kt_reads.report,mock_reads Feature: Bajar krona a mi computadora scp -r ebioinfoXX@200.23.162.231:/home/ebioinfoXX/curso_2025/taxonomy/KRAKEN/*.html . Feature: Metaphlan4 # Activar ambiente conda conda activate metaplhan4 cd .. mkdir METAPHLAN4 && cd METAPHLAN4 ln -s ../../quality_control/READ_QC/mock_reads/*.fastq . #nohup metaphlan final_pure_reads_1.fastq,final_pure_reads_2.fastq \ # --input_type fastq \ # --nproc 4 \ # --db_dir /Datos/DrRick/databases/metaplhan4 \ # -x mpa_vJan25_CHOCOPhlAnSGB_202503 \ # --mapout metagenome.bowtie2.bz2 \ # -t rel_ab_w_read_stats \ # -o profiled_metagenome.txt & Feature: Copiar resultados de Metaphlan4 cp -r /Datos/curso_metagenomica/curso_2025/taxonomy/METAPHLAN4/* . Feature: Concatenar en una sola matriz todos los resultados de metaphlan4 # Esto es necesario realizarlo cuando tenemos más de una muestra # Pasos: # 1. Crear directorio y entrar al directorio # 2. Crear ligas simbolicas de los profiled_metagenome # 3. Aplicar script # merge_metaphlan_tables.py *.txt > merged_abundance_table_metaphlan2.txt ``` ## 3.4. Matrices de abundancia ```gherkin=78 Feature: Generar directorio de trabajo mkdir MATRIZ_ABUND && cd MATRIZ_ABUND mkdir data figures Feature: Generar liga simbolica de matriz de abundancia y metadata # Matriz de abundancias absolutas cd data ln -s /Datos/curso_metagenomica/matriz_abund/metaphlan_onlyBacteria.txt . head metaphlan_onlyBacteria.txt # metadata ln -s /Datos/curso_metagenomica/matriz_abund/metadata.tsv cat metadata.tsv ``` ### 3.4.1 Generar niveles taxonomicos ```gherkin=91 Feature: Generar niveles taxonomicos /Datos/curso_metagenomica/scripts/taxa_levels_metaphlan.sh metaphlan_onlyBacteria.txt Feature: Explorar directorio taxa_levels ls taxa_levels Feature: Continuar con practica en R # Preparar el Rproject cd .. # Aseguremos que estamos en el directorio MATRIZ_ABUND pwd cp -r /Datos/curso_metagenomica/taxonomy_diversity . ``` ### 3.4.2 Conexión a Rserver ```gherkin=103 Feature: Paso 1. Abrir otra terminal ssh -L 8787:localhost:8787 ebioinfoXX@200.23.162.231 ``` Colocar ***usuario*** y ***contraseña*** del servidor ```gherkin=105 Feature: Paso 2. Abrir un navegador de internet http://200.23.162.231:8787/ ``` Colocar ***usuario*** y ***contraseña*** del servidor  Te aparecera el Rserver si entraste de manera correcta  ### 3.4.3 Normalizacion por abundancias relativas ```gherkin=107 Feature: Normalización de la Matriz completa # Opción 2. Hacerlo con el Rscript Rscript /Datos/curso_metagenomica/scripts/abund_relativa_args.R data/metaphlan_onlyBacteria.txt data/percent_integrated_matrix.txt less -S data/percent_integrated_matrix.txt ``` ### 3.4.4 Abundancia relativa de niveles taxonomicos: ```gherkin=111 Feature: Escoger un nivel taxonómico # Opción 2. Hacerlo con el Rscript # genero Rscript /Datos/curso_metagenomica/scripts/abund_relativa_args.R taxa_levels/6.genus.txt taxa_levels/percent_Genus.txt less -S taxa_levels/percent_Genus.txt # clase Rscript /Datos/curso_metagenomica/scripts/abund_relativa_args.R taxa_levels/3.class.txt taxa_levels/percent_Class.txt less -S taxa_levels/percent_Class.txt ``` ### 3.4.5 Generacion de barras apiladas con corte de abundancia ```gherkin=120 Feature: Corte de abundancia del 1% # Opción 2. Hacerlo con el Rscript Rscript /Datos/curso_metagenomica/scripts/sock_plots_corte.R taxa_levels/percent_Class.txt percent_Class_more_1_perc.txt 1 ``` ## 3.6. Alfa y Beta diversidad ```gherkin=123 Feature: La matriz de abundanncia tiene que ser abundancia absoluta # Opción1. Hacerlo con el Rscript Rscript /Datos/curso_metagenomica/scripts/alpha_beta_diversity_args.R metadata.tsv taxa_levels/6.genus.txt Type Feature: Indices de alfa diversidad cat alpha_diversity_index.txt Feature: Ordenar las graficas mv *.png ../figures Feature: Bajar graficas a mi computadora scp -r ebioinfoXX@200.23.162.231:/home/ebioinfoXX/curso_2025/taxonomy/MATRIZ_ABUND/figures . ``` ## Enlaces :::info **Etherpad** Deja tu pregunta https://etherpad.wikimedia.org/p/metagenomica_funcional_2025 **MetaPhlan4** https://github.com/biobakery/MetaPhlAn/wiki/MetaPhlAn-4.1 **Kraken2** https://benlangmead.github.io/aws-indexes/k2 ::: ###### tags: `CIBNOR` `Metagenómica` `2025`
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up