--- title: 'Metagenómica funcional 2024. Tema 3' disqus: hackmd --- Metagenómica Funcional 2024 === Centro de Investigaciones Biológicas del Noroeste S.C. La Paz, Baja California Sur. Noviembre 2024 **Dra. E. Ernestina Godoy Lozano** | elizabeth.godoy@insp.mx | tinagodoy@gmail.com ## Tabla de Contenido [TOC] # Tema 3. Reconstrucción del perfil taxonómico ## 3.1. Preparación de espacio de trabajo ```gherkin= Feature: Generar directorio de trabajo cd curso_2024 mkdir assembly ``` ## 3.2. Reconstruccion de metagenoma ```gherkin=4 Feature: activar ambiente conda conda activate metawrap-env Feature: Generar ligas simbolicas de archivos limpios cd assembly ln -s ../quality_control/READ_QC/mock_reads/*.fastq . Feature: Generar ensamble # Opcion1: megahit nohup megahit -1 final_pure_reads_1.fastq -2 final_pure_reads_2.fastq -t 4 -o megahit_out & # Opcion2: Continuar con pipeline de metawrap nohup metawrap assembly -1 final_pure_reads_1.fastq -2 final_pure_reads_2.fastq -m 200 -t 4 --metaspades -o ASSEMBLY & nohup metawrap assembly -1 final_pure_reads_1.fastq -2 final_pure_reads_2.fastq -m 200 -t 4 --megahit -o ASSEMBLY & ``` ## 3.3. Anotacion taxonomica de secuencias crudas y de ensamble metagenomico ```gherkin=18 Feature: Generar espacio de trabajo cd ../taxonomy mkdir KRAKEN && cd KRAKEN Feature: Kraken2 con Secuencias crudas # Generar ligas simbolicas de archivos crudos ln -s ../../quality_control/READ_QC/mock_reads/*.fastq . nohup kraken2 --db /Datos/cursoMet/DBS/kraken2_Feb2021 --threads 4 --report reads.report --use-mpa-style --paired final_pure_reads_1.fastq final_pure_reads_2.fastq & Feature: Kraken2 con ensamble # Generar liga simbólica de ensamble ln -s ../../assembly/ASSEMBLY/final_assembly.fasta nohup kraken2 --db /Datos/cursoMet/DBS/kraken2_Feb2021 --threads 4 --report contigs.report --use-mpa-style final_assembly.fasta & Feature: Formateando las salidas para KronaTools cat reads.report | awk -F"\t" '{ print $2 "\t" $1}' | sed 's/d__//;s/|[pcofgs]__/\t/g' > kt_reads.report cat contigs.report | awk -F"\t" '{ print $2 "\t" $1}' | sed 's/d__//;s/|[pcofgs]__/\t/g' > kt_contigs.report Feature: Generando Kronas ktImportText -o mock_krona.html kt_contigs.report,mock_contigs kt_reads.report,mock_reads Feature: Metaphlan4 # Activar ambiente conda conda activate metaphlan4 cd .. mkdir METAPHLAN4 && cd METAPHLAN4 ln -s ../../quality_control/READ_QC/mock_reads/*.fastq . nohup metaphlan final_pure_reads_1.fastq,final_pure_reads_2.fastq --bowtie2out metagenome.bowtie2.bz2 --bowtie2db /Datos/cursoMet/DBS/metaphlan --nproc 4 --input_type fastq --unclassified_estimation -t rel_ab_w_read_stats --add_viruses -o profiled_metagenome.txt & Feature: Concatenar en una sola matriz todos los resultados de metaphlan4 # Esto es necesario realizarlo cuando tenemos más de una muestra # Pasos: # 1. Crear directorio y entrar al directorio # 2. Crear ligas simbolicas de los profiled_metagenome # 3. Aplicar script # merge_metaphlan_tables.py *.txt > merged_abundance_table_metaphlan2.txt ``` ## 3.4. Matrices de abundancia ```gherkin=59 Feature: Generar directorio de trabajo mkdir MATRIZ_ABUND && cd MATRIZ_ABUND mkdir data figures Feature: Generar liga simbolica de matriz de abundancia y metadata # Matriz de abundancias absolutas cd data ln -s /Datos/cursoMet/cursos/matriz_abund/metaphlan_onlyBacteria.txt . head metaphlan_onlyBacteria.txt # metadata ln -s /Datos/cursoMet/cursos/matriz_abund/metadata.tsv cat metadata.tsv ``` ### 3.4.1 Generar niveles taxonomicos ```gherkin=72 Feature: Generar niveles taxonomicos /Datos/cursoMet/scripts/taxa_levels_metaphlan.sh metaphlan_onlyBacteria.txt Feature: Explorar directorio taxa_levels ls taxa_levels Feature: Continuar con practica en R # Cargar ambiente de R cd .. conda activate R R ``` ### 3.4.2 Normalizacion por abundancias relativas ```gherkin=86 Feature: Normalización de la Matriz completa Rscript /Datos/cursoMet/scripts/abund_relativa.R data/metaphlan_onlyBacteria.txt data/percent_integrated_matrix.txt less -S data/percent_integrated_matrix.txt ``` ### 3.4.3 Abundancia relativa de niveles taxonomicos: ```gherkin=89 Feature: Escoger un nivel taxonómico # genero Rscript /Datos/cursoMet/scripts/abund_relativa.R taxa_levels/6.genus.txt taxa_levels/percent_Genus.txt less -S taxa_levels/percent_Genus.txt # clase Rscript /Datos/cursoMet/scripts/abund_relativa.R taxa_levels/3.class.txt taxa_levels/percent_Class.txt less -S taxa_levels/percent_Class.txt ``` ### 3.4.4 Generacion de barras apiladas con corte de abundancia ```gherkin=97 Feature: Corte de abundancia del 1% Rscript /Datos/cursoMet/scripts/sock_plots_corte.R taxa_levels/percent_Class.txt percent_Class_more_1_perc.txt 1 ``` ## 3.5. Alfa y Beta diversidad ```gherkin=99 Feature: La matriz de abundanncia tiene que ser abundancia absoluta Rscript /Datos/cursoMet/scripts/alpha_beta_diversity.R metadata.tsv taxa_levels/6.genus.txt Type Feature: Indices de alfa diversidad cat alpha_diversity_index.txt Feature: Ordenar las graficas mv *.png figures Feature: Bajar graficas a mi computadora scp -r ebioinfoXX@200.23.162.231:/home/ebioinfoXX/curso_2022/taxonomy/MATRIZ_ABUND/figures . ``` ## Enlaces :::info **Etherpad** Deja tu pregunta https://etherpad.wikimedia.org/p/metagenomica_funcional_2024 ::: ###### tags: `CIBNOR` `Metagenómica`