Try   HackMD

Metagenómica Funcional 2024

Centro de Investigaciones Biológicas del Noroeste S.C. La Paz, Baja California Sur.
Noviembre 2024

Dra. E. Ernestina Godoy Lozano | elizabeth.godoy@insp.mx | tinagodoy@gmail.com

Tabla de Contenido

Tema 3. Reconstrucción del perfil taxonómico

3.1. Preparación de espacio de trabajo

Feature: Generar directorio de trabajo cd curso_2024 mkdir assembly

3.2. Reconstruccion de metagenoma

Feature: activar ambiente conda conda activate metawrap-env Feature: Generar ligas simbolicas de archivos limpios cd assembly ln -s ../quality_control/READ_QC/mock_reads/*.fastq . Feature: Generar ensamble # Opcion1: megahit nohup megahit -1 final_pure_reads_1.fastq -2 final_pure_reads_2.fastq -t 4 -o megahit_out & # Opcion2: Continuar con pipeline de metawrap nohup metawrap assembly -1 final_pure_reads_1.fastq -2 final_pure_reads_2.fastq -m 200 -t 4 --metaspades -o ASSEMBLY & nohup metawrap assembly -1 final_pure_reads_1.fastq -2 final_pure_reads_2.fastq -m 200 -t 4 --megahit -o ASSEMBLY &

3.3. Anotacion taxonomica de secuencias crudas y de ensamble metagenomico

Feature: Generar espacio de trabajo cd ../taxonomy mkdir KRAKEN && cd KRAKEN Feature: Kraken2 con Secuencias crudas # Generar ligas simbolicas de archivos crudos ln -s ../../quality_control/READ_QC/mock_reads/*.fastq . nohup kraken2 --db /Datos/cursoMet/DBS/kraken2_Feb2021 --threads 4 --report reads.report --use-mpa-style --paired final_pure_reads_1.fastq final_pure_reads_2.fastq & Feature: Kraken2 con ensamble # Generar liga simbólica de ensamble ln -s ../../assembly/ASSEMBLY/final_assembly.fasta nohup kraken2 --db /Datos/cursoMet/DBS/kraken2_Feb2021 --threads 4 --report contigs.report --use-mpa-style final_assembly.fasta & Feature: Formateando las salidas para KronaTools cat reads.report | awk -F"\t" '{ print $2 "\t" $1}' | sed 's/d__//;s/|[pcofgs]__/\t/g' > kt_reads.report cat contigs.report | awk -F"\t" '{ print $2 "\t" $1}' | sed 's/d__//;s/|[pcofgs]__/\t/g' > kt_contigs.report Feature: Generando Kronas ktImportText -o mock_krona.html kt_contigs.report,mock_contigs kt_reads.report,mock_reads Feature: Metaphlan4 # Activar ambiente conda conda activate metaphlan4 cd .. mkdir METAPHLAN4 && cd METAPHLAN4 ln -s ../../quality_control/READ_QC/mock_reads/*.fastq . nohup metaphlan final_pure_reads_1.fastq,final_pure_reads_2.fastq --bowtie2out metagenome.bowtie2.bz2 --bowtie2db /Datos/cursoMet/DBS/metaphlan --nproc 4 --input_type fastq --unclassified_estimation -t rel_ab_w_read_stats --add_viruses -o profiled_metagenome.txt & Feature: Concatenar en una sola matriz todos los resultados de metaphlan4 # Esto es necesario realizarlo cuando tenemos más de una muestra # Pasos: # 1. Crear directorio y entrar al directorio # 2. Crear ligas simbolicas de los profiled_metagenome # 3. Aplicar script # merge_metaphlan_tables.py *.txt > merged_abundance_table_metaphlan2.txt

3.4. Matrices de abundancia

Feature: Generar directorio de trabajo mkdir MATRIZ_ABUND && cd MATRIZ_ABUND mkdir data figures Feature: Generar liga simbolica de matriz de abundancia y metadata # Matriz de abundancias absolutas cd data ln -s /Datos/cursoMet/cursos/matriz_abund/metaphlan_onlyBacteria.txt . head metaphlan_onlyBacteria.txt # metadata ln -s /Datos/cursoMet/cursos/matriz_abund/metadata.tsv cat metadata.tsv

3.4.1 Generar niveles taxonomicos

Feature: Generar niveles taxonomicos /Datos/cursoMet/scripts/taxa_levels_metaphlan.sh metaphlan_onlyBacteria.txt Feature: Explorar directorio taxa_levels ls taxa_levels Feature: Continuar con practica en R # Cargar ambiente de R cd .. conda activate R R

3.4.2 Normalizacion por abundancias relativas

Feature: Normalización de la Matriz completa Rscript /Datos/cursoMet/scripts/abund_relativa.R data/metaphlan_onlyBacteria.txt data/percent_integrated_matrix.txt less -S data/percent_integrated_matrix.txt

3.4.3 Abundancia relativa de niveles taxonomicos:

Feature: Escoger un nivel taxonómico # genero Rscript /Datos/cursoMet/scripts/abund_relativa.R taxa_levels/6.genus.txt taxa_levels/percent_Genus.txt less -S taxa_levels/percent_Genus.txt # clase Rscript /Datos/cursoMet/scripts/abund_relativa.R taxa_levels/3.class.txt taxa_levels/percent_Class.txt less -S taxa_levels/percent_Class.txt

3.4.4 Generacion de barras apiladas con corte de abundancia

Feature: Corte de abundancia del 1% Rscript /Datos/cursoMet/scripts/sock_plots_corte.R taxa_levels/percent_Class.txt percent_Class_more_1_perc.txt 1

3.5. Alfa y Beta diversidad

Feature: La matriz de abundanncia tiene que ser abundancia absoluta Rscript /Datos/cursoMet/scripts/alpha_beta_diversity.R metadata.tsv taxa_levels/6.genus.txt Type Feature: Indices de alfa diversidad cat alpha_diversity_index.txt Feature: Ordenar las graficas mv *.png figures Feature: Bajar graficas a mi computadora scp -r ebioinfoXX@200.23.162.231:/home/ebioinfoXX/curso_2022/taxonomy/MATRIZ_ABUND/figures .

Enlaces

tags: CIBNOR Metagenómica