Centro de Investigaciones Biológicas del Noroeste S.C. La Paz, Baja California Sur.
Noviembre 2024
Dra. E. Ernestina Godoy Lozano | elizabeth.godoy@insp.mx | tinagodoy@gmail.com
Feature: Generar directorio de trabajo
cd curso_2024
mkdir assembly
Feature: activar ambiente conda
conda activate metawrap-env
Feature: Generar ligas simbolicas de archivos limpios
cd assembly
ln -s ../quality_control/READ_QC/mock_reads/*.fastq .
Feature: Generar ensamble
# Opcion1: megahit
nohup megahit -1 final_pure_reads_1.fastq -2 final_pure_reads_2.fastq -t 4 -o megahit_out &
# Opcion2: Continuar con pipeline de metawrap
nohup metawrap assembly -1 final_pure_reads_1.fastq -2 final_pure_reads_2.fastq -m 200 -t 4 --metaspades -o ASSEMBLY &
nohup metawrap assembly -1 final_pure_reads_1.fastq -2 final_pure_reads_2.fastq -m 200 -t 4 --megahit -o ASSEMBLY &
Feature: Generar espacio de trabajo
cd ../taxonomy
mkdir KRAKEN && cd KRAKEN
Feature: Kraken2 con Secuencias crudas
# Generar ligas simbolicas de archivos crudos
ln -s ../../quality_control/READ_QC/mock_reads/*.fastq .
nohup kraken2 --db /Datos/cursoMet/DBS/kraken2_Feb2021 --threads 4 --report reads.report --use-mpa-style --paired final_pure_reads_1.fastq final_pure_reads_2.fastq &
Feature: Kraken2 con ensamble
# Generar liga simbólica de ensamble
ln -s ../../assembly/ASSEMBLY/final_assembly.fasta
nohup kraken2 --db /Datos/cursoMet/DBS/kraken2_Feb2021 --threads 4 --report contigs.report --use-mpa-style final_assembly.fasta &
Feature: Formateando las salidas para KronaTools
cat reads.report | awk -F"\t" '{ print $2 "\t" $1}' | sed 's/d__//;s/|[pcofgs]__/\t/g' > kt_reads.report
cat contigs.report | awk -F"\t" '{ print $2 "\t" $1}' | sed 's/d__//;s/|[pcofgs]__/\t/g' > kt_contigs.report
Feature: Generando Kronas
ktImportText -o mock_krona.html kt_contigs.report,mock_contigs kt_reads.report,mock_reads
Feature: Metaphlan4
# Activar ambiente conda
conda activate metaphlan4
cd ..
mkdir METAPHLAN4 && cd METAPHLAN4
ln -s ../../quality_control/READ_QC/mock_reads/*.fastq .
nohup metaphlan final_pure_reads_1.fastq,final_pure_reads_2.fastq --bowtie2out metagenome.bowtie2.bz2 --bowtie2db /Datos/cursoMet/DBS/metaphlan --nproc 4 --input_type fastq --unclassified_estimation -t rel_ab_w_read_stats --add_viruses -o profiled_metagenome.txt &
Feature: Concatenar en una sola matriz todos los resultados de metaphlan4
# Esto es necesario realizarlo cuando tenemos más de una muestra
# Pasos:
# 1. Crear directorio y entrar al directorio
# 2. Crear ligas simbolicas de los profiled_metagenome
# 3. Aplicar script
# merge_metaphlan_tables.py *.txt > merged_abundance_table_metaphlan2.txt
Feature: Generar directorio de trabajo
mkdir MATRIZ_ABUND && cd MATRIZ_ABUND
mkdir data figures
Feature: Generar liga simbolica de matriz de abundancia y metadata
# Matriz de abundancias absolutas
cd data
ln -s /Datos/cursoMet/cursos/matriz_abund/metaphlan_onlyBacteria.txt .
head metaphlan_onlyBacteria.txt
# metadata
ln -s /Datos/cursoMet/cursos/matriz_abund/metadata.tsv
cat metadata.tsv
Feature: Generar niveles taxonomicos
/Datos/cursoMet/scripts/taxa_levels_metaphlan.sh metaphlan_onlyBacteria.txt
Feature: Explorar directorio taxa_levels
ls taxa_levels
Feature: Continuar con practica en R
# Cargar ambiente de R
cd ..
conda activate R
R
Feature: Normalización de la Matriz completa
Rscript /Datos/cursoMet/scripts/abund_relativa.R data/metaphlan_onlyBacteria.txt data/percent_integrated_matrix.txt
less -S data/percent_integrated_matrix.txt
Feature: Escoger un nivel taxonómico
# genero
Rscript /Datos/cursoMet/scripts/abund_relativa.R taxa_levels/6.genus.txt taxa_levels/percent_Genus.txt
less -S taxa_levels/percent_Genus.txt
# clase
Rscript /Datos/cursoMet/scripts/abund_relativa.R taxa_levels/3.class.txt taxa_levels/percent_Class.txt
less -S taxa_levels/percent_Class.txt
Feature: Corte de abundancia del 1%
Rscript /Datos/cursoMet/scripts/sock_plots_corte.R taxa_levels/percent_Class.txt percent_Class_more_1_perc.txt 1
Feature: La matriz de abundanncia tiene que ser abundancia absoluta
Rscript /Datos/cursoMet/scripts/alpha_beta_diversity.R metadata.tsv taxa_levels/6.genus.txt Type
Feature: Indices de alfa diversidad
cat alpha_diversity_index.txt
Feature: Ordenar las graficas
mv *.png figures
Feature: Bajar graficas a mi computadora
scp -r ebioinfoXX@200.23.162.231:/home/ebioinfoXX/curso_2022/taxonomy/MATRIZ_ABUND/figures .
Etherpad Deja tu pregunta
https://etherpad.wikimedia.org/p/metagenomica_funcional_2024
CIBNOR
Metagenómica