Análisis de secuencias de amplicones del gen rRNA 16S con QIIME2

Dra. E. Ernestina Godoy Lozano
elizabeth.godoy@insp.mx
tinagodoy@gmail.com

Temario

Crear espacio de trabajo

Ejercicio 1. Conectarnos al servidor

ssh -X alumnoX@132.248.32.180

Ejercicio 2: Crear mi espacio de trabajo

Ir a mi home

cd

Crear directorio de trabajo

mkdir EMetagen cd EMetagen mkdir qiime2

Explorar los datos que usaremos

Ejercicio 3: Listado de archivos

Manifiesto y Metadatos

ls /Share/EMetagen/data cat /Share/EMetagen/data/metadata.tsv cat /Share/EMetagen/data/manifiesto.csv

Secuencias crudas

ls /Share/EMetagen/raw_data head /Share/EMetagen/raw_data/Cru1_S1_SED_R1.fastq

Contar secuencias crudas

grep -c '^+' /Share/EMetagen/raw_data/*.fastq

Base de datos

ls /Share/EMetagen/database

Activar ambiente conda QIIME2

Ejercicio 4: Ambiente conda de QIIME2

export LC_ALL=C.UTF-8 export LANG=C.UTF-8 conda activate qiime2-2021.8

Ejercicio 5: Visualizar los plugins instalados

qiime --help

Ejercicio 6: Visualizar la ayuda de un plugin

qiime taxa --help

Visualizar la ayuda de un comando en especifico del plugin

qiime taxa barplot --help

Análisis de amplicones de rRNA 16S

Ejercicio 7: Convertir archivo de metadata a qzv

Tiempo aprox 5 a 10 seg

# Acceder al directorio qiime2 cd qiime2 qiime metadata tabulate \ --m-input-file /Share/EMetagen/data/metadata.tsv \ --o-visualization 1.metadata.qzv

Ejercicio 8: Visualizar el archivo metadata.qzv

Opcion1. A través de qiime tools view

# qiime tools view 1.metadata.qzv

Opcion2. Descargando el archivo a mi computadora por medio del comando scp

  1. Dentro de mi computadora, abrir otra pestaña de la consola.
  2. Cambiar de directorio a donde quiero descargar los resultados.
  3. Descargar archivo por medio del comando de copia de segurida scp.
scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/1.metadata.qzv .
  1. En mi navegador ir a la pagina web https://view.qiime2.org/
  2. Abrir el archivo. Podemos arrastrarlo.
  3. Visualizar archivo.

Ejercicio 9: Importar mis datos a QIIME2

Tiempo aprox 30 a 40 seg

qiime tools import \ --type SampleData[PairedEndSequencesWithQuality] \ --input-format PairedEndFastqManifestPhred33 \ --input-path /Share/EMetagen/data/manifiesto.csv \ --output-path 2.demux.qza

Ejercicio 10: Generar la visualización de mis datos

qiime demux summarize \ --i-data 2.demux.qza \ --o-visualization 2.demux.qzv

Descargar el archivo para observarlo en https://view.qiime2.org/

scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/2.demux.qzv .

Ejercicio 11: Eliminación de errores (denoising) y la clusterización con DADA2

Tiempo aprox 60 a 70 seg

qiime dada2 denoise-paired \ --i-demultiplexed-seqs 2.demux.qza \ --p-trunc-len-f 295 \ --p-trunc-len-r 240 \ --o-table 3.table.qza \ --o-representative-sequences 3.rep-seqs.qza \ --o-denoising-stats 3.denoising-stats.qza

Generamos el archivo para visualización

Tiempo aprox 8 a 10 seg

qiime metadata tabulate \ --m-input-file 3.denoising-stats.qza \ --o-visualization 3.denoising-stats.qzv

Descargar el archivo para observarlo en https://view.qiime2.org/

scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/3.denoising-stats.qzv .

Ejercicio 12: Generar visalización de las secuencias representativas (FeatureData)

Tiempo aprox 40 a 45 seg

qiime feature-table tabulate-seqs \ --i-data 3.rep-seqs.qza \ --o-visualization 4.rep-seqs.qzv

Exportando las secuencias representativas en formato fasta

Tiempo aprox 8 a 10 seg

qiime tools export \ --input-path 3.rep-seqs.qza \ --output-path 4.RepSeqFasta

Descargar el archivo para observarlo en https://view.qiime2.org/

scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/4.rep-seqs.qzv .

Ejercicio 13: Generar la tabla de abundancias absolutas (FeatureTable)

Tiempo aprox 40 a 45 seg

qiime feature-table summarize \ --i-table 3.table.qza \ --o-visualization 3.table.qzv \ --m-sample-metadata-file /Share/EMetagen/data/metadata.tsv

Descargar el archivo para observarlo en https://view.qiime2.org/

scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/3.table.qzv .

Ejercicio 14: Asignacion taxonómica usando BLAST+

Tiempo aprox 8 a 10 min
NOTA: No lo correremos porque el servidor se satura

#qiime feature-classifier classify-consensus-blast \ #--i-query 3.rep-seqs.qza \ #--i-reference-reads /Share/EMetagen/database/silva_132_99_16S.qza \ #--i-reference-taxonomy /Share/EMetagen/database/majority_taxonomy_7_levels.qza \ #--o-classification 5.taxonomy_blast.qza

Copiar la anotación taxonómica

cp /home/tina/EMetagen/qiime2/5.taxonomy_blast.qza .

Generamos el archivo para visualización

Tiempo aprox 8 a 10 seg

qiime metadata tabulate \ --m-input-file 5.taxonomy_blast.qza \ --o-visualization 6.taxonomy_blast.qzv

Descargar el archivo para observarlo en https://view.qiime2.org/

scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/6.taxonomy_blast.qzv .

Generamos un archivo de gráficas apiladas (barplots)

Tiempo aprox 5 a 8 seg

qiime taxa barplot \ --i-table 3.table.qza \ --i-taxonomy 5.taxonomy_blast.qza \ --m-metadata-file /Share/EMetagen/data/metadata.tsv \ --o-visualization 7.taxa-bar-plots_blast.qzv

Descargar el archivo para observarlo en https://view.qiime2.org/

scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/taxa-bar-plots_blast.qzv .

Ejercicio 15: FeatureTable a formato BIOM

Tiempo aprox 8 a 10 seg

Formato BIOM

qiime tools export \ --input-path 3.table.qza \ --output-path 8.taxa_levels

Explorar el directorio de 8.taxa_levels

ls 8.taxa_levels/

Exportar el archivo de taxonomía a archivo tabular

Tiempo aprox 5 a 8 seg

qiime tools export \ --input-path 5.taxonomy_blast.qza \ --output-path 8.taxa_levels

Explorar el directorio de 8.taxa_levels

ls 8.taxa_levels/

Agregando la información de la asignación taxonómica a la tabla con formato BIOM

Tiempo aprox 5 a 8 seg

biom add-metadata \ -i ./8.taxa_levels/feature-table.biom \ -o ./8.taxa_levels/tableConTax.biom \ --observation-metadata-fp ./8.taxa_levels/taxonomy.tsv \ --observation-header OTUID,taxonomy \ --sc-separated taxonomy

Explorar el directorio de 8.taxa_levels

ls 8.taxa_levels/

Convertir el archivo BIOM a un archivo de texto tabular

Tiempo aprox 5 a 8 seg

biom convert \ -i ./8.taxa_levels/tableConTax.biom \ -o ./8.taxa_levels/TablaFinal.txt \ --to-tsv \ --header-key taxonomy

Explorar el directorio de 8.taxa_levels

ls 8.taxa_levels/

Explorar la TablaFinal.txt

less -S 8.taxa_levels/TablaFinal.txt

Ejercicio 16: Reconstrucción filogenética para los análisis de diversidad

Tiempo aprox 8 a 10 seg

qiime phylogeny align-to-tree-mafft-fasttree \ --i-sequences 3.rep-seqs.qza \ --o-alignment 9.aligned-rep-seqs.qza \ --o-masked-alignment 9.masked-aligned-rep-seqs.qza \ --o-tree 9.unrooted-tree.qza \ --o-rooted-tree 9.rooted-tree.qza

Descargas

  1. Descargar el archivo del árbol para observarlo en iTOL (https://itol.embl.de/)
  2. Es necesario descargar el archivo 5.taxonomy_blast.qza para cambiar las anotaciones en itol
# Árboles scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/*rooted-tree.qza . # Taxonomía scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/5.taxonomy_blast.qza .

Ejercicio 17: Gráficas de rarefacción

Tiempo aprox 40 a 50 seg

qiime diversity alpha-rarefaction \ --i-table 3.table.qza \ --i-phylogeny 9.rooted-tree.qza \ --p-max-depth 60 \ --m-metadata-file /Share/EMetagen/data/metadata.tsv \ --o-visualization 10.alpha-rarefaction.qzv

Descargar el archivo para observarlo en https://view.qiime2.org/

scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/10.alpha-rarefaction.qzv .

Ejercicio 18: Métricas de alfa y beta diversidad

Tiempo aprox 8 a 10 seg

qiime diversity core-metrics-phylogenetic \ --i-phylogeny 9.rooted-tree.qza \ --i-table 3.table.qza \ --p-sampling-depth 60 \ --m-metadata-file /Share/EMetagen/data/metadata.tsv \ --output-dir 11.core_metrics_results

Descargas

  1. Descargar los archivos .qzv para observarlos en https://view.qiime2.org/
  2. En mi computadora personal crear un directorio y entrar a el para comenzar la descarga
mkdir 11.core_metrics_results cd 11.core_metrics_results scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/11.core_metrics_results/*.qzv .

Alfa diversidad

Explorar el índice de Shannon

Tiempo aprox 5 a 8 seg

qiime diversity alpha-group-significance \ --i-alpha-diversity 11.core_metrics_results/shannon_vector.qza \ --m-metadata-file /Share/EMetagen/data/metadata.tsv \ --o-visualization 11.core_metrics_results/shannon-group-significance.qzv

Descargar el archivo para observarlo en https://view.qiime2.org/

scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/11.core_metrics_results/shannon-group-significance.qzv .

Beta diversidad

Explorar las distancias por el metodo "unweighted unifrac" por la variable "Type"

Tiempo aprox 5 a 8 seg

qiime diversity beta-group-significance \ --i-distance-matrix 11.core_metrics_results/unweighted_unifrac_distance_matrix.qza \ --m-metadata-file /Share/EMetagen/data/metadata.tsv \ --m-metadata-column Type \ --p-pairwise \ --o-visualization 11.core_metrics_results/uw_unifrac-delivery-significance.qzv

Descargar el archivo para observarlo en https://view.qiime2.org/

scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/11.core_metrics_results/uw_unifrac-delivery-significance.qzv .

Desactivar el ambiente de conda

conda deactivate

Ejercicios extra

Colapsar la tabla a un nivel taxonómico específico (género; nivel 6)

Tiempo aprox 5 a 8 seg

Entrar al directorio de trabajo:

cd EMetagen/qiime2 qiime taxa collapse \ --i-table 3.table.qza \ --i-taxonomy 5.taxonomy_blast.qza \ --p-level 6 \ --o-collapsed-table 8.taxa_levels/table_level6_genus.qza

Exportando la tabla colapsada a formato BIOM

Tiempo aprox 5 a 8 seg

qiime tools export \ --input-path 8.taxa_levels/table_level6_genus.qza \ --output-path level6_Genus

Explorar el directorio de level6_Genus

ls level6_Genus/

Convertir los datos BIOM a archivo de texto tabular

Tiempo aprox 5 a 8 seg

biom convert \ -i ./level6_Genus/feature-table.biom \ -o ./level6_Genus/CollapsedTaxonomy_level6_Genus.tsv \ --to-tsv

Explorar el directorio de level6_Genus

ls level6_Genus/ less -S level6_Genus/CollapsedTaxonomy_level6_Genus.tsv

Información complementaria

tags: Bitácoras UUASMB Metagenómica