---
title: 'Analisis de secuencias de amplicones del gen rRNA 16S con QIIME2'
disqus: hackmd
---
Análisis de secuencias de amplicones del gen rRNA 16S con QIIME2
===
**Dra. E. Ernestina Godoy Lozano**
elizabeth.godoy@insp.mx
tinagodoy@gmail.com
## Temario
[TOC]
## Crear espacio de trabajo
### Ejercicio 1. Conectarnos al servidor
```=bash=
ssh -X alumnoX@132.248.32.180
```
### Ejercicio 2: Crear mi espacio de trabajo
#### Ir a mi home
```=bash=2
cd
```
#### Crear directorio de trabajo
```=bash=3
mkdir EMetagen
cd EMetagen
mkdir qiime2
```
## Explorar los datos que usaremos
### Ejercicio 3: Listado de archivos
#### Manifiesto y Metadatos
```bash=6
ls /Share/EMetagen/data
cat /Share/EMetagen/data/metadata.tsv
cat /Share/EMetagen/data/manifiesto.csv
```
#### Secuencias crudas
```bash=9
ls /Share/EMetagen/raw_data
head /Share/EMetagen/raw_data/Cru1_S1_SED_R1.fastq
```
#### Contar secuencias crudas
```bash=11
grep -c '^+' /Share/EMetagen/raw_data/*.fastq
```
#### Base de datos
```bash=12
ls /Share/EMetagen/database
```
## Activar ambiente conda QIIME2
### Ejercicio 4: Ambiente conda de QIIME2
```=bash=13
export LC_ALL=C.UTF-8
export LANG=C.UTF-8
conda activate qiime2-amplicon-2024.10
```
### Ejercicio 5: Visualizar los plugins instalados
```=bash=16
qiime --help
```
### Ejercicio 6: Visualizar la ayuda de un plugin
```bash=17
qiime taxa --help
```
#### Visualizar la ayuda de un comando en especifico del plugin
```bash=18
qiime taxa barplot --help
```
## Análisis de amplicones de rRNA 16S
### Ejercicio 7: Convertir archivo de metadata a qzv
Tiempo aprox 5 a 10 seg
```bash=19
# Acceder al directorio qiime2
cd qiime2
qiime metadata tabulate \
--m-input-file /Share/EMetagen/data/metadata.tsv \
--o-visualization 1.metadata.qzv
```
### Ejercicio 8: Visualizar el archivo metadata.qzv
#### Opcion1. A través de qiime tools view
```bash=24
# qiime tools view 1.metadata.qzv
```
#### Opcion2. Descargando el archivo a mi computadora por medio del comando scp
1. Dentro de mi computadora, abrir otra pestaña de la consola.
2. Cambiar de directorio a donde quiero descargar los resultados.
3. Descargar archivo por medio del comando de copia de segurida **scp**.
```bash=25
scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/1.metadata.qzv .
```
4. En mi navegador ir a la pagina web https://view.qiime2.org/
5. Abrir el archivo. Podemos arrastrarlo.
6. Visualizar archivo.
### Ejercicio 9: Importar mis datos a QIIME2
Tiempo aprox 30 a 40 seg
```bash=26
qiime tools import \
--type SampleData[PairedEndSequencesWithQuality] \
--input-format PairedEndFastqManifestPhred33 \
--input-path /Share/EMetagen/data/manifiesto.csv \
--output-path 2.demux.qza
```
### Ejercicio 10: Generar la visualización de mis datos
```bash=31
qiime demux summarize \
--i-data 2.demux.qza \
--o-visualization 2.demux.qzv
```
Descargar el archivo para observarlo en https://view.qiime2.org/
```bash=34
scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/2.demux.qzv .
```
### Ejercicio 11: Eliminación de errores (denoising) y la clusterización con DADA2
Tiempo aprox 60 a 70 seg
```bash=35
qiime dada2 denoise-paired \
--i-demultiplexed-seqs 2.demux.qza \
--p-trunc-len-f 295 \
--p-trunc-len-r 240 \
--o-table 3.table.qza \
--o-representative-sequences 3.rep-seqs.qza \
--o-denoising-stats 3.denoising-stats.qza
```
#### Generamos el archivo para visualización
Tiempo aprox 8 a 10 seg
```bash=42
qiime metadata tabulate \
--m-input-file 3.denoising-stats.qza \
--o-visualization 3.denoising-stats.qzv
```
Descargar el archivo para observarlo en https://view.qiime2.org/
```bash=45
scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/3.denoising-stats.qzv .
```
### Ejercicio 12: Generar visalización de las secuencias representativas (FeatureData)
Tiempo aprox 40 a 45 seg
```bash=46
qiime feature-table tabulate-seqs \
--i-data 3.rep-seqs.qza \
--o-visualization 4.rep-seqs.qzv
```
#### Exportando las secuencias representativas en formato fasta
Tiempo aprox 8 a 10 seg
```bash=49
qiime tools export \
--input-path 3.rep-seqs.qza \
--output-path 4.RepSeqFasta
```
Descargar el archivo para observarlo en https://view.qiime2.org/
```bash=52
scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/4.rep-seqs.qzv .
```
### Ejercicio 13: Generar la tabla de abundancias absolutas (FeatureTable)
Tiempo aprox 40 a 45 seg
```bash=53
qiime feature-table summarize \
--i-table 3.table.qza \
--o-visualization 3.table.qzv \
--m-sample-metadata-file /Share/EMetagen/data/metadata.tsv
```
Descargar el archivo para observarlo en https://view.qiime2.org/
```bash=57
scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/3.table.qzv .
```
### Ejercicio 14: Asignacion taxonómica usando BLAST+
Tiempo aprox 8 a 10 min
**NOTA:** No lo correremos porque el servidor se satura
```bash=58
#qiime feature-classifier classify-consensus-blast \
#--i-query 3.rep-seqs.qza \
#--i-reference-reads /Share/EMetagen/database/silva-138-99-seqs.qza \
#--i-reference-taxonomy /Share/EMetagen/database/silva-138-99-tax.qza \
#--o-classification 5.taxonomy_blast.qza \
#--o-search-results 5.taxonomy_FD_blast.qza
```
#### Copiar la anotación taxonómica
```bash=63
cp /home/tina/EMetagen/qiime2/5.taxonomy_blast.qza .
```
#### Generamos el archivo para visualización
Tiempo aprox 8 a 10 seg
```bash=64
qiime metadata tabulate \
--m-input-file 5.taxonomy_blast.qza \
--o-visualization 6.taxonomy_blast.qzv
```
Descargar el archivo para observarlo en https://view.qiime2.org/
```bash=67
scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/6.taxonomy_blast.qzv .
```
#### Generamos un archivo de gráficas apiladas (barplots)
Tiempo aprox 5 a 8 seg
```bash=68
qiime taxa barplot \
--i-table 3.table.qza \
--i-taxonomy 5.taxonomy_blast.qza \
--m-metadata-file /Share/EMetagen/data/metadata.tsv \
--o-visualization 7.taxa-bar-plots_blast.qzv
```
Descargar el archivo para observarlo en https://view.qiime2.org/
```bash=73
scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/taxa-bar-plots_blast.qzv .
```
### Ejercicio 15: FeatureTable a formato BIOM
Tiempo aprox 8 a 10 seg
#### Formato BIOM
```bash=74
qiime tools export \
--input-path 3.table.qza \
--output-path 8.taxa_levels
```
#### Explorar el directorio de 8.taxa_levels
```bash=75
ls 8.taxa_levels/
```
#### Exportar el archivo de taxonomía a archivo tabular
Tiempo aprox 5 a 8 seg
```bash=76
qiime tools export \
--input-path 5.taxonomy_blast.qza \
--output-path 8.taxa_levels
```
#### Explorar el directorio de 8.taxa_levels
```bash=79
ls 8.taxa_levels/
```
#### Agregando la información de la asignación taxonómica a la tabla con formato BIOM
Tiempo aprox 5 a 8 seg
```bash=80
biom add-metadata \
-i ./8.taxa_levels/feature-table.biom \
-o ./8.taxa_levels/tableConTax.biom \
--observation-metadata-fp ./8.taxa_levels/taxonomy.tsv \
--observation-header OTUID,taxonomy \
--sc-separated taxonomy
```
#### Explorar el directorio de 8.taxa_levels
```bash=86
ls 8.taxa_levels/
```
#### Convertir el archivo BIOM a un archivo de texto tabular
Tiempo aprox 5 a 8 seg
```bash=87
biom convert \
-i ./8.taxa_levels/tableConTax.biom \
-o ./8.taxa_levels/TablaFinal.txt \
--to-tsv \
--header-key taxonomy
```
#### Explorar el directorio de 8.taxa_levels
```bash=92
ls 8.taxa_levels/
```
#### Explorar la TablaFinal.txt
```bash=93
less -S 8.taxa_levels/TablaFinal.txt
```
### Ejercicio 16: Reconstrucción filogenética para los análisis de diversidad
Tiempo aprox 8 a 10 seg
```bash=94
qiime phylogeny align-to-tree-mafft-fasttree \
--i-sequences 3.rep-seqs.qza \
--o-alignment 9.aligned-rep-seqs.qza \
--o-masked-alignment 9.masked-aligned-rep-seqs.qza \
--o-tree 9.unrooted-tree.qza \
--o-rooted-tree 9.rooted-tree.qza
```
#### Descargas
1. Descargar el archivo del árbol para observarlo en iTOL (https://itol.embl.de/)
2. Es necesario descargar el archivo **5.taxonomy_blast.qza** para cambiar las anotaciones en itol
```bash=100
# Árboles
scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/*rooted-tree.qza .
# Taxonomía
scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/5.taxonomy_blast.qza .
```
### Ejercicio 17: Gráficas de rarefacción
Tiempo aprox 40 a 50 seg
```bash=104
qiime diversity alpha-rarefaction \
--i-table 3.table.qza \
--i-phylogeny 9.rooted-tree.qza \
--p-max-depth 60 \
--m-metadata-file /Share/EMetagen/data/metadata.tsv \
--o-visualization 10.alpha-rarefaction.qzv
```
Descargar el archivo para observarlo en https://view.qiime2.org/
```bash=110
scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/10.alpha-rarefaction.qzv .
```
### Ejercicio 18: Métricas de alfa y beta diversidad
Tiempo aprox 8 a 10 seg
```bash=111
qiime diversity core-metrics-phylogenetic \
--i-phylogeny 9.rooted-tree.qza \
--i-table 3.table.qza \
--p-sampling-depth 60 \
--m-metadata-file /Share/EMetagen/data/metadata.tsv \
--output-dir 11.core_metrics_results
```
#### Descargas
1. Descargar los archivos .qzv para observarlos en https://view.qiime2.org/
2. En mi computadora personal crear un directorio y entrar a el para comenzar la descarga
```bash=117
mkdir 11.core_metrics_results
cd 11.core_metrics_results
scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/11.core_metrics_results/*.qzv .
```
#### Alfa diversidad
##### Explorar el índice de Shannon
Tiempo aprox 5 a 8 seg
```bash=120
qiime diversity alpha-group-significance \
--i-alpha-diversity 11.core_metrics_results/shannon_vector.qza \
--m-metadata-file /Share/EMetagen/data/metadata.tsv \
--o-visualization 11.core_metrics_results/shannon-group-significance.qzv
```
Descargar el archivo para observarlo en https://view.qiime2.org/
```bash=121
scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/11.core_metrics_results/shannon-group-significance.qzv .
```
#### Beta diversidad
##### Explorar las distancias por el metodo **"unweighted unifrac"** por la variable **"Type"**
Tiempo aprox 5 a 8 seg
```bash=122
qiime diversity beta-group-significance \
--i-distance-matrix 11.core_metrics_results/unweighted_unifrac_distance_matrix.qza \
--m-metadata-file /Share/EMetagen/data/metadata.tsv \
--m-metadata-column Type \
--p-pairwise \
--o-visualization 11.core_metrics_results/uw_unifrac-delivery-significance.qzv
```
Descargar el archivo para observarlo en https://view.qiime2.org/
```bash=128
scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/11.core_metrics_results/uw_unifrac-delivery-significance.qzv .
```
#### Desactivar el ambiente de conda
```bash=129
conda deactivate
```
## Ejercicios extra
### Colapsar la tabla a un nivel taxonómico específico (género; nivel 6)
Tiempo aprox 5 a 8 seg
Entrar al directorio de trabajo:
```bash=130
cd EMetagen/qiime2
qiime taxa collapse \
--i-table 3.table.qza \
--i-taxonomy 5.taxonomy_blast.qza \
--p-level 6 \
--o-collapsed-table 8.taxa_levels/table_level6_genus.qza
```
#### Exportando la tabla colapsada a formato BIOM
Tiempo aprox 5 a 8 seg
```bash=137
qiime tools export \
--input-path 8.taxa_levels/table_level6_genus.qza \
--output-path level6_Genus
```
#### Explorar el directorio de level6_Genus
```bash=140
ls level6_Genus/
```
#### Convertir los datos BIOM a archivo de texto tabular
Tiempo aprox 5 a 8 seg
```bash=141
biom convert \
-i ./level6_Genus/feature-table.biom \
-o ./level6_Genus/CollapsedTaxonomy_level6_Genus.tsv \
--to-tsv
```
#### Explorar el directorio de level6_Genus
```bash=145
ls level6_Genus/
less -S level6_Genus/CollapsedTaxonomy_level6_Genus.tsv
```
## Información complementaria
:::info
-[**Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2**](https://www.nature.com/articles/s41587-019-0209-9)
-[**Instalación de QIIME2**](https://library.qiime2.org/quickstart/amplicon)
-[**Canal QIIME2 en youtube**](https://youtube.com/playlist?list=PLbVDKwGpb3XmvnTrU40zHRT7NZWWVNUpt&si=4Ay1clw_LRxJR2Q5)
-[**Tutorial moving-pictures QIIME2**](https://amplicon-docs.qiime2.org/en/latest/tutorials/moving-pictures.html)
:::
###### tags: `Bitácoras` `UUASMB` `Metagenómica`