--- title: 'Analisis de secuencias de amplicones del gen rRNA 16S con QIIME2' disqus: hackmd --- Análisis de secuencias de amplicones del gen rRNA 16S con QIIME2 === **Dra. E. Ernestina Godoy Lozano** elizabeth.godoy@insp.mx tinagodoy@gmail.com ## Temario [TOC] ## Crear espacio de trabajo ### Ejercicio 1. Conectarnos al servidor ```=bash= ssh -X alumnoX@132.248.32.180 ``` ### Ejercicio 2: Crear mi espacio de trabajo #### Ir a mi home ```=bash=2 cd ``` #### Crear directorio de trabajo ```=bash=3 mkdir EMetagen cd EMetagen mkdir qiime2 ``` ## Explorar los datos que usaremos ### Ejercicio 3: Listado de archivos #### Manifiesto y Metadatos ```bash=6 ls /Share/EMetagen/data cat /Share/EMetagen/data/metadata.tsv cat /Share/EMetagen/data/manifiesto.csv ``` #### Secuencias crudas ```bash=9 ls /Share/EMetagen/raw_data head /Share/EMetagen/raw_data/Cru1_S1_SED_R1.fastq ``` #### Contar secuencias crudas ```bash=11 grep -c '^+' /Share/EMetagen/raw_data/*.fastq ``` #### Base de datos ```bash=12 ls /Share/EMetagen/database ``` ## Activar ambiente conda QIIME2 ### Ejercicio 4: Ambiente conda de QIIME2 ```=bash=13 export LC_ALL=C.UTF-8 export LANG=C.UTF-8 conda activate qiime2-amplicon-2024.10 ``` ### Ejercicio 5: Visualizar los plugins instalados ```=bash=16 qiime --help ``` ### Ejercicio 6: Visualizar la ayuda de un plugin ```bash=17 qiime taxa --help ``` #### Visualizar la ayuda de un comando en especifico del plugin ```bash=18 qiime taxa barplot --help ``` ## Análisis de amplicones de rRNA 16S ### Ejercicio 7: Convertir archivo de metadata a qzv Tiempo aprox 5 a 10 seg ```bash=19 # Acceder al directorio qiime2 cd qiime2 qiime metadata tabulate \ --m-input-file /Share/EMetagen/data/metadata.tsv \ --o-visualization 1.metadata.qzv ``` ### Ejercicio 8: Visualizar el archivo metadata.qzv #### Opcion1. A través de qiime tools view ```bash=24 # qiime tools view 1.metadata.qzv ``` #### Opcion2. Descargando el archivo a mi computadora por medio del comando scp 1. Dentro de mi computadora, abrir otra pestaña de la consola. 2. Cambiar de directorio a donde quiero descargar los resultados. 3. Descargar archivo por medio del comando de copia de segurida **scp**. ```bash=25 scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/1.metadata.qzv . ``` 4. En mi navegador ir a la pagina web https://view.qiime2.org/ 5. Abrir el archivo. Podemos arrastrarlo. 6. Visualizar archivo. ### Ejercicio 9: Importar mis datos a QIIME2 Tiempo aprox 30 a 40 seg ```bash=26 qiime tools import \ --type SampleData[PairedEndSequencesWithQuality] \ --input-format PairedEndFastqManifestPhred33 \ --input-path /Share/EMetagen/data/manifiesto.csv \ --output-path 2.demux.qza ``` ### Ejercicio 10: Generar la visualización de mis datos ```bash=31 qiime demux summarize \ --i-data 2.demux.qza \ --o-visualization 2.demux.qzv ``` Descargar el archivo para observarlo en https://view.qiime2.org/ ```bash=34 scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/2.demux.qzv . ``` ### Ejercicio 11: Eliminación de errores (denoising) y la clusterización con DADA2 Tiempo aprox 60 a 70 seg ```bash=35 qiime dada2 denoise-paired \ --i-demultiplexed-seqs 2.demux.qza \ --p-trunc-len-f 295 \ --p-trunc-len-r 240 \ --o-table 3.table.qza \ --o-representative-sequences 3.rep-seqs.qza \ --o-denoising-stats 3.denoising-stats.qza ``` #### Generamos el archivo para visualización Tiempo aprox 8 a 10 seg ```bash=42 qiime metadata tabulate \ --m-input-file 3.denoising-stats.qza \ --o-visualization 3.denoising-stats.qzv ``` Descargar el archivo para observarlo en https://view.qiime2.org/ ```bash=45 scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/3.denoising-stats.qzv . ``` ### Ejercicio 12: Generar visalización de las secuencias representativas (FeatureData) Tiempo aprox 40 a 45 seg ```bash=46 qiime feature-table tabulate-seqs \ --i-data 3.rep-seqs.qza \ --o-visualization 4.rep-seqs.qzv ``` #### Exportando las secuencias representativas en formato fasta Tiempo aprox 8 a 10 seg ```bash=49 qiime tools export \ --input-path 3.rep-seqs.qza \ --output-path 4.RepSeqFasta ``` Descargar el archivo para observarlo en https://view.qiime2.org/ ```bash=52 scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/4.rep-seqs.qzv . ``` ### Ejercicio 13: Generar la tabla de abundancias absolutas (FeatureTable) Tiempo aprox 40 a 45 seg ```bash=53 qiime feature-table summarize \ --i-table 3.table.qza \ --o-visualization 3.table.qzv \ --m-sample-metadata-file /Share/EMetagen/data/metadata.tsv ``` Descargar el archivo para observarlo en https://view.qiime2.org/ ```bash=57 scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/3.table.qzv . ``` ### Ejercicio 14: Asignacion taxonómica usando BLAST+ Tiempo aprox 8 a 10 min **NOTA:** No lo correremos porque el servidor se satura ```bash=58 #qiime feature-classifier classify-consensus-blast \ #--i-query 3.rep-seqs.qza \ #--i-reference-reads /Share/EMetagen/database/silva-138-99-seqs.qza \ #--i-reference-taxonomy /Share/EMetagen/database/silva-138-99-tax.qza \ #--o-classification 5.taxonomy_blast.qza \ #--o-search-results 5.taxonomy_FD_blast.qza ``` #### Copiar la anotación taxonómica ```bash=63 cp /home/tina/EMetagen/qiime2/5.taxonomy_blast.qza . ``` #### Generamos el archivo para visualización Tiempo aprox 8 a 10 seg ```bash=64 qiime metadata tabulate \ --m-input-file 5.taxonomy_blast.qza \ --o-visualization 6.taxonomy_blast.qzv ``` Descargar el archivo para observarlo en https://view.qiime2.org/ ```bash=67 scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/6.taxonomy_blast.qzv . ``` #### Generamos un archivo de gráficas apiladas (barplots) Tiempo aprox 5 a 8 seg ```bash=68 qiime taxa barplot \ --i-table 3.table.qza \ --i-taxonomy 5.taxonomy_blast.qza \ --m-metadata-file /Share/EMetagen/data/metadata.tsv \ --o-visualization 7.taxa-bar-plots_blast.qzv ``` Descargar el archivo para observarlo en https://view.qiime2.org/ ```bash=73 scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/taxa-bar-plots_blast.qzv . ``` ### Ejercicio 15: FeatureTable a formato BIOM Tiempo aprox 8 a 10 seg #### Formato BIOM ```bash=74 qiime tools export \ --input-path 3.table.qza \ --output-path 8.taxa_levels ``` #### Explorar el directorio de 8.taxa_levels ```bash=75 ls 8.taxa_levels/ ``` #### Exportar el archivo de taxonomía a archivo tabular Tiempo aprox 5 a 8 seg ```bash=76 qiime tools export \ --input-path 5.taxonomy_blast.qza \ --output-path 8.taxa_levels ``` #### Explorar el directorio de 8.taxa_levels ```bash=79 ls 8.taxa_levels/ ``` #### Agregando la información de la asignación taxonómica a la tabla con formato BIOM Tiempo aprox 5 a 8 seg ```bash=80 biom add-metadata \ -i ./8.taxa_levels/feature-table.biom \ -o ./8.taxa_levels/tableConTax.biom \ --observation-metadata-fp ./8.taxa_levels/taxonomy.tsv \ --observation-header OTUID,taxonomy \ --sc-separated taxonomy ``` #### Explorar el directorio de 8.taxa_levels ```bash=86 ls 8.taxa_levels/ ``` #### Convertir el archivo BIOM a un archivo de texto tabular Tiempo aprox 5 a 8 seg ```bash=87 biom convert \ -i ./8.taxa_levels/tableConTax.biom \ -o ./8.taxa_levels/TablaFinal.txt \ --to-tsv \ --header-key taxonomy ``` #### Explorar el directorio de 8.taxa_levels ```bash=92 ls 8.taxa_levels/ ``` #### Explorar la TablaFinal.txt ```bash=93 less -S 8.taxa_levels/TablaFinal.txt ``` ### Ejercicio 16: Reconstrucción filogenética para los análisis de diversidad Tiempo aprox 8 a 10 seg ```bash=94 qiime phylogeny align-to-tree-mafft-fasttree \ --i-sequences 3.rep-seqs.qza \ --o-alignment 9.aligned-rep-seqs.qza \ --o-masked-alignment 9.masked-aligned-rep-seqs.qza \ --o-tree 9.unrooted-tree.qza \ --o-rooted-tree 9.rooted-tree.qza ``` #### Descargas 1. Descargar el archivo del árbol para observarlo en iTOL (https://itol.embl.de/) 2. Es necesario descargar el archivo **5.taxonomy_blast.qza** para cambiar las anotaciones en itol ```bash=100 # Árboles scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/*rooted-tree.qza . # Taxonomía scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/5.taxonomy_blast.qza . ``` ### Ejercicio 17: Gráficas de rarefacción Tiempo aprox 40 a 50 seg ```bash=104 qiime diversity alpha-rarefaction \ --i-table 3.table.qza \ --i-phylogeny 9.rooted-tree.qza \ --p-max-depth 60 \ --m-metadata-file /Share/EMetagen/data/metadata.tsv \ --o-visualization 10.alpha-rarefaction.qzv ``` Descargar el archivo para observarlo en https://view.qiime2.org/ ```bash=110 scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/10.alpha-rarefaction.qzv . ``` ### Ejercicio 18: Métricas de alfa y beta diversidad Tiempo aprox 8 a 10 seg ```bash=111 qiime diversity core-metrics-phylogenetic \ --i-phylogeny 9.rooted-tree.qza \ --i-table 3.table.qza \ --p-sampling-depth 60 \ --m-metadata-file /Share/EMetagen/data/metadata.tsv \ --output-dir 11.core_metrics_results ``` #### Descargas 1. Descargar los archivos .qzv para observarlos en https://view.qiime2.org/ 2. En mi computadora personal crear un directorio y entrar a el para comenzar la descarga ```bash=117 mkdir 11.core_metrics_results cd 11.core_metrics_results scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/11.core_metrics_results/*.qzv . ``` #### Alfa diversidad ##### Explorar el índice de Shannon Tiempo aprox 5 a 8 seg ```bash=120 qiime diversity alpha-group-significance \ --i-alpha-diversity 11.core_metrics_results/shannon_vector.qza \ --m-metadata-file /Share/EMetagen/data/metadata.tsv \ --o-visualization 11.core_metrics_results/shannon-group-significance.qzv ``` Descargar el archivo para observarlo en https://view.qiime2.org/ ```bash=121 scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/11.core_metrics_results/shannon-group-significance.qzv . ``` #### Beta diversidad ##### Explorar las distancias por el metodo **"unweighted unifrac"** por la variable **"Type"** Tiempo aprox 5 a 8 seg ```bash=122 qiime diversity beta-group-significance \ --i-distance-matrix 11.core_metrics_results/unweighted_unifrac_distance_matrix.qza \ --m-metadata-file /Share/EMetagen/data/metadata.tsv \ --m-metadata-column Type \ --p-pairwise \ --o-visualization 11.core_metrics_results/uw_unifrac-delivery-significance.qzv ``` Descargar el archivo para observarlo en https://view.qiime2.org/ ```bash=128 scp -r alumnoXX@132.248.32.180:/home/alumnoXX/EMetagen/qiime2/11.core_metrics_results/uw_unifrac-delivery-significance.qzv . ``` #### Desactivar el ambiente de conda ```bash=129 conda deactivate ``` ## Ejercicios extra ### Colapsar la tabla a un nivel taxonómico específico (género; nivel 6) Tiempo aprox 5 a 8 seg Entrar al directorio de trabajo: ```bash=130 cd EMetagen/qiime2 qiime taxa collapse \ --i-table 3.table.qza \ --i-taxonomy 5.taxonomy_blast.qza \ --p-level 6 \ --o-collapsed-table 8.taxa_levels/table_level6_genus.qza ``` #### Exportando la tabla colapsada a formato BIOM Tiempo aprox 5 a 8 seg ```bash=137 qiime tools export \ --input-path 8.taxa_levels/table_level6_genus.qza \ --output-path level6_Genus ``` #### Explorar el directorio de level6_Genus ```bash=140 ls level6_Genus/ ``` #### Convertir los datos BIOM a archivo de texto tabular Tiempo aprox 5 a 8 seg ```bash=141 biom convert \ -i ./level6_Genus/feature-table.biom \ -o ./level6_Genus/CollapsedTaxonomy_level6_Genus.tsv \ --to-tsv ``` #### Explorar el directorio de level6_Genus ```bash=145 ls level6_Genus/ less -S level6_Genus/CollapsedTaxonomy_level6_Genus.tsv ``` ## Información complementaria :::info -[**Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2**](https://www.nature.com/articles/s41587-019-0209-9) -[**Instalación de QIIME2**](https://library.qiime2.org/quickstart/amplicon) -[**Canal QIIME2 en youtube**](https://youtube.com/playlist?list=PLbVDKwGpb3XmvnTrU40zHRT7NZWWVNUpt&si=4Ay1clw_LRxJR2Q5) -[**Tutorial moving-pictures QIIME2**](https://amplicon-docs.qiime2.org/en/latest/tutorials/moving-pictures.html) ::: ###### tags: `Bitácoras` `UUASMB` `Metagenómica`