###### tags: `UAX` `Estudiantes` # Laboratorio V: Uso de herramientas web para análisis de datos ómicos. <font color = 'gray'> <p style="text-align:right;">Prof.: Laura J. Marcos-Zambrano </font> Las **ciencias ómicas** hacen referencia al conocimiento derivado de la aplicación de un conjunto de tecnologías que posibilitan el estudio a nivel molecular de los distintos elementos que integran los sistemas biológicos (células, tejidos, individuos) en toda su complejidad, incluyendo el resultado de las interacciones y relaciones que se producen entre los componentes internos del individuo y los elementos externos al mismo con los que interactúa. ![](https://i.imgur.com/ABvoQQR.png) ### Visualización de datos de metagenómica con [MicrobiomeAnalyst](https://www.microbiomeanalyst.ca/): Los formatos de datos que requiere MicrobiomeAnalyst son: ![](https://i.imgur.com/VZYmSkl.jpg) Vamos a utilizar datos de un estudio que busca evaluar diferencias en el microbioma intestinal de pacientes con [enfermedad de Crohn](https://medlineplus.gov/spanish/ency/article/000249.htm) comparado con controles. El análisis se ha llevado a cabo mediante secuenciación del gen 16S rRNA y anotado con la base de datos SILVA. * Datos :arrow_right: [aquí](https://www.microbiomeanalyst.ca/MicrobiomeAnalyst/resources/data/ibd_data.zip). :::info :female-construction-worker: **Dataset info:** Muestras de heces de pacientes con enfermedad de Crohn (n=43) ASV table: *ibd_asv_table.txt* Metadata: *ibd_meta.csv* (Control; CD:Crohn's disease) Taxonomy table: *ibd_taxa.txt* Phylogenetic tree: *ibd_tree.tre* List of taxa: *ibd_tsea_list.txt* ::: ## Uso de la Herramienta web microbiomeAnalyst. Trabajaremos con la opción "Marker Data Profiling (MDP) Uploading 16S rRNA marker gene counts data". ![](https://i.imgur.com/LRqDkBG.jpg) ![](https://i.imgur.com/yTCqoyt.jpg) ![](https://i.imgur.com/md6Tl7R.jpg) ![](https://i.imgur.com/SIZnVPX.jpg) ![](https://i.imgur.com/tRxeZFO.jpg) Exploramos las gráficas de rarefacción para ver la cantidad de datos que tiene cada muestra. ![](https://i.imgur.com/DSDl8c5.jpg) ![](https://i.imgur.com/yXgC3f1.jpg) Hay dos muestras (señaladas con flechas en la imagen) que tienen muy poca información y que pueden limitar el análisis de datos, por lo que es mejor eliminarlas. Utiliza el panel superior para volver a "Data filter" y en la pestaña de "Sample editor" selecciona las dos muestras y exclúyelas del análisis. Luego repite los paso de Filtrado y normalización con los mismos parámetros. ![](https://i.imgur.com/KPZXx2l.jpg) Ahora en la pestaña de "Analysis Overview" empezamos la exploración visual de los datos, veremos los perfiles de abundancia con la opción "Stacked bar/area plot" Selecciona "phylum" y observa las diferentes modificaciones que puedes hacer. ![](https://i.imgur.com/4NLGLmw.png) :::warning :memo: **Actividad 1:** Genera gráficos de abundancia de "Phylum" "Family" y "Genus" ::: ### Visualización de la Diversidad Alfa y Beta: La alfa diversidad es una medida que mide la riqueza de especies que componen una muestra. En el caso del microbioma se refiere a la cantidad de microorganismos diferentes que hay en una muestra. Mientras más diverso sea el microbioma se asocia con una mejor salud intestinal. Existen diferentes índices que evaluan dieferentes aspectos de la diversidad: - Chao1: estima el número de especies en una comunidad. - Simpson: Índice de dominancia. - Shanon: Evalua la riqueza y abundancia de las especies. ![](https://i.imgur.com/JrhYZ98.jpg) :::warning :memo: **Actividad 2:** Genera gráficos de alfa diversidad usando las medidas de Chao1, Shannon y Simpson ::: La beta diversidad evalua la diversidad entre grupos. Se utilizan diferentes métodos que calculan distancias de dismilitud. - Bray-Curtis: Distancia de "disimilitud" - Unifrac: Distancia para comparar comunidades biológicas que incorpora la distancia filogenética de los individuos (Para esto se necesita el árbol filogenético) ![](https://i.imgur.com/gSvuMLu.jpg) :::warning :memo: **Actividad 3:** Genera un gráfico de la beta diversidad usando el método de distancia "Weighted Unifrac Distance y método de ordinación PCoA" ::: ### Análisis de abundancia diferencial. Realizamos un análisis de abundancia diferencial de los géneros microbianos presentes en las muestras mediante estadística no paramétrica, la finalidad es ver que microorganismos están en mayor cantidad en que grupo y tener una idea de qué diferencias hay en el microbioma entre casos y controles. ![](https://i.imgur.com/fe32mqi.jpg) :::warning :memo: **Actividad 4:** ¿Qué géneros presentan diferencias significativas en cuanto a su abundancia? ¿En qué grupo se encuentran más representados (Controles o CD)? ::: ### Análisis de biomarcadores - LEfSe LEfSe: Linear discriminant analysis effect size. Encuentra biomarcadores microbiológicos que ayudan a explicar las diferencias biológicas observadas entre los grupos, combinando análisis estadísticos tradicionales con otros tests. :warning: Para realizar el análisis LEfSe hay que normalizar los datos con el método Total Sum scaling (TSS). Para ello vuelve con el menú de navegación a la opción "Normalization" realiza el método TSS y luego el análisis LEfSe que está dentro de las opciones de "Comparison & Classification" en "Analysis Overview". ![](https://i.imgur.com/DPE4J78.jpg) ![](https://i.imgur.com/I6kj0Wv.jpg) Selecciona el tipo de visualización que te resulte más sencillo de interpretar. :::warning :memo: **Actividad 5:** ¿Qué marcadores microbiológicos se han identificado relacionados con la Enfermedad de Crohn (CD)? :::