Los datos de microbioma los trabajamos con un paquete de R que se llama phyloseq
es un paquete que está diseñado para trabajar con datos de micro y poder tener en un mismo "objeto" los datos de abundancia, taxonomía y metadatos.
Phyloseq
es un paquete de R que se usa mucho para análisis de microbioma. Un objeto Phyloseq
está formado por tres elementos necesarios:
1. La tabla de taxonomía.
2. La tabla de metadata.
3. La tabla de abundancia. Y además…
4. La información filogenética. No es fundamental, pero sin ella no podemos calcular la distancia Unifrac.
Se crea facilmente a partir de la tabla de resultados generada por herramientas de análisis como qiime2, kraken o metaphlan. Para 16S rRNA vienen de qiime2 y puedes usar este script para importar los datos (Con las modificaciones pertinetes). Si ves hago una "limpieza" de la tabla de taxonomia reordenando los taxones para que se lean más facilmente.
Con los datos que estan en el github del estudio puedes crear el objeto phyloseq, y también tienes el archivo .csv
con la metadata.
Cualquier duda me dices porque a lo mejor no tengo todo colgado en el github
Para obtener una tabla con todo lo que puedes correlacionar, puedes usar este script (modificando adecuadamente)
physeq
) beta diversidad y tablas de abundancias con el physeq.rel
.
Para filtrar las muestras con dietas falsas usar este comando:
En vez de Diagnosis
sería SampleID = NUMERO
Ejemplos de cáculos de diversidad y abundancias:
Esto lo puedes hacer con género y seleccionando los 20 más abundantes
Utiliza este pipeline, a partir de "Cross-correlating data sets"
Puedes fijarte en este script mío, pero lo suyo es que sigas las instrucciones que te paso arriba.