# Taller: Ensamble de genomas con megahit y a5 pipeline ## Bioinformática @ Bioingeniería FIAD UABC Ensenada 2024-1 #### Instructor: Dante Alberto Magdaleno Moncayo # Instrucciones: Este ejercicio los vamos a plantear en un contexto aplicado. Supongamos que se diagnostica una nueva enfermedad y que de los pacientes infectados se tomaron muestras para realizar la secuenciación e identificar el genoma del patógeno que causa esta nueva enfermedad. Al tomar las muestras vamos a tener DNA del paciente y de los microorganismos que se encuentran en la zona del cuerpo que muestreó, incluyendo al patógeno de interés. En este ejercicio vamos a suponer que tienen al patógeno aislado y llevan a cabo la secuenciación con el sistema Illumina MiSeq. En este ejercicio realiza el ensamble *De Novo* con el programa megahit y con pipeline a5, el cual se utilizó en el taller pasado. ## Instalación de software y links: #### Instalación de ensamblador MEGAHIT * Link paper MEGAHIT : [https://www.ncbi.nlm.nih.gov/pubmed/25609793] En la terminal correr el siguiente comando: ***conda install -c bioconda megahit*** #### Secuencias generadas por el sistema de secuenciación Illumina MiSeq de 300 bases de longitud paired-end para el ensamble *De Novo*. * Link para descargar las secuencias forward: [https://drive.google.com/file/d/1lXK2An4P7nmtQ5J8nwoeGHcc8sc62Rvr/view?usp=sharing] * Link para descargar las secuencias reverse: [https://drive.google.com/file/d/1l3fm3guv_3BnWFXZQwSAGXJ92XrNS6Ru/view?usp=sharing] **Entregables:** - Número de lecturas R1 y número de lecturas R2. - Longitud de las lecturas. - Captura de pantalla de la terminal cuando se esté corriendo el ensamble. - Número de contigs obtenidos del ensamble. megahit y a5 pipeline - Longitud de los contigs. megahit y a5 pipeline - Nombre del organismo al que pertenece el genoma ensamblado con evidencia. **El contig con mayor longitud se utilizará para el ensamble por referencia en el próximo taller.**