# Taller: Ensamble de genomas con megahit y a5 pipeline
## Bioinformática @ Bioingeniería FIAD UABC Ensenada 2024-1
#### Instructor: Dante Alberto Magdaleno Moncayo
# Instrucciones:
Este ejercicio los vamos a plantear en un contexto aplicado.
Supongamos que se diagnostica una nueva enfermedad y que de los pacientes infectados se tomaron muestras para realizar la secuenciación e identificar el genoma del patógeno que causa esta nueva enfermedad. Al tomar las muestras vamos a tener DNA del paciente y de los microorganismos que se encuentran en la zona del cuerpo que muestreó, incluyendo al patógeno de interés.
En este ejercicio vamos a suponer que tienen al patógeno aislado y llevan a cabo la secuenciación con el sistema Illumina MiSeq.
En este ejercicio realiza el ensamble *De Novo* con el programa megahit y con pipeline a5, el cual se utilizó en el taller pasado.
## Instalación de software y links:
#### Instalación de ensamblador MEGAHIT
* Link paper MEGAHIT : [https://www.ncbi.nlm.nih.gov/pubmed/25609793]
En la terminal correr el siguiente comando:
***conda install -c bioconda megahit***
#### Secuencias generadas por el sistema de secuenciación Illumina MiSeq de 300 bases de longitud paired-end para el ensamble *De Novo*.
* Link para descargar las secuencias forward: [https://drive.google.com/file/d/1lXK2An4P7nmtQ5J8nwoeGHcc8sc62Rvr/view?usp=sharing]
* Link para descargar las secuencias reverse: [https://drive.google.com/file/d/1l3fm3guv_3BnWFXZQwSAGXJ92XrNS6Ru/view?usp=sharing]
**Entregables:**
- Número de lecturas R1 y número de lecturas R2.
- Longitud de las lecturas.
- Captura de pantalla de la terminal cuando se esté corriendo el ensamble.
- Número de contigs obtenidos del ensamble. megahit y a5 pipeline
- Longitud de los contigs. megahit y a5 pipeline
- Nombre del organismo al que pertenece el genoma ensamblado con evidencia.
**El contig con mayor longitud se utilizará para el ensamble por referencia en el próximo taller.**