# Taller: ensamble *de novo* 2025-1 #### Instructor: Dante Alberto Magdaleno Moncayo Instalar el siguiente software: Link A5 pipeline: [https://anaconda.org/bioconda/a5-miseq] https://sourceforge.net/p/ngopt/wiki/A5PipelineREADME/ Datos: * Link para descargar las secuencias forward: [https://drive.google.com/file/d/19nc-NcEEAnUtZt5lbceVc5uWMaziUH-k/view?usp=sharing] * Link para descargar las secuencias reverse: [https://drive.google.com/file/d/1tBO6-g_kVEQGu2wY5CUVTyA5fC2SNTC4/view?usp=sharing] ## Ensamble con pipeline a5 El ensamblador que se utilizará en este taller es a5_pipeline, en los siguientes links encontrarás la información referente: [https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0042304] [https://pubmed.ncbi.nlm.nih.gov/25338718/] En la siguiente imagen se muestra los pasos que lleva a cabo pipeline a5: ![](https://i.imgur.com/DwnjxAG.png) La primera etapa del pipeline A5 es limpiar las lecturas, eliminando las lecturas contaminantes y corrigiendo los errores de llamada base (Base Calling). Posteriormente, el pipeline ensambla contigs con el software IDBA utilizando las lecturas corregidas. Estos contigs posteriormente se ensamblan en scaffolds utilizando el set de lecturas originales. Enseguida, los scaffolds son revisados con el propósito de encontrar ensambles incorrectos y romper en las regiones que contienen los errores de ensamble. Finalmente, los scaffolds mal ensamblados se vuelven a ensamblar utilizando el set de lecturas originales. ## Ensamble con pipeline a5 -Para realizar en ensamble, desde la terminal llamar el script a5_pipeline.pl -Enseguida llamar las secuencias fordward. -Enseguida llamar las secuencias reverse. -Dar un nombre de salida. Ejemplo: *a5_pipeline.pl forward.fastq reverse.fastq genoma_ensamblado* Se debe dejar un espacio entre cada elemento. Entregables: Captura de pantalla de la gráfica de valores de calidad que arroja el programa FastQC. Captura de pantalla de lo que se despliega en la terminal al correr el comando de ensamble con el pipeline A5. - Qué algortimo utiliza el ensamblador del pipeline A5? - Cuántos contigs arrojó el ensamble? de que longitud(nucleótidos)? - A que organismo pertenece el genoma ensamblado?