# Taller Ensamble por referencia 2025-1 Para realizar el ensamble por referencia es necesario tener instalado y funcionando el siguiente software: **NOTA: Se requiere tener Bioconda para comenzar con la instalación.** ## Instalación de software y links: * Link para ensamblador bowtie2: [http://bioconda.github.io/recipes/bowtie2/README.html] * Link para paquetería samtools: [https://anaconda.org/bioconda/samtools] * Link para vizualizador Tablet: [https://anaconda.org/bioconda/tablet] #### Secuencias generadas por el sistema de secuenciación Illumina MiSeq de 300 bases de longitud paired-end para el ensamble por refrerencia. * Link para descargar las secuencias forward: [https://drive.google.com/open?id=1aROWsQcKYJs9Z7eZHOQluPx5HFhJYcCi] * Link para descargar las secuencias reverse: [https://drive.google.com/file/d/1U2bmcTn3VopkYSK0zuE_pP7nCL5rZB-w/view?usp=sharing] **Entregables:** % de lecturas sobrevivientes totales: % de lecturas sobrevivientes en archivo R1: % de lecturas sobrevivientes en archivo R2: Gráficas del Quality Scores de los archivos r1 y r2, antes y después de correr trimmomatic. ## Pasos del pipeline para ensamble por referencia: 1.- Indexar el genoma que se usará como referencia con el comando bowtie2-built, el genoma de referencia (el genoma de referencia es el que se obtuvo de la primer parte del taller) y un nombre de salida para el indexado como argumentos, como se muestra enseguida: ***bowtie2-build Genoma_Referencia.fasta referencia*** En el directorio Ensamble_por_referencia deberán generarse 6 archivos con terminación .bt2 que corresponde al indexado como se muestra en la siguiente imagen: ![](https://i.imgur.com/BsH9C4u.png) 2.- Alineamiento con el comando bowtie2, el nombre del indexado, secuencias forward, reverse y nombre de salida con terminación .sam. Ejemplo: ***bowtie2 -x referencia -1 ref_reads_R1.fastq -2 ref_reads_R2.fastq -S ensamble.sam*** Al terminal el proceso de alineamiento se genera un archivo llamado ensamble.sam 3.- Cambiar de formato .sam a .bam el archivo ensamble.sam como se muestra enseguida: ***samtools view -bS ensamble.sam > ensamble.bam*** Este comando genera un archivo con nombre ensamble.bam 4.- Ordenar (sort) el alineamiento con el siguiente comando: ***samtools sort ensamble.bam -o ensamble.sorted.bam*** Este comando genera un archivo con nombre ensamble.sorted.bam 5.- Indexar el archivo ensamble.sorted.bam con el siguiente comando: ***samtools index ensamble.sorted.bam*** Este comando genera un archivo con nombre ensamble.sorted.bam.bai 6.- Visualizar el ensamble en la terminal con el siguiente comando: ***samtools tview ensamble.sorted.bam Genoma_Referencia.fasta*** Este comando despliega en la terminal el alineamiento como se muestra en la siguiente imagen: ![](https://i.imgur.com/8eBZ0rt.png) Para navegar el alineamiento en la terminal puedes utilizar las teclas de flechas o la barra espaciadora, para salir del alineamiento presiona la tecla q. 7.- Visualizar el ensamble por referencia con TABLET viewer. Link información de TABLET viewer [https://ics.hutton.ac.uk/tablet/] Entregables: -Captura de pantalla de lo que despliega la terminal al correr cada uno de los comandos del ensamble por referencia. -Captura de pantalla del el alineamiento de las lecturas con el genoma de referencia que arroja el programa Tablet. -Cuántos SNPs se encontraron?