# Taller: Conteo de k-mers #### Instructor: Dante Alberto Magdaleno Moncayo Instalar el siguiente software: Link kmc: [https://anaconda.org/bioconda/kmc] https://github.com/refresh-bio/kmc Datos: * Link para descargar las secuencias forward: [https://drive.google.com/file/d/19nc-NcEEAnUtZt5lbceVc5uWMaziUH-k/view?usp=sharing] * Link para descargar las secuencias reverse: [https://drive.google.com/file/d/1tBO6-g_kVEQGu2wY5CUVTyA5fC2SNTC4/view?usp=sharing] * Link para descargar genoma:[https://drive.google.com/file/d/1Lcv6Po9JhADaY4ol9PGTCPoR3ACcvRdV/view?usp=sharing] #### Realizar el conteo de k-mers de 21,31,41,51 Ejemplo para correr el programa kmc: ``` kmc -k21 lecturas.fastq resultado.res . > resultado.txt ``` #### Para formato fasta ``` kmc --k21 -fa genome.fasta 21mers.res . > 21resrange.txt ``` #### Con los resultados, llenar la siguiente tabla. | Muestra | kmer | # Total de kmers | Conteo de kmers únicos | # de kmers únicos | | ----------------- | ---- | ---------------- | ---------------------- | ----------------- | | for_p1.fastq | 9949 | 111965 | 5497 | | | rev_p2.fastq | 10255 | 112000 | 5463 | | | genoma.fasta | 5361 | 5420 | 59 | | #### Realizar el conteo de k-mers en el rango de 31 hasta 131 de los Datos_A. #### Realizar histogramas de frecuencia e indicar el número de k-mer que presenta mayor diversidad para cada una de las muestras. | Muestra | kmer | # Total de kmers | Conteo de kmers únicos | # de kmers únicos | | ------------ | ---- | ---------------- | ---------------------- | ----------------- | | muestra1_R1.fastq | 61 | 1326679852 | 164432726 | 364832198 | | muestra1_R2.fastq | 31 | 1482234904 | 152010025 | 578503739 | | muestra2_R1.fastq | 31 | 2049924854 | 200708290 | 589701183 | | muestra2_R2.fastq | 31 | 2041417793 | 175558567 | 922492563 | #### Realiza la captura de pantalla de cada uno de los comandos que se corrieron en la terminal, colocalos en un archivo PDF y agrega los estadísticos y gráficas.