# Taller búsqueda de secuencias de reconocimiento de enzimas de restricción.
# Bioinformática 2025-2 @Bioingeniería FIAD UABC Ensenada
#### Instructor: Dante Alberto Magdaleno Moncayo
## Instrucciones:
#### 1. Descargar los archivos fasta del siguiente link:
https://drive.google.com/drive/folders/1b_Pdz-2VIU4aD5574keZHnUBQ97sfgRd?usp=sharing
#### 2. Instalar bioawk por medio de conda
https://anaconda.org/bioconda/bioawk
Si surgen problemas con la instalación, también se puede utilizar el siguiente comando:
`sudo apt install bioawk`
#### 1. Contar el número de nucleótidos del archivo E1.fasta y E2.fasta.
#### En el siguiente link encontrarás información para realizar el conteo:
https://bioinformaticsworkbook.org/Appendix/Unix/bioawk-basics.html#gsc.tab=0
Número de nucleótidos E1.fasta = 4639675
Número de nucleótidos E2.fasta = 2158963
#### 2. Calcular el % de GC del archivo E1.fasta y E2.fasta.
%GC E1.fasta = 50.7897%
%GC E2.fasta = 68.0967%
#### 3. En su cuaderno, calcular la probabilidad de encontrar las secuencias de reconocimiento de las siguientes enzimas de restricción en los archvios E1.fasta y E2.fasta:
* Eco RI 5'GAATTC3'
* Eco RV 5'GATATC3'
* Bam HI 5'GGATCC3'
* Not I 5'GCGGCCGC3'
#### 4. Realizar por medio de la terminal un conteo de las veces que se repiten las secuencias de reconocimiento de las enzimas de restricción en los archivos "E1.fasta" y "E2.fasta":
* Eco RI 5'GAATTC3'
* Eco RV 5'GATATC3'
* Bam HI 5'GGATCC3'
* Not I 5'GCGGCCGC3'
#### En el siguiente link encontrarás información para realizar el conteo:
https://bioinformaticsworkbook.org/Appendix/Unix/unix-basics-3grep.html#gsc.tab=0
#### 5. Con los resultados obtenidos del taller, llenar la siguiente tabla y realizar una discusión en equipo.
| Genoma | E1 | E2 |
| ---------------- | --- | --- |
| # de Nucleótidos |4639675 |2158963
| Cálculo teórico
| Eco RI GAATTC | 1132 | 527 |
| Eco RV GATATC | 1132 | 527 |
| Bam HI GGATCC | 1132 | 527 |
| Not I GCGGCCGC | 70 | 32 |
| Cálculo Terminal | | |
| Eco RI | 598 | 13 |
| Eco RV | 1860 | 59
| Bam HI | 444 | 526 |
| Not I | 21 | 75
#### 6. Exponer los resultados, discusión y conclusión al grupo.
## Fecha límite de entrega: jueves 4 de septiembre a las 10:59 am.