---
title: 'Metagenómica funcional 2024. Tema 2'
disqus: hackmd
---
Metagenómica Funcional 2024
===
Centro de Investigaciones Biológicas del Noroeste S.C. La Paz, Baja California Sur.
Noviembre 2024
**Dra. E. Ernestina Godoy Lozano** | elizabeth.godoy@insp.mx | tinagodoy@gmail.com
## Tabla de Contenido
[TOC]
## Pasos antes de comenzar
Si es tu primera vez, vamos a comenzar desde aquí.
1. Tener un emulador de terminal
*Usuarios Windows:*
- Windows power shell [Instalación aquí](https://learn.microsoft.com/es-es/powershell/scripting/install/installing-powershell-on-windows?view=powershell-7.4)
- MobaXterm [Instalación aquí](https://mobaxterm.mobatek.net/)
*Usuarios IOS/Mac*
- Terminal, viene instalada nativa
- iterm2 [Instalación aquí](https://iterm2.com/)
2. Tener un editor de texto plano (No es necesario pero recomendable)
Opciones:
- SublimeText [Instalación aquí](https://www.sublimetext.com/)
- Notepad++
- Bloc de notas
3. Tener una cuenta en el servidor.
No te preocupes, la primera clase te asignaremos la cuenta
4. Necesitaremos un software para compartir archivos de mi computadora al servidor
- FileZilla [Instalación aquí](https://filezilla-project.org/)
6. **Estamos listos ¡Comencemos!**
7. Conexión al servidor
```gherkin=
Feature: Usar comando "ssh"
#Sintaxis:
ssh [OPC] usuario@IP.SERVIDOR
# Así nos conectamos al servidor Bioinformatica, solo intercambia tu usuario
# Asegurate de cambiar "user" por tu usuario asignado
## Opción 1. Servidor a231
ssh -X -o ServerAliveInterval=60 user@200.23.162.231
## Opción 2. Servidor a240
ssh -X -o ServerAliveInterval=60 user@200.23.162.240
```
## Tema 2. Análisis primario
### 1. Preparación de espacio de trabajo
```gherkin=13
Feature: Verificar ambiente conda
# 1. Verificar que el archivo .condarc se encuentre en mi home
ls -la
# 1.1 Si aparece, verificar que contenga las siguientes lineas:
cat .condarc
### Para servidor a231
# envs_dirs:
# - /home/aescobar/shared_envs
# - /home/kvazquez/.conda/envs
# - /home/egodoy/.conda/envs
# 1.2 Si no aparece, pueden copiarlo o crearlo
# a231
cp /home/ebioinfo1/.condarc .
# a240
cp /home/egodoy/.condarc .
Feature: Activar ambientes conda
# 2.1 conda base
# Servidor a231
source /home/rvazquez/miniconda2/bin/activate
# Servidor a240
source /usr/local/miniconda3/bin/activate
# 2.2 lista de softwares
conda list
# 2.3 lista de ambientes
conda info --envs
Feature: Preparar ambiente de trabajo en: curso_2024
# 3.1 Entrar al directorio
cd curso_2024
# 3.2 Crear directorios de trabajo
mkdir raw_data quality_control taxonomy
```
### 2. Obtención de datos crudos
```gherkin=49
Feature: Generar ligas simbolicas
# 1. Entrar a raw_data
cd raw_data
# 2. Generera la liga simbolica a los archivos mock_1.fastq mock_2.fastq
# Servidor a231 y a240
ln -s /Datos/cursoMet/cursos/metagenome_raw_data/*.fastq .
# 3. Contar secuencias
grep -c '^+' *.fastq
```
### 3. Control de calidad
```gherkin=59
Feature: Activar ambiente conda
conda activate metawrap-env
# 3.1 verificar que el ambiente se encuentre activado
conda info --envs
Feature: Opcion 1. trim_galore
cd ../quality_control
nohup trim_galore --fastqc --length 70 --paired ../raw_data/mock_1.fastq ../raw_data/mock_2.fastq &
Feature: Opcion 2. metawrap
mkdir READ_QC
cd READ_QC
nohup metawrap read_qc -1 ../../raw_data/mock_1.fastq -2 ../../raw_data/mock_2.fastq -t 4 -o mock_reads --skip-bmtagger &
Feature: Bajar los archivos html a nuestra computadora
# Opcion 1. trim_galore
#### Reporte post calidad
scp -r ebioinfoXX@200.23.162.231/240:/home/ebioinfoXX/curso_2024/quality_control/*.html .
# Opcion 2. metawrap
scp -r ebioinfoXX@200.23.162.231/240:/home/ebioinfoXX/curso_2024/quality_control/READ_QC/mock_reads/p* .
Feature: Correr script de estadisticas basicas de los archivos antes y despues del corte de calidad
# 5.1 Generar archivo files_list.txt y directorio de est_basicas
# Ubicarse en directorio quality_control o READ_QC
mkdir est_basicas
cd est_basicas
# generar ligas simbolicas de archivos raw y archivos filtrados
Feature: Opcion 1. trim_galore
ln -s ../../raw_data/*.fastq .
ln -s ../*.fq .
Feature: Opcion 2. metawrap
ln -s ../../../raw_data/*.fastq .
ln -s ../mock_reads/*.fastq .
ls *.fastq *.fq > files_list.txt
cat files_list.txt
# Correr script de basic_stats.pl
nohup /Datos/cursoMet/scripts/basic_stats.pl files_list.txt &
Feature: Generar graficos de calidad de las estadisticas basicas
conda activate R
# graph_quality.R basic_stats_out.txt R1_file R2_file R1_trim R2_trim
Rscript /Datos/cursoMet/scripts/graph_quality.R basic_stats_out.txt mock_1.fastq mock_2.fastq mock_1_val_1.fq mock_2_val_2.fq
# Bajar los graficos a nuestra computadora
# a231
scp ebioinfoXX@200.23.162.231:/home/ebioinfoXX/curso_2024/quality_control/READ_QC/est_basicas/quality_plots.png .
#a240
scp -r usrXX@200.23.162.240:/home/usrXX/curso_2024/quality_control/READ_QC/est_basicas/*.png .
```
## Enlaces
:::info
**Etherpad** Deja tu pregunta
https://etherpad.wikimedia.org/p/metagenomica_funcional_2024
:::
###### tags: `CIBNOR` `Metagenómica`