Try   HackMD

Metagenómica Funcional 2024

Centro de Investigaciones Biológicas del Noroeste S.C. La Paz, Baja California Sur.
Noviembre 2024

Dra. E. Ernestina Godoy Lozano | elizabeth.godoy@insp.mx | tinagodoy@gmail.com

Tabla de Contenido

Pasos antes de comenzar

Si es tu primera vez, vamos a comenzar desde aquí.

  1. Tener un emulador de terminal

Usuarios Windows:
- Windows power shell Instalación aquí
- MobaXterm Instalación aquí

Usuarios IOS/Mac
- Terminal, viene instalada nativa
- iterm2 Instalación aquí

  1. Tener un editor de texto plano (No es necesario pero recomendable)
    Opciones:
  2. Tener una cuenta en el servidor.
    No te preocupes, la primera clase te asignaremos la cuenta
  3. Necesitaremos un software para compartir archivos de mi computadora al servidor
  4. Estamos listos ¡Comencemos!
  5. Conexión al servidor
Feature: Usar comando "ssh" #Sintaxis: ssh [OPC] usuario@IP.SERVIDOR # Así nos conectamos al servidor Bioinformatica, solo intercambia tu usuario # Asegurate de cambiar "user" por tu usuario asignado ## Opción 1. Servidor a231 ssh -X -o ServerAliveInterval=60 user@200.23.162.231 ## Opción 2. Servidor a240 ssh -X -o ServerAliveInterval=60 user@200.23.162.240

Tema 2. Análisis primario

1. Preparación de espacio de trabajo

Feature: Verificar ambiente conda # 1. Verificar que el archivo .condarc se encuentre en mi home ls -la # 1.1 Si aparece, verificar que contenga las siguientes lineas: cat .condarc ### Para servidor a231 # envs_dirs: # - /home/aescobar/shared_envs # - /home/kvazquez/.conda/envs # - /home/egodoy/.conda/envs # 1.2 Si no aparece, pueden copiarlo o crearlo # a231 cp /home/ebioinfo1/.condarc . # a240 cp /home/egodoy/.condarc . Feature: Activar ambientes conda # 2.1 conda base # Servidor a231 source /home/rvazquez/miniconda2/bin/activate # Servidor a240 source /usr/local/miniconda3/bin/activate # 2.2 lista de softwares conda list # 2.3 lista de ambientes conda info --envs Feature: Preparar ambiente de trabajo en: curso_2024 # 3.1 Entrar al directorio cd curso_2024 # 3.2 Crear directorios de trabajo mkdir raw_data quality_control taxonomy

2. Obtención de datos crudos

Feature: Generar ligas simbolicas # 1. Entrar a raw_data cd raw_data # 2. Generera la liga simbolica a los archivos mock_1.fastq mock_2.fastq # Servidor a231 y a240 ln -s /Datos/cursoMet/cursos/metagenome_raw_data/*.fastq . # 3. Contar secuencias grep -c '^+' *.fastq

3. Control de calidad

Feature: Activar ambiente conda conda activate metawrap-env # 3.1 verificar que el ambiente se encuentre activado conda info --envs Feature: Opcion 1. trim_galore cd ../quality_control nohup trim_galore --fastqc --length 70 --paired ../raw_data/mock_1.fastq ../raw_data/mock_2.fastq & Feature: Opcion 2. metawrap mkdir READ_QC cd READ_QC nohup metawrap read_qc -1 ../../raw_data/mock_1.fastq -2 ../../raw_data/mock_2.fastq -t 4 -o mock_reads --skip-bmtagger & Feature: Bajar los archivos html a nuestra computadora # Opcion 1. trim_galore #### Reporte post calidad scp -r ebioinfoXX@200.23.162.231/240:/home/ebioinfoXX/curso_2024/quality_control/*.html . # Opcion 2. metawrap scp -r ebioinfoXX@200.23.162.231/240:/home/ebioinfoXX/curso_2024/quality_control/READ_QC/mock_reads/p* . Feature: Correr script de estadisticas basicas de los archivos antes y despues del corte de calidad # 5.1 Generar archivo files_list.txt y directorio de est_basicas # Ubicarse en directorio quality_control o READ_QC mkdir est_basicas cd est_basicas # generar ligas simbolicas de archivos raw y archivos filtrados Feature: Opcion 1. trim_galore ln -s ../../raw_data/*.fastq . ln -s ../*.fq . Feature: Opcion 2. metawrap ln -s ../../../raw_data/*.fastq . ln -s ../mock_reads/*.fastq . ls *.fastq *.fq > files_list.txt cat files_list.txt # Correr script de basic_stats.pl nohup /Datos/cursoMet/scripts/basic_stats.pl files_list.txt & Feature: Generar graficos de calidad de las estadisticas basicas conda activate R # graph_quality.R basic_stats_out.txt R1_file R2_file R1_trim R2_trim Rscript /Datos/cursoMet/scripts/graph_quality.R basic_stats_out.txt mock_1.fastq mock_2.fastq mock_1_val_1.fq mock_2_val_2.fq # Bajar los graficos a nuestra computadora # a231 scp ebioinfoXX@200.23.162.231:/home/ebioinfoXX/curso_2024/quality_control/READ_QC/est_basicas/quality_plots.png . #a240 scp -r usrXX@200.23.162.240:/home/usrXX/curso_2024/quality_control/READ_QC/est_basicas/*.png .

Enlaces

tags: CIBNOR Metagenómica