--- title: 'Metagenómica funcional 2024. Tema 2' disqus: hackmd --- Metagenómica Funcional 2024 === Centro de Investigaciones Biológicas del Noroeste S.C. La Paz, Baja California Sur. Noviembre 2024 **Dra. E. Ernestina Godoy Lozano** | elizabeth.godoy@insp.mx | tinagodoy@gmail.com ## Tabla de Contenido [TOC] ## Pasos antes de comenzar Si es tu primera vez, vamos a comenzar desde aquí. 1. Tener un emulador de terminal *Usuarios Windows:* - Windows power shell [Instalación aquí](https://learn.microsoft.com/es-es/powershell/scripting/install/installing-powershell-on-windows?view=powershell-7.4) - MobaXterm [Instalación aquí](https://mobaxterm.mobatek.net/) *Usuarios IOS/Mac* - Terminal, viene instalada nativa - iterm2 [Instalación aquí](https://iterm2.com/) 2. Tener un editor de texto plano (No es necesario pero recomendable) Opciones: - SublimeText [Instalación aquí](https://www.sublimetext.com/) - Notepad++ - Bloc de notas 3. Tener una cuenta en el servidor. No te preocupes, la primera clase te asignaremos la cuenta 4. Necesitaremos un software para compartir archivos de mi computadora al servidor - FileZilla [Instalación aquí](https://filezilla-project.org/) 6. **Estamos listos ¡Comencemos!** 7. Conexión al servidor ```gherkin= Feature: Usar comando "ssh" #Sintaxis: ssh [OPC] usuario@IP.SERVIDOR # Así nos conectamos al servidor Bioinformatica, solo intercambia tu usuario # Asegurate de cambiar "user" por tu usuario asignado ## Opción 1. Servidor a231 ssh -X -o ServerAliveInterval=60 user@200.23.162.231 ## Opción 2. Servidor a240 ssh -X -o ServerAliveInterval=60 user@200.23.162.240 ``` ## Tema 2. Análisis primario ### 1. Preparación de espacio de trabajo ```gherkin=13 Feature: Verificar ambiente conda # 1. Verificar que el archivo .condarc se encuentre en mi home ls -la # 1.1 Si aparece, verificar que contenga las siguientes lineas: cat .condarc ### Para servidor a231 # envs_dirs: # - /home/aescobar/shared_envs # - /home/kvazquez/.conda/envs # - /home/egodoy/.conda/envs # 1.2 Si no aparece, pueden copiarlo o crearlo # a231 cp /home/ebioinfo1/.condarc . # a240 cp /home/egodoy/.condarc . Feature: Activar ambientes conda # 2.1 conda base # Servidor a231 source /home/rvazquez/miniconda2/bin/activate # Servidor a240 source /usr/local/miniconda3/bin/activate # 2.2 lista de softwares conda list # 2.3 lista de ambientes conda info --envs Feature: Preparar ambiente de trabajo en: curso_2024 # 3.1 Entrar al directorio cd curso_2024 # 3.2 Crear directorios de trabajo mkdir raw_data quality_control taxonomy ``` ### 2. Obtención de datos crudos ```gherkin=49 Feature: Generar ligas simbolicas # 1. Entrar a raw_data cd raw_data # 2. Generera la liga simbolica a los archivos mock_1.fastq mock_2.fastq # Servidor a231 y a240 ln -s /Datos/cursoMet/cursos/metagenome_raw_data/*.fastq . # 3. Contar secuencias grep -c '^+' *.fastq ``` ### 3. Control de calidad ```gherkin=59 Feature: Activar ambiente conda conda activate metawrap-env # 3.1 verificar que el ambiente se encuentre activado conda info --envs Feature: Opcion 1. trim_galore cd ../quality_control nohup trim_galore --fastqc --length 70 --paired ../raw_data/mock_1.fastq ../raw_data/mock_2.fastq & Feature: Opcion 2. metawrap mkdir READ_QC cd READ_QC nohup metawrap read_qc -1 ../../raw_data/mock_1.fastq -2 ../../raw_data/mock_2.fastq -t 4 -o mock_reads --skip-bmtagger & Feature: Bajar los archivos html a nuestra computadora # Opcion 1. trim_galore #### Reporte post calidad scp -r ebioinfoXX@200.23.162.231/240:/home/ebioinfoXX/curso_2024/quality_control/*.html . # Opcion 2. metawrap scp -r ebioinfoXX@200.23.162.231/240:/home/ebioinfoXX/curso_2024/quality_control/READ_QC/mock_reads/p* . Feature: Correr script de estadisticas basicas de los archivos antes y despues del corte de calidad # 5.1 Generar archivo files_list.txt y directorio de est_basicas # Ubicarse en directorio quality_control o READ_QC mkdir est_basicas cd est_basicas # generar ligas simbolicas de archivos raw y archivos filtrados Feature: Opcion 1. trim_galore ln -s ../../raw_data/*.fastq . ln -s ../*.fq . Feature: Opcion 2. metawrap ln -s ../../../raw_data/*.fastq . ln -s ../mock_reads/*.fastq . ls *.fastq *.fq > files_list.txt cat files_list.txt # Correr script de basic_stats.pl nohup /Datos/cursoMet/scripts/basic_stats.pl files_list.txt & Feature: Generar graficos de calidad de las estadisticas basicas conda activate R # graph_quality.R basic_stats_out.txt R1_file R2_file R1_trim R2_trim Rscript /Datos/cursoMet/scripts/graph_quality.R basic_stats_out.txt mock_1.fastq mock_2.fastq mock_1_val_1.fq mock_2_val_2.fq # Bajar los graficos a nuestra computadora # a231 scp ebioinfoXX@200.23.162.231:/home/ebioinfoXX/curso_2024/quality_control/READ_QC/est_basicas/quality_plots.png . #a240 scp -r usrXX@200.23.162.240:/home/usrXX/curso_2024/quality_control/READ_QC/est_basicas/*.png . ``` ## Enlaces :::info **Etherpad** Deja tu pregunta https://etherpad.wikimedia.org/p/metagenomica_funcional_2024 ::: ###### tags: `CIBNOR` `Metagenómica`