# **Comandos Download DataSets** ##### ***Alguns comandos de shell para fazer download de dados disponíveis em bancos públicos*** ###### ***01. Instalação de programas e pacotes*** O primeiro passo é a instalação do ambiente bioconda. Terminada a instalação, alguns programas são interessantes para se instalarem: ```ruby= # install grabseqs code pip3 install grabseqs # install fastq-dump dependency conda install -c bioconda parallel-fastq-dump # install pigz dependency conda install pigz ``` Após a instalação então o comando para download de arquivos diretamente do banco de dados é: ###### Downloading NCBI SRA Data ```ruby= # -t = number of threads # -m = file for metadata output # -o = output directory # -r = number of retries # SRX0000000 = SRA ID grabseqs sra -t 4 -m SRX0000000_metadata.csv -o sra_output/ -r 10 SRX0000000 ``` ###### Downloading MG-RAST Data ```ruby= # -t = number of threads # -m = file for metadata output # -o = output directory # -r = number of retries # mgp0000 = mgrast ID grabseqs mgrast -t 16 -m mg_rast_metadata.csv -o output/ -r 10 mgp0000 ``` ##### Caso esteja rodando no servidor DRM Primeiramente deve-se ativar o ambiente bioinfo, no qual todas essas ferramentas estão instaladas: ```ruby= source /home/drm/anaconda3/bin/activate bioinfo ```