# **Comandos Download DataSets**
##### ***Alguns comandos de shell para fazer download de dados disponíveis em bancos públicos***
###### ***01. Instalação de programas e pacotes***
O primeiro passo é a instalação do ambiente bioconda. Terminada a instalação, alguns programas são interessantes para se instalarem:
```ruby=
# install grabseqs code
pip3 install grabseqs
# install fastq-dump dependency
conda install -c bioconda parallel-fastq-dump
# install pigz dependency
conda install pigz
```
Após a instalação então o comando para download de arquivos diretamente do banco de dados é:
###### Downloading NCBI SRA Data
```ruby=
# -t = number of threads
# -m = file for metadata output
# -o = output directory
# -r = number of retries
# SRX0000000 = SRA ID
grabseqs sra -t 4 -m SRX0000000_metadata.csv -o sra_output/ -r 10 SRX0000000
```
###### Downloading MG-RAST Data
```ruby=
# -t = number of threads
# -m = file for metadata output
# -o = output directory
# -r = number of retries
# mgp0000 = mgrast ID
grabseqs mgrast -t 16 -m mg_rast_metadata.csv -o output/ -r 10 mgp0000
```
##### Caso esteja rodando no servidor DRM
Primeiramente deve-se ativar o ambiente bioinfo, no qual todas essas ferramentas estão instaladas:
```ruby=
source /home/drm/anaconda3/bin/activate bioinfo
```