Como está o mercado?
===
<style>
p{
text-align: justify;
}
</style>
Nos últimos anos, o interesse pela Ciência de Dados tem sido crescente. Ao verificar as palavras-chave "data science" e "cientista de dados" na ferramenta *Google Trends*, percebe-se que o volume de buscas por esses termos apresentou um aumento expressivo no Brasil na última década, conforme o gráfico abaixo:
<center>

</center>
Fonte: Elaboração própria.
Na comparação sobre o interesse das pessoas na busca das expressões "*data science*" e "*data engineer*" no mundo, podemos verificar o seguinte cenário:
<center>

</center>
Fonte: Elaboração própria.
:::spoiler
Fiz os gráficos utilizando as trends do Google para a palavra "data science":
```r=
library(gtrendsR)
library(dplyr)
ds <- gtrends(c("ciência de dados", "cientista de dados"), geo = c("BR"), time = "all", )
ds.world <- gtrends(c("data science", "data engineer"), time = "all")
plot(ds)
plot(ds.world)
```
:::
<br>
Note que, nos últimos anos, o interesse de busca pelos termos supracitados acompanhou a tendência mundial. O fato é que, nos últimos anos as diversas inovações tecnológicas em diversos formatos resultaram em uma gama de informações que precisavam ser tratadas, armazenadas e disseminadas.
Conforme citam Provost e Fawcett (2016):
>“*No passado, as empresas podiam contratar equipes de estatísticos, modeladores e analistas para explorar manualmente os conjuntos de dados, mas seu volume e variedade superaram muito a capacidade da análise manual. Ao mesmo tempo, os computadores se tornaram muito mais poderosos, a comunicação em rede é onipresente, e foram desenvolvidos algoritmos que podem conectar conjuntos de dados para permitir análises muito mais amplas e profundas do que antes. A convergência desses fenômenos deu origem à aplicação, cada vez mais difundida, de princípios de data science e de técnicas de mineração de dados nos negócios." (PROVOST; FAWCETT, 2016, p. 1).*
No que se refere à geração e disponibilidade de dados, Fávero e Belfiore (2017) apontam a ocorrência de cinco características (ou dimensões), as quais os autores representam conforme a figura abaixo:
<center>
<img align="center" alt="" width="270" height="270" src=https://i.imgur.com/WSdXobe.png>
</center>
<br>
O aumento do **volume** de dados está relacionado, dentre diversos fatores, ao aumento da capacidade computacional. A **velocidade** refere-se à rapidez com que os dados são disponibilizados para tratamento e análise. A **variedade** diz respeito aos diferentes formatos em que os dados são acessados. A **variabilidade** é oriunda de fenômenos cíclicos ou sazonais e a **complexidade** contempla às dimensões anteriores, sendo necessárias um conjunto de habilidades para trabalhar com os dados para que, ao final, seja possível analisar e embasar a tomada de decisão (FÁVERO; BELFIORE, 2017, p. XIII).
:::spoiler
**Referências:**
FAWCETT, T.; PROVOST, F. Data Science para Negócios: O que você precisa saber sobre
mineração de dados e pensamento analítico de dados. Alta Books Editora, 2016.
FÁVERO, L. P.; BELFIORE, P. Manual de análise de dados: estatística e modelagem multivariada com Excel®, SPSS® e Stata®. Elsevier Brasil, 2017. Trecho do livro:

:::
<br>
E foi nesse cenário que surgiu a necessidade de profissionais que correspondessem às demandas do mercado de modo interdisciplinar.
Abaixo é possível visualizar a proficiência em habilidades de ciência de dados, por setor e região, de acordo com “[Data Science in the New Economy - A new race for talent in the Fourth Industrial Revolution](https://knute.edu.ua/file/MTI1Nzk=/5f42b9d514fb543727bf4f719d366a2d.pdf)” do *Fórum Econômico Mundial*, publicado em 2019:

### O que está em alta?
Segundo o relatório “[Jobs of Tomorrow: Mapping Opportunity in the New Economy](https://www3.weforum.org/docs/WEF_Future_of_Jobs_2020.pdf)” do *Fórum Econômico Mundial*, publicado em 2020, as previsões para a evolução do mercado de trabalho em 2020-2025 já refletem na atualidade e que futuro do trabalho já chegou. No relatório é apresentado as 20 principais de trabalho em crescente demanda em todos os setores:
<center>

</center>
Dentre as carreiras emergentes, o relatório destaca profissionais de:

Ainda, segundo o relatório, algumas habilidades estarão no top 10 nas previsões de 2020-2025, as quais podemos citar:
<center>
<img align="center" alt="" width="400" height="470" src=https://i.imgur.com/K38OHwO.png>
</center>
### Quantos Data Scientist o Brasil tem?
:::danger
Várias dúvidas aqui!
Por exemplo: Hoje em dia existem diversas áreas que se autodeclaram "Data Scientist" (já vi até pessoas da área de nutrição). Como quantificar? Eu vi, por exemplo, a CBO `2031 Pesquisadores das ciências naturais e exatas` como sendo definida para DS, enfim... complicado mensurar.
Na live da Curso-R eles pressupõem que algumas áreas cadastradas na RAIS são DS, mas é algo "concreto". Outra situação que ocorre é de que a RAIS só considera empregos formais, mas em uma área como essa provavelmente terá muitas pessoas que não entram nas estatísticas da RAIS.
Enfim, tenho muitas dúvidas aqui!
:::
### Quantos Engenheiros de dados o Brasil tem?
:::danger
Ainda não achei essa informação (é um campo de formação amplo: Ciência da Computação, Engenharia, Matemática, outras áreas relacionadas à TI)
:::
### Quais são as competências mais pedidas para esses cargos?
Os conhecimentos adquiridos na graduação são os pilares para o profissional atuar no mercado, entretanto, algumas habilidades e competências são fundamentais para realizar determinadas atividades e se desenvolver na carreira profissional. Quando se fala em habilidades, faz-se referência às qualidades “naturais” que um profissional tem para fazer algo. Já as competências são características que poderão ser desenvolvidas no percurso de um profissional.
Em um mundo em que novas tecnologias vão surgindo de forma acelerada, antes que se mencione as competências dos profissionais aqui citados, é fundamental que independente se estamos falando de um Data Scientist, Data Analytics ou Data Engineer, a lifelong learning (aprendizagem contínua) é algo extremamente necessário para tornar-se um profissional diferenciado no mercado.
Assim, diante ao exposto, uma pergunta vem a surgir: quais são as competências e habilidades mais pedidas?
Abaixo é possível observar um diagrama com algumas respostas para essa pergunta:
<center>

</center>
Fonte: Elaboração própria.
:::spoiler
Imagem editável em: https://1drv.ms/w/s!AhnZefWJQ0CYkiMRd1OztRboDlV0
:::
<br>
:::info
**Engenheiro de dados**
:::
Segundo a [Data Science Academy](https://blog.dsacademy.com.br/o-que-faz-um-engenheiro-de-dados/), um engenheiro de dados precisa ser bom em habilidades tais como:
- Arquitetar sistemas distribuídos;
- Criar pipelines confiáveis;
- Combinar fontes de dados;
- Criar a arquitetura de soluções;
- Colaborar com a equipe de Data Science e construir as soluções certas para essas equipes.
Já em [it forum](https://itforum.com.br/noticias/o-que-e-e-o-que-faz-um-engenheiro-de-dados/), é apresentado que, de acordo com [dados do PayScale](https://www.payscale.com/research/US/Job=Data_Engineer/Salary) , as seguintes habilidades de engenharia de dados estão associadas a um aumento significativo nos salários para engenheiros de dados:

Fonte: Elaboração própria com informações do [it forum](https://itforum.com.br/noticias/o-que-e-e-o-que-faz-um-engenheiro-de-dados/).
:::spoiler
**Fontes:**
https://itforum.com.br/noticias/o-que-e-e-o-que-faz-um-engenheiro-de-dados/
https://www.freecodecamp.org/news/the-rise-of-the-data-engineer-91be18f1e603
:::
<br>
:::info
**Data analytics**
:::
Estar atento às tecnologias mais pedidas no mercado é fundamental no mercado competitivo. Dominar as ferramentas mais utilizadas na área o faz um profissional diferenciado. Assim, para a área de Data analytics, uma fonte renomada de informações é o [quadrante mágico BI e Analytics da Gartner Group](https://powerbi.microsoft.com/pt-br/blog/microsoft-named-a-leader-in-2021-gartner-magic-quadrant-for-analytics-and-bi-platforms/), que é dividido em quatro partes: líderes, desafiantes, competidores de nicho e visionários. Em 2021 a **Microsoft** foi líder em plataformas de BI e Analytics, acompanhada pela plataforma **Tableau** e da **Qlik**.
:::spoiler
**Fontes:**
Gartner, Quadrante Mágico de plataformas de análise e Business Intelligence, James Richardson, Rita Sallam, Kurt Schlegel, Austin Kronz, Julian Sun, 15 de fevereiro de 2021. Disponível em: <https://powerbi.microsoft.com/pt-br/blog/microsoft-named-a-leader-in-2021-gartner-magic-quadrant-for-analytics-and-bi-platforms/>.
:::
<br>
:::info
**Data Scientist**
:::
Segundo Provost e Fawcett (2016), "*uma habilidade crucial em data science é a capacidade de decompor um problema analítico de dados, de forma que cada parte corresponda a uma tarefa conhecida para a qual ferramentas estão disponíveis*".
Isso permite uma maior centralização com foco em atividades que requerem atenção e evitam o desperdício de tempo e recursos.
E quais conhecimentos habilidades e competências são necessárias para este profissional? Uma das skills básicas e comum entre o Data Scientist e os mencionados anteriormente é ter conhecimento em linguagens de programação para análise de dados.
Além disso, a proficiência em estatística, matemática e entendimento de negócio também são peças chave no contexto de Ciência de dados.
Em [Ciência e Dados – Data Science for professionals](https://www.cienciaedados.com/as-10-habilidades-de-um-cientista-de-dados/), é apresentado 25 habilidades divididas por área de especialização:

Segundo a [Indicium Tech](https://blog.indicium.tech/8-competencias-em-data-science-para-decolar-em-2021/), as 8 competências fundamentais para um Cientista de Dados que estão em foco são:
1. SQL;
2. Visualização de dados;
3. Data storytelling;
4. Linguagem de programação Python;
5. Biblioteca Pandas;
6. Git;
7. Docker;
8. Airflow.
:::spoiler
**Referências:**
PROVOST, FOSTER; FAWCETT, TOM. Data Science para Negócios. Rio de Janeiro: Alta Books, pg. 20, 2016.

:::
:::warning
### Como está a demanda por esses profissionais?
>Ainda pendente!
:::
1. No Brasil;
2. No exterior;
* EUA
* Europa
### Quantas pessoas formam em TI?
Segundo a *Associação das Empresas de Tecnologia da Informação e Comunicação (TIC) e de Tecnologias Digitais - Brasscom*, 53 mil pessoas formam por ano em cursos de perfil tecnológico e uma demanda média anual de 159 mil profissionais de Tecnologia da Informação e Comunicação (TIC).
:::spoiler
**Fontes:**
"*Com apenas 53 mil pessoas formadas por ano em cursos de perfil tecnológico e uma demanda média anual de 159 mil profissionais de Tecnologia da Informação e Comunicação (TIC)*"

Retirado de: *Brasscom - Associação das Empresas de Tecnologia da Informação e Comunicação (TIC) e de Tecnologias Digitais*.[ Demanda de Talentos em TIC e Estratégia ΣTCEM, de 01.12.2021](https://brasscom.org.br/pdfs/demanda-de-talentos-em-tic-e-estrategia-tcem/)
:::
### Quantas pessoas formam em Estatística?
De acordo com dados do [Conre3](https://www.conre3.org.br/portal/formacao-em-estatistica/), em 2019 o Brasil apresentava um total de 35 universidades que ofertavam programas de graduação em Estatística, quantidade expressivamente baixa se comparado aos EUA, que dispunha de 177 universidades com o programa de graduação e 162 de mestrado.
No gráfico abaixo é possível verificar a série histórica do quantitativo de universidades com programas de graduação no Brasil e Estados Unidos, bem como o quantitativo para mestrado em estatística neste último:

Sob outra ótica, ao verificarmos o quantitativo de alunos concluintes (no mesmo período), apenas 412 alunos formaram no curso de bacharelado, dos quais a maioria (69,17%) é oriunda de universidades/institutos públicos federais e o restante (30,83%) de estaduais.

<br>
Se ao longo dos anos a oferta por cursos de graduação vem crescendo, quem está ficando para trás?
Quais motivos levam o aluno à evasão? Não existe uma fórmula mágica e nem uma origem específica para o problema, entretanto, o fruto disso é refletido no mercado. A quantidade de vagas disponíveis nas mais diversas áreas que permeiam o profissional da estatística é crescente, conforme apresentado no gráfico a seguir:

Note que a quantidade de formandos é nitidamente baixa em comparação às vagas disponíveis no mercado. Além disso, vale ressaltar que estamos considerando apenas o número de formandos, o que não implica dizer todos os formandos possam vir a exercer a profissão na área da Estatística, o que é lamentável tendo em vista n fatores investidos do início ao fim da graduação (tempo, materiais de estudo, entre outros).
:::spoiler
**Fontes:**
https://www.conre3.org.br/portal/formacao-em-estatistica/
https://magazine.amstat.org/blog/2018/08/01/2017-degree-report/
:::
### **Fontes:**
[1] AMSTATNEWS. *"Highlights from 2017 Degree Release: Bachelor’s Numbers Close in on Master’s*". Disponível em: <https://magazine.amstat.org/blog/2018/08/01/2017-degree-report/>.
[2] Brasscom - Associação das Empresas de Tecnologia da Informação e Comunicação (TIC) e de Tecnologias Digitais. Demanda de Talentos em TIC e Estratégia ΣTCEM, de 01.12.2021. Disponível em: <https://brasscom.org.br/pdfs/demanda-de-talentos-em-tic-e-estrategia-tcem/>.
[3] Ciência e Dados – Data Science for professionals. "*As 10 Habilidades de um Cientista de Dados*" Disponível em: <https://www.cienciaedados.com/as-10-habilidades-de-um-cientista-de-dados/>.
[4] Conselho Regional de Estatística (CONRE-3). *A necessária campanha para diminuir a evasão nos cursos de Bacharelado em Estatística no Brasil*. Disponível em: <https://www.conre3.org.br/portal/formacao-em-estatistica/>.
[5] Data Science Academy (DSA). *"O Que Faz um Engenheiro de Dados?*" Disponível em: <https://blog.dsacademy.com.br/o-que-faz-um-engenheiro-de-dados/>.
[6] Data Science in the New Economy - A new race for talent in the Fourth Industrial Revolution. Disponível em: <https://knute.edu.ua/file/MTI1Nzk=/5f42b9d514fb543727bf4f719d366a2d.pdf>.
[7] FÁVERO, L. P.; BELFIORE, P. *Manual de análise de dados*: estatística e modelagem multivariada com Excel®, SPSS® e Stata®. Elsevier Brasil, 2017.
[8] FreeCodeCamp. "*The Rise of the Data Engineer*". Disponível em: <https://www.freecodecamp.org/news/the-rise-of-the-data-engineer-91be18f1e603>.
[9] Gartner, Quadrante Mágico de plataformas de análise e Business Intelligence, James Richardson, Rita Sallam, Kurt Schlegel, Austin Kronz, Julian Sun, 15 de fevereiro de 2021. Disponível em: <https://powerbi.microsoft.com/pt-br/blog/microsoft-named-a-leader-in-2021-gartner-magic-quadrant-for-analytics-and-bi-platforms/>.
[10] Google Trends Package CRAN. Disponível em: <https://cran.r-project.org/web/packages/gtrendsR/gtrendsR.pdf>.
[11] Indicium Tech. "*Data science: 8 competências para você decolar nessa área em 2021*". Disponível em: <https://blog.indicium.tech/8-competencias-em-data-science-para-decolar-em-2021/>.
[12] It forum. "*O que faz um engenheiro de dados?*". Disponível em: <https://itforum.com.br/noticias/o-que-e-e-o-que-faz-um-engenheiro-de-dados/>.
[13] *Jobs of Tomorrow: Mapping Opportunity in the New Economy*. Disponível em: <https://www3.weforum.org/docs/WEF_Future_of_Jobs_2020.pdf>.
[14] Matt Dancho. "*How To Become A Financial Data Scientist (Or A Data Scientist In Any Domain*). Disponível em: <https://www.business-science.io/business/2019/05/23/how-to-become-a-fiancial-data-scientist.html>. Acesso em 09/03/2022.
[15] Microsoft Power BI. "*Microsoft named a Leader in the 2021 Gartner Magic Quadrant for Analytics and BI Platforms*". Disponível em: <https://powerbi.microsoft.com/pt-br/blog/microsoft-named-a-leader-in-2021-gartner-magic-quadrant-for-analytics-and-bi-platforms/>.
[16] PROVOST, FOSTER; FAWCETT, TOM. *Data Science para Negócios*. Rio de Janeiro: Alta Books, 2016.