Concurso IPEA - HackMD

# Concurso IPEA ![image](https://hackmd.io/_uploads/HJVGiY7Yp.png) Link: [edital](https://concursos.cesgranrio.org.br/media/gpoweb-prd-hibrido3/eventos/8/conteudos/e1786931-d1de-4d33-bfd1-3d8593eea4ac.pdf?sv=2021-08-06&se=2034-01-13T03%3A15%3A18Z&sr=c&sp=r&sig=3SnCEpniJZ0LdS064yfjSJvNhWoLCEpMjYr3fQam8Mk%3D) | TÓPICOS | |---------------------------------------------------------| | **I. LÍNGUA PORTUGUESA** | | 1. Compreensão e interpretação de textos | | 2. Tipologia textual | | 3. Ortografia oficial | | 4. Acentuação gráfica | | 5. Emprego das classes de palavras | | 6. Emprego do sinal indicativo de crase | | 7. Sintaxe da oração e do período | | 8. Pontuação | | 9. Concordância nominal e verbal | | 10. Regência nominal e verbal | | 11. Significação das palavras | | 12. Reescrita de frases e parágrafos do texto | | | | **II. LÍNGUA INGLESA** | | 1. Compreensão, interpretação, reescrita, tradução e versão de textos | | | | **III. ESTADO E POLÍTICAS PÚBLICAS** | | 1. Princípios, direitos e garantias fundamentais na Constituição Federal | | 2. Organização política e administrativa do Estado na CF/88 | | 3. Poderes Legislativo, Executivo e Judiciário na CF/88 | | 4. Atribuições, competências e relações entre esferas de governo no regime federativo na CF/88 | | 5. Administração Pública na CF/88 | | 6. Planejamento e Orçamento na CF/88: Objetivos da República, Planos Setoriais, Plano Plurianual, Lei de Diretrizes Orçamentárias e Lei Orçamentária Anual | | 7. Participação e controle social na CF/88 | | 8. Ética e conduta do servidor público | | 9. Ciclo de políticas públicas: identificação de problemas; definição dos objetivos da intervenção; formação de agenda; formulação - diagnóstico e desenho de programas; processo decisório - definição de escopo, escala, atores envolvidos e públicos-alvo; implementação; monitoramento; avaliação. | | | | **IV. REALIDADE BRASILEIRA ATUAL** | | 1. Dinâmica e estrutura demográfica do Brasil | | 2. Desigualdades socioeconômicas e regionais | | 3. Direitos humanos, discriminação e exclusão social, com atenção aos direitos e à situação de mulheres, crianças, adolescentes e idosos, pessoas com deficiência, indígenas, negros, pessoas LGBTQIA+, e outros grupos minoritários ou vulneráveis. | | 4. Novas tecnologias e transformações no mundo do trabalho | | 5. Mudanças na estrutura produtiva brasileira | | 6. Desenvolvimento urbano brasileiro: o crescimento das cidades e os desafios urbanos | | 7. Meio ambiente e desenvolvimento sustentável | | ** ESPECIFICAS ** | |-----------------------------------------------------------| | **I. INGESTÃO, PROCESSAMENTO E ARMAZENAMENTO DE DADOS:** | | 1. Ingestão de dados estruturados, semiestruturados e não estruturados. | | 2. Ingestão de dados em lote (batch). | | 3. Ingestão de dados em streaming. | | 4. Armazenamento de big data. | | 5. Conceitos de processamento massivo e paralelo. | | 6. Processamento distribuído. | | 7. Soluções de big data: Arquitetura do ecossistema Spark; | | 8. Arquitetura de cloud computing para ciência de dados (AWS, Azure, GCP). | | | | **II. BANCOS DE DADOS:** | | 1. Álgebra relacional e SQL (padrão ANSI). | | 2. Banco de dados relacional: SQL Server; PostgreSQL, MySQL. | | 3. Banco de dados NoSQL. | | 4. Banco de dados e formatos de arquivo orientado a colunas: Parquet, MonetDB, duckDB. | | | | **III. TRATAMENTO, QUALIDADE E VISUALIZAÇÃO DE DADOS:** | | 1. Normalização numérica. | | 2. Discretização. | | 3. Tratamento de dados ausentes. | | 4. Tratamento de outliers e agregações. | | 5. Matching. | | 6. Deduplicação. | | 7. Data cleansing. | | 8. Enriquecimento. | | 9. Desidentificação de dados sensíveis. | | 10. Algoritmos fuzzy matching e stemming. | | 11. Visualização e análise exploratória de dados. | | | | **IV. LINGUAGENS DE PROGRAMAÇÃO E FRAMEWORKS:** | | 1. Linguagem de programação R. | | 2. Linguagem de programação Python. | | 3. Linguagem de programação Scala. | | 4. Programação funcional. | | 5. Programação orientada a objetos. | | 6. Classes de objetos e suas propriedades (vetores, listas, data.frames). | | 7. Manipulação e tabulação de dados (numpy, pandas, tidyverse, data.table). | | 8. Visualização de dados – ggplot, matplotlib. | | 9. Paralelização de rotinas de ciência de dados. | | | | **V. PROBABILIDADE E ESTATÍSTICA:** | | 1. Probabilidade e probabilidade condicional. | | 2. Independência de eventos, teorema de Bayes e teorema da probabilidade total. | | 3. Variáveis aleatórias e funções de probabilidade. | | 4. Principais distribuições de probabilidade discretas e contínuas: distribuição uniforme, distribuição binomial, distribuição Poisson e distribuição normal. | | 5. Medidas de tendência central e dispersão e correlação. | | 6 Teorema do limite central. | | 7. Regra empírica (regra de três sigma) da distribuição normal. | | 8. Diagramas causais: grafos acíclicos dirigidos; variáveis confundidoras, colisoras e de mediação. | | 9. Métodos e técnicas de identificação causal: Métodos experimentais RCT e de identificação quase-experimental. | | 10. Tipos de viés no processo gerador dos dados e soluções: Sampling bias; Selection bias; Attrition bias; Reporting bias; Measurement bias. | | 11. Modelos probabilísticos gráficos: cadeias de Markov; filtros de Kalman; Redes bayesianas. | | 12. Testes de hipóteses: teste-z; teste-t; valorp; testes para uma amostra; testes de comparação de duas amostras; teste de normalidade (chi square); e intervalos de confiança. | | 13. Histogramas e curvas de frequência; Diagrama boxplot; Avaliação de outliers. | | | | **VI. APRENDIZADO DE MÁQUINA:** | | 1. Técnicas de classificação: Naive Bayes; Regressão logística; Redes neurais artificiais; Árvores de decisão (algoritmos ID3 e C4.5); e florestas aleatórias (random forest); Máquinas de vetores de suporte (SVM – support vector machines); K vizinhos mais próximos (KNN – K-nearest neighbours). | | 2. Avaliação de modelos de classificação: treinamento, teste, validação; validação cruzada; métricas de avaliação - matriz de confusão, acurácia, precisão, revocação, F1-score e curva ROC. | | 3. Técnicas de regressão:Redes neurais para regressão; Árvores de decisão para regressão; Máquinas de vetores de suporte para regressão; | | 4. Ajuste de modelos dentro e fora de amostra e overfitting. | | 5. Técnicas de agrupamento: Agrupamento por partição, por densidade e hierárquico. | | 6. Técnicas de redução de dimensionalidade: Seleção de características (feature selection); Análise de componentes principais (PCA – principal component analysis). | | 7. Processamento de linguagem natural: Normalização textual - stop words, estemização, lematização e análise de frequência de termos; Rotulação de partes do discurso, part-of-speech tagging; Modelos de representação de texto - N-gramas, modelos vetoriais de palavras (CBOW, Skip-Gram e GloVe), modelos vetoriais de documentos (booleano, TF e TF-IDF, média de vetores de palavras e Paragraph Vector); Métricas de similaridade textual - similaridade do cosseno, distância euclidiana, similaridade de Jaccard, distância de Manhattan e coeficiente de Dice. | | 8. Redes neurais convolucionais e recorrentes. | | 9. Bibliotecas para machine learning: Scikit-learn; TensorFlow; PyTorch; Keras. |