---
title: Projetos da Disciplina
tags: SENAC2023
---
## Descrição
O objetivo desse seminário é que os grupos possam utilizar o conhecimento adquirido sobre algoritmos de Machine Learning para a construção de uma solução de análise de dados utilizando conjuntos abertos de dados.
A implementação dessa solução pode ser feita utilizando qualquer linguagem de programação. O aluno deve construir um Jupyter Notebook utilizando um servidor local ou [Google Colab](https://colab.to).
### Apresentação de seminário
* Apresentação por grupo: **15 ~ 25 minutos**;
* **Todos os membros** devem apresentar;
* Apresentação da **implementação**;
* Disponibilização do código do Notebook implementado na plataforma [Github](https://github.com);
* Lista de dificuldades;
### Confecção e entrega de um artigo
* Pelo menos 5 páginas;
* Pelo menos 7 referências (**artigos científicos publicados em conferências e revistas**);
* Links para documentação ou exemplos de código **não contam como referências**;
#### Estrutura proposta:
**Introdução**: descrição do problema que se está tentando resolver, explicações sobre os conceitos envolvidos (técnicas, descrição do conjunto de dados).
**Solução Proposta**: descrição da solução em termo de um fluxograma;
**Referências**;
## Temas dos Projetos
#### 1. Detectando casos de Depressão em Tweets;
Descobrir se uma pessoa está deprimida pelo uso de palavras nas mídias sociais pode definitivamente ajudar na cura!
Nesse projeto os alunos devem utilizar o dataset disponível no [kaggle](https://www.kaggle.com/datasets/gargmanas/sentimental-analysis-for-tweets) para realizar a análise de sentimentos em dados vindos do Twitter.
Nesse projeto as principais habilidades a serem exercitadas estão relacionadas ao Processamento de Linguagem Natural;
#### 2. Detectando casos de COVID a partir de imagens de Tomografia
O objetivo deste conjunto de dados é incentivar a pesquisa e o desenvolvimento de métodos de inteligência artificial capazes de identificar se uma pessoa está infectada pelo SARS-CoV-2 por meio da análise de suas tomografias computadorizadas.
O dataset em questão está disponível no [Kaggle](https://www.kaggle.com/datasets/plameneduardo/sarscov2-ctscan-dataset) e foi coletado de pacientes reais em hospitais no estado de São Paulo.
Nesse projeto, as principais habilidades a serem exercitadas estão relacionadas ao Processamento de Imagens e a utilização de modelos de Deep Learning para classificação;
#### 3. Detecção de fraudes em transações de Cartão de Crédito
É importante que as empresas de cartão de crédito sejam capazes de reconhecer transações fraudulentas com cartão de crédito para que os clientes não sejam cobrados por itens que não compraram.
Esse [conjunto de dados](https://www.openml.org/search?type=data&sort=runs&id=42175&status=active) está disponível após passar pelo algoritmo PCA. Isso garante o anonimato.
Nesse projeto, o maior desafio será lidar com classes desbalanceadas. Aqui podem ser utilizadas uma gama de algoritmos para análise de dados, além de estratégias para otimização de hiperparâmetros e combinação de classificadores.