<style>
.reveal {
font-size: 30px;
}
</style>
# Zastosowania języka Python
---
### Agenda
- cele zajęć
- plan zajęć
- zasady zaliczenia
- wymagane narzędzia
---
### O nas
- [DELab UW](https://www.delab.uw.edu.pl/)
- Projekty doktorskie: Airbnb | prywatność w sieci
- Python :snake: jako główne środowisko pracy
- Web scraping & text-mining:
- [Next Generation Internet](https://fwd.delabapps.eu)
- Web scraping & ekonometria:
- Eurostat (price indices)
---
### O kursie
- część ścieżki Gospodarka Cyfrowa
- kontynuacja kursu "Wprowadzenie do programowania w j. Python"
- bliźniaczy kurs: Data-driven research
---
#### Cele zajęć
- Wsparcie w wykorzystaniu Pythona w pracy badawczej - np. w pracy lic./mag.
- Skrócenie Wam czasu spędzonego na przeglądaniu Stackoverflow

---
## Ankieta
https://www.menti.com/uzjetx41zx
---
<!-- .slide: data-background="#eee" -->
#### Schemat pracy
```graphviz
digraph hierarchy {
// [bgcolor=Black]
nodesep=1.0 // increases the separation between nodes
node [color=Red,fontname=Courier,shape=box] //All nodes will this shape and colour
edge [color=Blue, style=dashed] //All the lines look like this
"Pobranie danych"->{"Czyszczenie"}
"Czyszczenie"->{Eksploracja Wizualizacja}
"Eksploracja"->{"Modelowanie | Analiza"}
"Wizualizacja"->{"Modelowanie | Analiza"}
"Modelowanie | Analiza"->{Prezentacja}
{rank=same;} // Put them on the same level
}
```
---
<!-- .slide: style="font-size: 26px;" -->
### Plan zajęć
1. Zajęcia wprowadzające
2. Pandas & SQL
3. Web scraping I - API do platform społecznościowych
4. Web scraping II - Selenium webdriver
5. Wizualizacja danych I - Matplotlib, Seaborn
6. Wizualizacja danych II - Plotly, Dash
7. ML I - regresje, xgboost
8. ML II - algorytmy klastrujące
9. Text-mining I - wprowadzenie
10. Text-mining II - LDA| analiza z użyciem modelowania tematycznego
11. Text-mining III - t-SNE | analiza z użyciem klastrowania tekstów
12. Prezentacje prac zaliczeniowych
13. Prezentacje prac zaliczeniowych
---
### Zasady zaliczenia
- Praca zaliczeniowa: 70%, 3 prace domowe: 30%
```csvpreview {header="true"}
Przedziały %,ocena
(0-50),2
[50-60),3
[60-70),3+
[70-80),4
[80-90),4+
[90-100],5
```
---
<!-- .slide: style="font-size: 26px;" -->
### Projekt zaliczeniowy
- Cel: zastosowanie Pythona do analizy danych
- Wynik: raport podsumowujący analizę + prezentacja
- Praca na wzór artykułów naukowych
- Struktura:
- Wstęp: pytanie badawcze, cel pracy
- Dane: opis bazy danych i prezentacja źródeł, statystyki opisowe, wizualizacje
- Metodologia: opis metod badawczych
- Wyniki: prezentacja rezultatów i wniosków
- Podsumowanie
- Praca w zespołach 2-3 osobowych lub praca indywidualna (po uzgodnieniu)
- Zasady oceny i terminy będą wkrótce ogłoszone
---
### Jakie tematy?
- wkład do pracy magisterskiej/licencjackiej
- rozwinięcie tematów omawianych na zajęciach (np. text-mining, ML)
- autorski pomysł
- możliwość łączenia zaliczenia z Data-Driven Research!
- format pracy pozostaje taki sam, ale wyniki będzie można wykorzystać jako wkład do pracy zaliczeniowej z DDR
- Na tych zajęciach koncentrujemy się na stronie technicznej (zastosowanie narzędzi Pythonowych)
- Na zajęciach DDR oceniać będziemy bardziej prezentację problemu badawczego, wizualizację danych i warsztat badawczy
---
### Prace domowe
- krótkie zadania do rozwiązania
- 3 oceny
- 1: poprawny kod
- 0.5: kod z błędami
- 0: niepoprawny kod
---
### Środowisko kursu
- Główna platforma do organizacji pracy: Moodle
- Zajęcia na Zoomie
- Skrypty będą udostępnione na Gitlabie: https://gitlab.com/wne-courses/digital-economy-tutorials
---
### Python
- Python 3+ (np. 3.8)
- Pomocny tutorial do instalacji przez menadżer pakietów Conda: https://github.com/macwilam/KursPython
- Instalujcie pakiety przed zajęciami!
- Skrypty zawsze zaczynają się od listy pakietów
- 2 planowane środowiska:
- Jupyter notebook/lab
- Kaggle
---
### Kaggle
- Prosimy o założenie konta: [link do rejestracji](https://www.kaggle.com/account/login?phase=startRegisterTab&returnUrl=%2F)
---
### Przykładowe źródła danych
- https://www.kaggle.com/datasets
- https://projects.fivethirtyeight.com/
- https://opendatamonitor.eu/frontend/web/index.php?r=dashboard%2Findex
- https://datasetsearch.research.google.com/
- https://www.google.com/publicdata/directory
- https://registry.opendata.aws/
- https://wiki.dbpedia.org/
- https://zenodo.org/communities/ngi_forward/
{"metaMigratedAt":"2023-06-15T19:50:36.275Z","metaMigratedFrom":"YAML","title":"Zastosowania języka Python","breaks":true,"description":"Intro","slideOptions":"{\"transition\":\"slide\"}","contributors":"[{\"id\":\"715bbb0d-276c-4882-8dd4-688a9eeb82e2\",\"add\":2547,\"del\":679},{\"id\":\"8b999831-3930-4ead-8913-6e39a724b825\",\"add\":3933,\"del\":3284}]"}