<style>
.reveal {
font-size: 30px;
}
</style>
# Data-driven research
---
## Agenda
- cel zajęć
- plan zajęć
- zasady zaliczenia
- przykłady data-driven research
---
### O nas
- [DELab UW](https://www.delab.uw.edu.pl/)
- Projekty doktorskie: Airbnb | prywatność w sieci
- Python :snake: jako główne środowisko pracy
- Web scraping & text-mining:
- [Next Generation Internet](fwd.delabapps.eu)
- Web scraping & ekonometria:
- Eurostat (price indices)
---
### O kursie
- część ścieżki Gospodarka Cyfrowa
- bliźniaczy kurs: Zastosowania języka Python
---
#### Cele zajęć
- Rozwój umiejętności analizy oraz prezentacji danych w sposób zgodny z <b>metodologią naukową</b> i <b>atrakcyjny dla biznesu</b>.
- Poznanie interesujących źródeł danych dot. rozwoju gospodarki cyfrowej
---
### Plan zajęć
1. Zajęcia wprowadzające
2. Bazy danych. Publicznie dostępne dane.
3. Google BigQuery
4. Analiza eksploracyjna
5. Nowe źródła danych oraz wykorzystanie metod web-scrapingu
6. Prezentacja: plan badania, pytania badawcze, dane
7. Analiza danych oraz przygotowanie atrakcyjnych wizualizacji (I)
8. Analiza danych oraz przygotowanie atrakcyjnych wizualizacji (II)
9. Prezentacja pogłębionej analizy danych z wykorzystaniem metod data science I
10. Prezentacja pogłębionej analizy danych z wykorzystaniem metod data science II
11. Analiza danych tekstowych
12. Prezentacje prac zaliczeniowych
13. Prezentacje prac zaliczeniowych II
---
### Projekt zaliczeniowy
- Cel: Atrakcyjne zaprezentowanie pracy naukowej w oparciu o dane internetowe z wykorzystaniem narzędzi Pythonowych
- Wynik: prezentacja podsumowująca analizę - ok. 15 min
- Praca na wzór artykułów naukowych
- Struktura:
- Wstęp: pytanie badawcze, cel pracy
- Dane, Metodologia: krótki opis bazy danych, źródeł i metodologii
- Statystyki opisowe, wizualizacje
- Wyniki: prezentacja rezultatów i wniosków
- Podsumowanie
- Praca w zespołach 2-3 osobowych lub praca indywidualna (po uzgodnieniu)
- Zasady oceny i terminy będą wkrótce ogłoszone
---
### Jakie tematy?
- Tematy związane z rozwojem gospodarki cyfrowej
- przede wszystkim dot. wyzwań społecznych związanych z <b>rozwojem technologii internetowych</b>,
- Wkład do pracy magisterskiej/licencjackiej
- Możliwość łączenia zaliczenia z przedmiotem Zastosowania języka Python!
- format pracy pozostaje taki sam, ale wyniki będzie można wykorzystać jako wkład do pracy zaliczeniowej z Zastosowania języka Python
- Na tych zajęciach koncentrujemy się na aspektach merytorycznych oraz prezentacyjnych
- Na zajęciach Zastosowanie języka Python oceniać będziemy głównie stronę techniczną/programistyczną projektów
---
### Next Generation Internet
- Strategia KE dot. rozwoju technologii ICT w UE
- Jakie są społeczne wyzwania związane z cyfryzacją?
- Nasze prezentacje
- Trendy
- COVID-19
- Analiza tematów
---
### NGI Hackathon
- NGI Forward: nasz międzynarodowy projekt
- Eksperci z róznym backroundem:
- Nesta: consulting i policy
- Edgeryders: analiza sieci w dyskusjach hackerskich
- Aarhus University: socjologia cyfrowa
- Udział w projekcie dla chętnych!
- Zaliczenie DDR oraz ZJP z połączoną pracą zaliczeniową
- Tematyka: wkrótce udostępnimy Wam szeroką listę tematów oraz źródeł danych
- Możliwość zaproponowania autorskich pomysłów
- Prezentacja prac dla jurorów z projektu
---
### Zasady zaliczenia
- Praca zaliczeniowa: 100%
```csvpreview {header="true"}
Przedziały %,ocena
(0-50),2
[50-60),3
[60-70),3+
[70-80),4
[80-90),4+
[90-100],5
```
---
### Środowisko kursu
- Główna platforma do organizacji pracy: Moodle
- Zajęcia na Zoomie
- Skrypty z ZJP będą udostępnione na Gitlabie: https://gitlab.com/wne-courses/digital-economy-tutorials
---
### Python
- Python 3+ (np. 3.8)
- Pomocny tutorial do instalacji przez menadżer pakietów Conda: https://github.com/macwilam/KursPython
- Instalujcie pakiety przed zajęciami!
- Skrypty zawsze zaczynają się od listy pakietów
- 2 planowane środowiska:
- Jupyter notebook/lab
- Kaggle
---
## Ankieta
https://www.menti.com/bnvwfopd3r
---
### Kaggle
- Prosimy o założenie konta: [link do rejestracji](https://www.kaggle.com/account/login?phase=startRegisterTab&returnUrl=%2F)
---
### Przykładowe źródła danych
- https://www.kaggle.com/datasets
- https://projects.fivethirtyeight.com/
- https://opendatamonitor.eu/frontend/web/index.php?r=dashboard%2Findex
- https://datasetsearch.research.google.com/
- https://www.google.com/publicdata/directory
- https://registry.opendata.aws/
- https://wiki.dbpedia.org/
- https://zenodo.org/communities/ngi_forward/
{"metaMigratedAt":"2023-06-15T19:50:37.620Z","metaMigratedFrom":"YAML","title":"Data-driven research- Intro","breaks":true,"description":"Intro","slideOptions":"{\"transition\":\"slide\"}","contributors":"[{\"id\":\"8b999831-3930-4ead-8913-6e39a724b825\",\"add\":3199,\"del\":3064},{\"id\":\"715bbb0d-276c-4882-8dd4-688a9eeb82e2\",\"add\":3907,\"del\":1623}]"}