<style> .reveal { font-size: 30px; } </style> # Data-driven research --- ## Agenda - cel zajęć - plan zajęć - zasady zaliczenia - przykłady data-driven research --- ### O nas - [DELab UW](https://www.delab.uw.edu.pl/) - Projekty doktorskie: Airbnb | prywatność w sieci - Python :snake: jako główne środowisko pracy - Web scraping & text-mining: - [Next Generation Internet](fwd.delabapps.eu) - Web scraping & ekonometria: - Eurostat (price indices) --- ### O kursie - część ścieżki Gospodarka Cyfrowa - bliźniaczy kurs: Zastosowania języka Python --- #### Cele zajęć - Rozwój umiejętności analizy oraz prezentacji danych w sposób zgodny z <b>metodologią naukową</b> i <b>atrakcyjny dla biznesu</b>. - Poznanie interesujących źródeł danych dot. rozwoju gospodarki cyfrowej --- ### Plan zajęć 1. Zajęcia wprowadzające 2. Bazy danych. Publicznie dostępne dane. 3. Google BigQuery 4. Analiza eksploracyjna 5. Nowe źródła danych oraz wykorzystanie metod web-scrapingu 6. Prezentacja: plan badania, pytania badawcze, dane 7. Analiza danych oraz przygotowanie atrakcyjnych wizualizacji (I) 8. Analiza danych oraz przygotowanie atrakcyjnych wizualizacji (II) 9. Prezentacja pogłębionej analizy danych z wykorzystaniem metod data science I 10. Prezentacja pogłębionej analizy danych z wykorzystaniem metod data science II 11. Analiza danych tekstowych 12. Prezentacje prac zaliczeniowych 13. Prezentacje prac zaliczeniowych II --- ### Projekt zaliczeniowy - Cel: Atrakcyjne zaprezentowanie pracy naukowej w oparciu o dane internetowe z wykorzystaniem narzędzi Pythonowych - Wynik: prezentacja podsumowująca analizę - ok. 15 min - Praca na wzór artykułów naukowych - Struktura: - Wstęp: pytanie badawcze, cel pracy - Dane, Metodologia: krótki opis bazy danych, źródeł i metodologii - Statystyki opisowe, wizualizacje - Wyniki: prezentacja rezultatów i wniosków - Podsumowanie - Praca w zespołach 2-3 osobowych lub praca indywidualna (po uzgodnieniu) - Zasady oceny i terminy będą wkrótce ogłoszone --- ### Jakie tematy? - Tematy związane z rozwojem gospodarki cyfrowej - przede wszystkim dot. wyzwań społecznych związanych z <b>rozwojem technologii internetowych</b>, - Wkład do pracy magisterskiej/licencjackiej - Możliwość łączenia zaliczenia z przedmiotem Zastosowania języka Python! - format pracy pozostaje taki sam, ale wyniki będzie można wykorzystać jako wkład do pracy zaliczeniowej z Zastosowania języka Python - Na tych zajęciach koncentrujemy się na aspektach merytorycznych oraz prezentacyjnych - Na zajęciach Zastosowanie języka Python oceniać będziemy głównie stronę techniczną/programistyczną projektów --- ### Next Generation Internet - Strategia KE dot. rozwoju technologii ICT w UE - Jakie są społeczne wyzwania związane z cyfryzacją? - Nasze prezentacje - Trendy - COVID-19 - Analiza tematów --- ### NGI Hackathon - NGI Forward: nasz międzynarodowy projekt - Eksperci z róznym backroundem: - Nesta: consulting i policy - Edgeryders: analiza sieci w dyskusjach hackerskich - Aarhus University: socjologia cyfrowa - Udział w projekcie dla chętnych! - Zaliczenie DDR oraz ZJP z połączoną pracą zaliczeniową - Tematyka: wkrótce udostępnimy Wam szeroką listę tematów oraz źródeł danych - Możliwość zaproponowania autorskich pomysłów - Prezentacja prac dla jurorów z projektu --- ### Zasady zaliczenia - Praca zaliczeniowa: 100% ```csvpreview {header="true"} Przedziały %,ocena (0-50),2 [50-60),3 [60-70),3+ [70-80),4 [80-90),4+ [90-100],5 ``` --- ### Środowisko kursu - Główna platforma do organizacji pracy: Moodle - Zajęcia na Zoomie - Skrypty z ZJP będą udostępnione na Gitlabie: https://gitlab.com/wne-courses/digital-economy-tutorials --- ### Python - Python 3+ (np. 3.8) - Pomocny tutorial do instalacji przez menadżer pakietów Conda: https://github.com/macwilam/KursPython - Instalujcie pakiety przed zajęciami! - Skrypty zawsze zaczynają się od listy pakietów - 2 planowane środowiska: - Jupyter notebook/lab - Kaggle --- ## Ankieta https://www.menti.com/bnvwfopd3r --- ### Kaggle - Prosimy o założenie konta: [link do rejestracji](https://www.kaggle.com/account/login?phase=startRegisterTab&returnUrl=%2F) --- ### Przykładowe źródła danych - https://www.kaggle.com/datasets - https://projects.fivethirtyeight.com/ - https://opendatamonitor.eu/frontend/web/index.php?r=dashboard%2Findex - https://datasetsearch.research.google.com/ - https://www.google.com/publicdata/directory - https://registry.opendata.aws/ - https://wiki.dbpedia.org/ - https://zenodo.org/communities/ngi_forward/
{"metaMigratedAt":"2023-06-15T19:50:37.620Z","metaMigratedFrom":"YAML","title":"Data-driven research- Intro","breaks":true,"description":"Intro","slideOptions":"{\"transition\":\"slide\"}","contributors":"[{\"id\":\"8b999831-3930-4ead-8913-6e39a724b825\",\"add\":3199,\"del\":3064},{\"id\":\"715bbb0d-276c-4882-8dd4-688a9eeb82e2\",\"add\":3907,\"del\":1623}]"}
    213 views