# 03 :: Eurostat, GUS - praca z różnymi źródłami danych ###### tags: `Wizualizacja danych + dashboardy` `Tableau` [TOC] # Cel ćwiczenia Celem ćwiczenia jest wprowadzenie w techniki przetwarzania danych pochodzących z najpopularniejszych serwisów statystycznych. # 1. EUROSTAT ## 1.1 Lokalizacja i struktura bazy danych Baza danych EUROSTAT jest zorganizowana w postaci hierarchicznego drzewa, do którego dostęp można uzyskać wybierając opcję **Complete database** (rysunek poniżej). ![](https://i.imgur.com/P9627gW.png) Załóżmy, że inetersują nas dane dotyczące liczby studentów w poszczególnych krajach na 1 i 2 stopniu studiów, w całym dostępnym przedziale czasowym. > Seria danych: > **Pupils and students enrolled by education level, sex and field of education (educ_uoe_enra03)** ![](https://i.imgur.com/JZen1cX.png) ## 1.2 Dostęp do danych - narzędzia online ### 1.2.1 Data explorer #### Wybór Państw ![](https://i.imgur.com/ho3LQt0.png) #### Wybór serii danych ![](https://i.imgur.com/jlIF6hD.png) #### Wybór specjalności ![](https://i.imgur.com/TGlOXT2.png) #### Płeć ![](https://i.imgur.com/eGU8lJt.png) #### Przedział czasowy ![](https://i.imgur.com/Rsf1QUk.png) #### Format pobieranych danych ![](https://i.imgur.com/ieQwrWZ.png) ### 1.2.2 Data browser **Data browser** jest najnowszym narzędziem do exploracji bazy danych Eurostat. Najważniejsze cechy narzędzia oraz porównanie do starszego **Data explorer'a** można znaleźć [tutaj](https://ec.europa.eu/eurostat/online-help/first-visit/first-visit_en.html#/). # 2. Bank Danych Lokalnych GUS Przygotowujemy iustrację podobną jak w przypadku Eurostat - liczba studentów w poszczególnych województwach, w kolejnych latach. Pobieramy dane dla województw. Celem jest przygotowanie wizualizacji wskaźnika względnego: liczba studentów na 1 000 mieszkańców. W tym celu należy pobrać dwa zbiory danych, ejedn dotyczący liczby mieszkańców, drugi liczby studentów. Analizujemy dane w możliwie długiej perspektywie czasowej (od 2012 roku). # 2.1 Gałęzie danych # 2.1.1 Liczba ludności ![](https://i.imgur.com/POo7InE.png) # 2.1.2 Liczba studentów w województwach ![](https://i.imgur.com/6uue4Sr.png) # 2.2 Format pobieranych danych Proponuję pobranie danych w formacie tablicy relacyjnej (XLS lub CSV). Dane z dwóch pobranych źródeł należy następnie odpowiednio połączyć. ![](https://i.imgur.com/uOrXNnS.png) # 2.3 Proponowana wizualizacja ![](https://i.imgur.com/EpaRIEk.png)