Try   HackMD

09 :: Wizualizacja danych - warsztat "Igrzyska Olimpijskie"

tags: Wizualizacja danych + dashboardy Tableau

Cel ćwiczenia

Celem ćwiczenia jest porównanie różnych koncepcji wizualizacji dużej liczby danych ilustrujących liczbę sportowców startujących w igrzyskach olimpijaskich.

1. Struktura zbioru danych

Zbiór danych athleteevents.csv zawiera ponad 270 000 rekordów danych opisująych sportowców startujących w igrzyskach olimpijskich od roku 1896. Proszę po imporcie zbioru do Tableau sprawdzić poprawność przypisania typów danych do poszczególnych atrybutów (proszę zwrócić uwagę na geolokalizację).

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

1.1 Hierarachie w danych

W zaimportowanych danych obecne są relacje hierarchiczne, które warto na początku odpowiednio skonfigurować w systemie - proponowana hierarchia:

  • Season - rodzaj igrzysk olimpijskich (letnie/zimowe),
    • Sport - dyscyplina sportu,
      • Event - konkurencja w ramach dyscypliny sportu.

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

1.2 Funkcje agregujące: konwersja wymiarów -> miary

W celu wizualizacji liczby sportowców na kolejnych igrzyskach, należy skorzystać z jednej z funkcji agregujących dostępnych w systemie:

  • Sum
  • Average
  • Median
  • Count
  • Count (Distinct) - policz unikalne wartości wybranego atrybutu.

Atrybutem identyfikującym sportowca jest ID - unikalny numer przypisany osobie. W celu wizualizacji liczby sportowców w funkcji lat można użyć wymiarów i miar widocznych na rysunku poniżej.

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

Ponadto, warto sprawdzić typy danych i przyporządkowanie do kategorii miary/wymiary następujących atrybutów:

  • Weight (powinno być: miara, liczba całkowita),
  • Height (powinno być: miara, liczba całkowita),
  • Age (powinno być: miara, liczba całkowita).

2. Wybrane typy wizualizacji

2.1 Wykres złożony (liniowy + punktowy)

Wykres powinien ilustrować liczbę uczestników igrzysk w kolejnych latach z podziałem na płeć uczestnika.

2.2 Wykres powierzchniowy (+ punktowy)

J.w. - zmiana rodzaju wizualizacji na wykres powierzchniowy.

2.3 Wykres rozrzutu

Analiza zależności między wzrostem a wagą uczestników igrzysk, z podziałem na dyscypliny sportowe.