# 04 :: Techniki analityczne - linie trendu ###### tags: `Wizualizacja danych + dashboardy` `Tableau` [TOC] # Wprowadzenie - cel ćwiczenia Celem ćwiczenia jest zapoznanie się z wizualnymi funkcjami analitycznymi oferowanymi przez Tableau. # 1. Informacje podstawowe Dwa popularne podejścia do wizualnej analizy danych obejmują **wizualizację danych** i **analitykę wizualną**. Obie metody odgrywają bardzo ważną rolę w eksploracji danych. **Wizualizacja danych** to graficzne przedstawienie danych w postaci np. pulpitów nawigacyjnych lub raportów. Poszczególne wizualizacje przedstawiają widoki danych, które odpowiadają na pytania „co? i jak?”, np. „Jaka jest nasza sprzedaż i zyski dla różnych regionów i miesięcy lub lat? ” Wizualizacja danych zapewnia odpowiedzi na skończony zestaw pytań i dostarcza pewnej interaktywności podczas procesu eksploracji danych. Odpowiedź na pytania „co? i jak?” jest pierwszym krokiem w eksploracji danych - następny to pytanie „dlaczego?”. Aby proces eksploracji danych był głębszy i bardziej kompletny nalezy wykorzystać metody analityki. **Analityka wizualna** to bardziej przyjazna dla użytkownika i wykorzystująca w pełni możliwości technologiczne gałąź analityki danych. **Tabela 1** Różnice między procesami Wizualizacji danych i Analityki wizualnej. | Możliowość | Wizualizacja danych | Analityka wizualna | | ------------------------------ |:-------------------:| :------------------:| | Odpowiedź na pytaia: co?, jak? | X | X | |Ilustracja punktów danych, serii, KPI| X|X| |Wizualna prezentacja danych: kokpity, raporty|X|X| |Wsparcie dla interaktywności: filtry, highlitery, tooltip, drążenie danych|X|X| |Głębsza analiza, wsparce dla rozważań: dlaczego?||X| |Wsparcie dla zaawansowanych metody analitycznych||X| |Unifikacja procesu wizualizacja, eksploracji i kwerend danych||X| |Pomaga wizualnie myśleć o problemach i pytaniach. Prowadzi do nieoczekiwanych spostrzeżeń i pozwala na identyfikację wartości odstających w danych.||X| |Pomaga udostępniać kluczowe informacje i dostarcza narzędzi pracy grupowej z danymi||X| # 2. Narzędzia analityki wizualnej w Tableau Poniższy rysunek ilustruje narzędzia analityki wizualnej dostępne w kokpicie narzędziowym Tableau. ![](https://i.imgur.com/M0FUcAm.png) ## 2.1. Linie trendu Linie trendu służą do przewidywania kontynuacji określonego trendu analizowanej zmiennej. Linie trendu pomagają również zidentyfikować korelację między dwiema zmiennymi. Istnieje wiele modeli matematycznych do ustalania linii trendu - Tableau zapewnia pięć najczęściej wykorzystywanych opcji w tym zakresie, tj. trendy: liniowe, logarytmiczne, wykładnicze (2 rodzaje) i wielomianowe. ![](https://i.imgur.com/tg3TKMR.png) Poniższy materiał prezentuje sposób wykorzystania linii trendu dop analizy trendu dla danych dotyczących zależności mocy produkowanej energii od prędkości wiatru w elektrowniach wiatrowych. {%youtube 9z-uTFk86p0 %} ## 2.2. Statystyka W Tableau pojawiają się dwa parametry, któryc wartości pozwalają ocenić poprawność wybranego dopasowania linii trendu: * prawdopodobieństwo testowe - [(ang. p-value, probability value) – prawdopodobieństwo, że zależność jaką zaobserwowano w losowej próbie z populacji mogła wystąpić przypadkowo, wskutek losowej zmienności prób, choć w populacji wcale nie występuje. Jest to narzędzie służące jedynie do podstawowej kontroli błędów, i świadczy o wartości dowodowej danych jedynie pośrednio. ](https://pl.wikipedia.org/wiki/Warto%C5%9B%C4%87_p) * współczynnik determinacji - [Informuje o tym, jaka część zmienności (wariancji) zmiennej objaśnianej w próbie pokrywa się z korelacjami ze zmiennymi zawartymi w modelu. Jest on więc miarą stopnia, w jakim model pasuje do próby. Współczynnik determinacji przyjmuje wartości z przedziału [0;1] jeśli w modelu występuje wyraz wolny, a do estymacji parametrów wykorzystano metodę najmniejszych kwadratów. Jego wartości najczęściej są wyrażane w procentach. Dopasowanie modelu jest tym lepsze, im wartość R² jest bliższa jedności.](https://pl.wikipedia.org/wiki/Wsp%C3%B3%C5%82czynnik_determinacji) # 3. Ćwiczenie Proszę na podstawie danych dotyczących wartości ciśnienia skurczowego krwi (systolic blood pressure - SBP) dla poszczególnych grup wiekowych dopasowoać optymalne linie trendu dla kobiet (1) i mężczyzn (2). Proszę przygotować dashboard, który będzie prezentował ww. linie trendu wraz z wykresem wartości resztowych (rezydualnych). Ponadtow można na dashboardzie umieścić własny komentarz, hipotezę dotyczącą tego jak wiek wpływa na stan zdrowia przeciętnej kobiety/mężczyzny. Dane do realizacji ćwiczenia prezentuje poniższy rysunek (należy je przepisać w formacie akceptowealnym przez Tableau). ![](https://i.imgur.com/ZRg9rr9.jpg)