# 04 :: Techniki analityczne - linie trendu
###### tags: `Wizualizacja danych + dashboardy` `Tableau`
[TOC]
# Wprowadzenie - cel ćwiczenia
Celem ćwiczenia jest zapoznanie się z wizualnymi funkcjami analitycznymi oferowanymi przez Tableau.
# 1. Informacje podstawowe
Dwa popularne podejścia do wizualnej analizy danych obejmują **wizualizację danych** i **analitykę wizualną**. Obie metody odgrywają bardzo ważną rolę w eksploracji danych.
**Wizualizacja danych** to graficzne przedstawienie danych w postaci np. pulpitów nawigacyjnych lub raportów. Poszczególne wizualizacje przedstawiają widoki danych, które odpowiadają na pytania „co? i jak?”, np. „Jaka jest nasza sprzedaż i zyski dla różnych regionów i miesięcy lub lat? ”
Wizualizacja danych zapewnia odpowiedzi na skończony zestaw pytań i dostarcza pewnej interaktywności podczas procesu eksploracji danych.
Odpowiedź na pytania „co? i jak?” jest pierwszym krokiem w eksploracji danych - następny to pytanie „dlaczego?”. Aby proces eksploracji danych był głębszy i bardziej kompletny nalezy wykorzystać metody analityki. **Analityka wizualna** to bardziej przyjazna dla użytkownika i wykorzystująca w pełni możliwości technologiczne gałąź analityki danych.
**Tabela 1** Różnice między procesami Wizualizacji danych i Analityki wizualnej.
| Możliowość | Wizualizacja danych | Analityka wizualna |
| ------------------------------ |:-------------------:| :------------------:|
| Odpowiedź na pytaia: co?, jak? | X | X |
|Ilustracja punktów danych, serii, KPI| X|X|
|Wizualna prezentacja danych: kokpity, raporty|X|X|
|Wsparcie dla interaktywności: filtry, highlitery, tooltip, drążenie danych|X|X|
|Głębsza analiza, wsparce dla rozważań: dlaczego?||X|
|Wsparcie dla zaawansowanych metody analitycznych||X|
|Unifikacja procesu wizualizacja, eksploracji i kwerend danych||X|
|Pomaga wizualnie myśleć o problemach i pytaniach. Prowadzi do nieoczekiwanych spostrzeżeń i pozwala na identyfikację wartości odstających w danych.||X|
|Pomaga udostępniać kluczowe informacje i dostarcza narzędzi pracy grupowej z danymi||X|
# 2. Narzędzia analityki wizualnej w Tableau
Poniższy rysunek ilustruje narzędzia analityki wizualnej dostępne w kokpicie narzędziowym Tableau.

## 2.1. Linie trendu
Linie trendu służą do przewidywania kontynuacji określonego trendu analizowanej zmiennej. Linie trendu pomagają również zidentyfikować korelację między dwiema zmiennymi. Istnieje wiele modeli matematycznych do ustalania linii trendu - Tableau zapewnia pięć najczęściej wykorzystywanych opcji w tym zakresie, tj. trendy: liniowe, logarytmiczne, wykładnicze (2 rodzaje) i wielomianowe.

Poniższy materiał prezentuje sposób wykorzystania linii trendu dop analizy trendu dla danych dotyczących zależności mocy produkowanej energii od prędkości wiatru w elektrowniach wiatrowych.
{%youtube 9z-uTFk86p0 %}
## 2.2. Statystyka
W Tableau pojawiają się dwa parametry, któryc wartości pozwalają ocenić poprawność wybranego dopasowania linii trendu:
* prawdopodobieństwo testowe - [(ang. p-value, probability value) – prawdopodobieństwo, że zależność jaką zaobserwowano w losowej próbie z populacji mogła wystąpić przypadkowo, wskutek losowej zmienności prób, choć w populacji wcale nie występuje. Jest to narzędzie służące jedynie do podstawowej kontroli błędów, i świadczy o wartości dowodowej danych jedynie pośrednio. ](https://pl.wikipedia.org/wiki/Warto%C5%9B%C4%87_p)
* współczynnik determinacji - [Informuje o tym, jaka część zmienności (wariancji) zmiennej objaśnianej w próbie pokrywa się z korelacjami ze zmiennymi zawartymi w modelu. Jest on więc miarą stopnia, w jakim model pasuje do próby. Współczynnik determinacji przyjmuje wartości z przedziału [0;1] jeśli w modelu występuje wyraz wolny, a do estymacji parametrów wykorzystano metodę najmniejszych kwadratów. Jego wartości najczęściej są wyrażane w procentach. Dopasowanie modelu jest tym lepsze, im wartość R² jest bliższa jedności.](https://pl.wikipedia.org/wiki/Wsp%C3%B3%C5%82czynnik_determinacji)
# 3. Ćwiczenie
Proszę na podstawie danych dotyczących wartości ciśnienia skurczowego krwi (systolic blood pressure - SBP) dla poszczególnych grup wiekowych dopasowoać optymalne linie trendu dla kobiet (1) i mężczyzn (2). Proszę przygotować dashboard, który będzie prezentował ww. linie trendu wraz z wykresem wartości resztowych (rezydualnych). Ponadtow można na dashboardzie umieścić własny komentarz, hipotezę dotyczącą tego jak wiek wpływa na stan zdrowia przeciętnej kobiety/mężczyzny.
Dane do realizacji ćwiczenia prezentuje poniższy rysunek (należy je przepisać w formacie akceptowealnym przez Tableau).
