# Datavis ## welke groep zijn wij? (deadline 25/02) - 5 ## datasets + verhaaltje (deadline 02/03) - [x] irail (gegeven) - https://docs.irail.be/ - verschillende visualisaties - requests van verbindingen - [ ] satellite data spaceX - https://www.kaggle.com/jyotmakadiya/spacex-all-satellites-database - [x] spotify data - https://www.kaggle.com/yamaerenay/spotify-dataset-19212020-160k-tracks?select=data_by_artist.csv - I like - [ ] temp change - https://www.kaggle.com/sevgisarac/temperature-change?select=Environment_Temperature_change_E_All_Data_NOFLAG.csv - [ ] video games sales - https://www.kaggle.com/gregorut/videogamesales - [ ] chat data (zeus mattermoist) - [ ] vlaamschen overheid - [ ] https://www.census.gov/data/developers/data-sets.html - [x] Human Freedom Index / Our world in data - https://www.kaggle.com/gsutters/the-human-freedom-index?select=hfi_cc_2020.csv - https://ourworldindata.org/ ## insteek datasets - irail - vertragingen - visualisatie: - kaart - events/weer <> query log - visualisatie: - drukte van verbindingen - visualisatie: - kaart - top x lijst - live visualisatie van requests - lijntjes op een kaart van waar naar waar (liveboard api) - spotify - populariteit van 1 nummer tov gemiddelde eigenschappen - visualisatie: spinnenweb - verandering van populairste genres, artiesten, nummers... over de jaren heen - met visualisatie a la F1 driver movement dink - clusters van genres proberen maken adhv bepaalde eigenschappen - HFI - interactieve vergelijking van 2 landen - interactieve wereldkaart waarbij we eigenschappen kunnen selecteren en kleurtjes, bv algemene freedom index per land, aantal moorden... - gemiddelde eigenschappen (spinnenweb) ## 1. [Spotify](https://www.kaggle.com/yamaerenay/spotify-dataset-19212020-160k-tracks) We hebben een dataset met populariteit van bepaalde tracks en metadata over die tracks (tot welk genre ze behoren, hoelang ze duren, specifieke eigenschappen zoals 'danceability', 'acousticness'...). We zouden graag meer inzicht krijgen in wat een bepaald stuk muziek populair maakt en hoe metadata over de tracks verband houdt met elkaar. Zo zouden we kunnen kijken of er een verband is tussen de artiest en de populariteit of tussen het genre en de tijdsduur... Dit zou bijvoorbeeld gedaan kunnen worden aan de hand van een spinnenwebvisualisatie of een correlatiematrix. We kunnen ook de populariteit van bijvoorbeeld genres doorheen de jaren visualiseren met een grafiek zoals [bij een van de vorige projecten](https://restovisualisation.herokuapp.com/visualisations/popularity). Ook kunnen we proberen (interactief) clusters te ontdekken (van bijvoorbeeld genres, of artiesten) als we twee eigenschappen tegen elkaar plotten in een scatterplot. We zouden ons laten inspireren door deze visualisaties: [De Tijdloze Website](https://tijdloze.stijnshome.be/statistieken) (andere dataset) en de visualisaties van [Raghurai Kulkarni](https://www.raghuraikulkarni.com/spotify-top-100) (zelfde dataset maar niet zo duidelijk). Het doelpubliek voor deze visualisatie zijn mensen die geinteresseerd zijn in statistieken en trends in de muziekwereld en zou tractie kunnen krijgen op diverse muziekfora. ## 2. IRail We hebben een dataset met historische treinritten en hun aankomst/vertrekmomenten (NMBS). We zouden graag meer inzicht krijgen in vertragingen die deze treinen oplopen. Hiervoor zouden we bijvoorbeeld een visualisatie op een kaart kunnen gebruiken, met informatie zoals waar het grootst aantal vertragingen voorkomt, het aantal vertragingen per periode, lengte van de vertraging... Ook zouden we kunnen kijken of er een verband is tussen het weer en vertraging, of de vertraging afhangt van de drukte en de populariteit van routes doorheen de tijd. Nog een voorbeeld is het visualiseren van de drukte van verbindingen, dit kan opnieuw op een kaart of bijvoorbeeld een interactieve oplijsting van de drukste of minst drukke verbindingen en stations. Een laatste visualisatie waar we al aan dachten is live tonen welke requests er worden gemaakt. We zouden ons laten inspireren door de visualisatie op [trainmap](https://trainmap.belgiantrain.be/) die iets gelijkaardig gedaan hebben. Het doelpubliek voor deze visualisatie zou mensen zijn die regelmatig treinen nemen. Het eindresultaat zou met een beetje geluk op de website van de NMBS komen. ## 3. Human Freedom Index We hebben een dataset met informatie over de vrijheid in verschillende landen. We zouden graag wat meer inzicht krijgen in deze informatie. Zo zouden we kunnen kijken of er een verband is tussen de genderongelijkheid en vrijheid van een land, of bepaalde factoren regiogebonden zijn. Verder zouden we een interactieve vergelijking maken tussen 2 landen/regios (het kan bijvoorbeeld interessant zijn om België te vergelijken met de rest van de wereld). Een andere mogelijke visualisatie is het tonen van een wereldkaart waarop we het niveau van een bepaalde eigenschap aanduiden met een kleur-gradiënt, de te tonen eigenschap zou hier dan interactief kunnen gekozen worden. Een laatste idee is gelijkaardig aan het eerste voorbeeld, maar dan met een spinnenweb visualisatie, de gebruiker zou de eigenschappen kunnen kiezen die worden vergeleken, samen met 2 of meerdere regio's/landen, daarvan worden dan spinnenwebvisualisaties gegenereerd en over elkaar/naast elkaar getoond. We zouden ons laten inspireren door visualisaties van [cato.org](https://www.cato.org/human-freedom-index/2020) en [Wikipedia](https://en.wikipedia.org/wiki/Human_Development_Index). Het doelpubliek voor deze visualisatie zou politici en vrijheidsorganisaties zijn. Het eindresultaat zou kunnen opgepikt worden op de website van vrijheidsorganisaties, zoals Amnesty International. ## Paginas Wij zien onze webpagina voor met een aantal tabs die bepaalde visualisaties zal houden. Voor elke tab bespreken we kort de ideeën die we hebben. ### Verloop over tijd Deze pagina zal de visualisaties bevatten van hoe bepaalde eigenschappen over tijd evolueren. Dit kan inzicht geven over de evolutie van de muziekwereld. ***Bump chart (populariteit van een nummer/eigenschap/... over tijd)*** ![](https://cdn.discordapp.com/attachments/812681199864250391/821016471521329172/vis1-2.png) ***Radar chart (eigenschappen, 1 lijn per jaar)*** ![](https://i.imgur.com/Edz5uXa.png) ***Line chart (populariteit over tijd, met belangrijke gebeurtenissen aangeduid)*** ![](https://media.discordapp.net/attachments/812681199864250391/821027797140504667/unknown.png) ***Dot plot (x: jaartal, y: eigenschap, grootte van dot: voorkomen)*** ![](https://cdn.discordapp.com/attachments/812681199864250391/821024987989147659/unknown.png) ### Vergelijkingen Op deze pagina vergelijken we twee genres, artiesten, nummers, ... om zo gelijkenissen of verschillen te vinden. ***Radar chart (eigenschappen, 1 lijn per genre, artiest, nummer, ...)*** ![](https://i.imgur.com/Edz5uXa.png) ***Pie chart (voor elke artiest van genre X, welke andere genres heeft die persoon ook gemaakt)*** ![](https://cdn.discordapp.com/attachments/812681199864250391/821022086209994752/vis3.png) ### Rest Hier staan andere interessante visualisaties die niet in een van de andere pagina's pasten. ***Correlatiematrix eigenschap vs eigenschap (totalen, per genre, per artiest)*** ![](https://media.discordapp.net/attachments/812681199864250391/821012853275492402/GVulx.png) ***Scatterplot: populariteit / eigenschap*** ![](https://cdn.discordapp.com/attachments/812681199864250391/821033561729531914/unknown.png) ## Uiteindelijke pagina's ### Linken tussen genres (Karel en Jasper) - force directed graph - artiesten en hun andere genres - pie chart - correlatiematrix ### Evolutie over tijd (Bram en Ruben) - top genres - nieuwe genres onstaan - force directed graph - gebeurtenissen en hun invloed op de muziek - evolutie features over tijd ### songfinder 9000 (Robbe en Jan-Pieter)