Datavisualisatie: welke tool kan ik het beste gebruiken?

De exponentiële toename van data zorgt ervoor dat we steeds meer kunnen meten en inzichtelijk kunnen maken. Voor veel mensen is data echter een abstract gegeven. Datavisualisatie zorgt ervoor dat we data leesbaarder en tastbaarder kunnen maken. Datavisualisatie is ook een manier om een meer datagedreven cultuur te stimuleren binnen jouw organisatie. Het creëren van rapporten, grafieken en dashboards zorgt ervoor dat er meer wordt gedacht vanuit een dataperspectief. Hierdoor zet je de eerste stap richting het accepteren van een datacultuur binnen jouw organisatie. 

Er zijn veel verschillende visualisatietools beschikbaar. Welke tool is het meest geschikt voor welke situatie? Om een gerichte keuze te kunnen maken over welke tool ingezet dient te worden bij een (toekomstig) project, is het handig een globaal beeld te hebben over de mogelijkheden en de voor- en nadelen van de gebruikelijke datavisualisatietools. Welke tool het meest geschikt is voor jouw project is voornamelijk afhankelijk van het doel dat je wilt bereiken. Hieronder maak ik een globale vergelijking tussen de drie tools die wij in ons werk vaak gebruiken: R-Shiny, R-Markdown en Power BI. Daarbij kijk ik naar de functionaliteit, gebruiksvriendelijkheid, kosten en andere voor- en nadelen voor een organisatie. 

Algemene tips bij datavisualisatie

Voordat je begint is het handig om van tevoren na te denken over de doelgroep die je wilt aanspreken en welk doel je wilt bereiken met jouw visualisatie. Wat is de (achtergrond)kennis van de groep, op technisch vlak en in het toepassingsgebied? Wil je dat de gebruikers zelf op zoek gaan in de data of wil je gericht inzicht en conclusies geven? Welke boodschap wil je overbrengen, wat voor soort visualisatie past het beste bij jouw data en is de betekenis en context voor iedereen duidelijk? Ook is het handig om de volgende richtlijnen in je achterhoofd te houden: stop alleen de nodige informatie in je grafiek, probeer maar één technisch aspect tegelijk te vertellen en maak van je visualisatie geen designwedstrijd.

R-Shiny 

Shiny is een package in R om dashboards mee te ontwerpen. Dit is handig wanneer je (machine learning) modellen of andere berekeningen in R hebt gemaakt en je de resultaten wilt weergeven in een dashboard. In het dashboard kan de gebruiker input geven waarmee berekeningen opnieuw uitgevoerd kunnen worden. Hiermee kan je de resultaten van een data-analyse naar wensweergeven in een interactief dashboard. Een mogelijk nadeel voor het gebruiken van een Shiny-dashboard is dat je moet kunnen programmeren in R. Binnen jouw organisatie moet er dan dus wel iemand in dienst zijn die dit kan. De technische complexiteit zorgt er echter wel voor dat je veel vrijheid hebt in je ontwerp. In R zijn veel goede packages beschikbaar voor verschillende visualisatiedoeleinden, denk aan het weergeven van data over tijd (dygraphs) of geografische data (leaflet). R is gratis, open source en wordt goed onderhouden. Als de standaard functionaliteiten of de layout van Shiny niet voldoen aan je wensen, kan je ook nog aan de slag met JavaScript, CSS of HTML. 

Een voorbeeld van een toepassing met R-Shiny is de klantcase bij Drents Overijsselse Delta, waar we met een dashboard rioolvreemd water kunnen herkennen.

R Markdown 

R Markdown is een package van R waarin je R-code, visualisaties en tekst kunt combineren tot een document. Het Markdown-document kan je vervolgens laten generen als PDF, Word of HTML, om hem daarna te delen binnen jouw organisatie. De R Markdown is geschikt als een gerichte rapportage waarin je zelf bepaalt wat de gebruikers kunnen zien. De rapportage is gemakkelijk elk jaar/kwartaal up te daten, je hoeft geen nieuwe figuren in bijvoorbeeld je PowerPoint te plakken. Wanneer je een HTML-pagina genereert, kun je ook interactieve visualisaties in je rapportage opnemen. Dit is een mooie en vrij eenvoudige manier om een interactief rapport te maken of resultaten van een eenmalige data-analyse in weer te geven. Rapporten die normaalgesproken met statische figuren worden rondgestuurd kunnen extra vragen opleveren bij de ontvanger, zoals een manager. Door het rapport interactief te maken, met bijvoorbeeld een plot waarin je zelf kan in- en uitzoomen en filteren, kan de ontvanger zelf meer informatie verkrijgen en is deze minder afhankelijk van de data scientist.

Een goed voorbeeld waarbij een dergelijk rapportage de oplossing bleek, was bij de RUD Drenthe. Bij dit project volstond een eenmalige rapportage waaraan we filters hebben toegevoegd, zodat gebruikers zelf per branch de resultaten konden bekijken.  De interactieve rapportage kun je zo geavanceerd maken als je wilt. Met de htmlwidgets- en crosstalk-package voeg je eenvoudig mooie interactieve visualisaties en filters toe aan je rapport en kan je de visualisaties synchroniseren. Naast R-code zijn ook andere andere talen zoals Python of SQL makkelijk te integreren in een R Markdown. Een Markdown maken kost minder tijd dan het maken van een Shiny-dashboard, je moet echter nog steeds kunnen programmeren in R.

Power BI 

Is je doel alleen maar om je data te visualiseren en verder alleen simpele berekeningen op je data los te laten, dan kan je een BI-tool zoals Power BI gebruiken. Ook voor het maken van een Power BI-dashboard heb je enige technische vaardigheden nodig, maar het werkt intuïtiever dan programmeren in R: Power BI werkt met drag-and-drop waardoor je snel handigheid krijgt in het gebruik. Een nadeel van deze tool is dat je een licentie nodig hebt voor elke gebruiker waarmee je jouw dashboard wilt delen. Power BI is in het bijzonder handig wanneer je met veel verschillende databronnen werkt. Je kan de verschillende bronnen namelijk gemakkelijk aan elkaar koppelen in een datamodel. Ook wanneer jouw data verschillende dimensies en/of aggregatieniveaus heeft, is Power BI een sterke tool. Dit komt bijvoorbeeld van pas wanneer je data van waterdistricten met elk verschillende sensoren hebt en je de resultaten hiervan over tijd wil weergeven. Power BI heeft veel filterfunctionaliteiten waardoor je deze complexe data goed kan weergeven.

Een groot nadeel is dat je geen data kan invoeren via het dashboard en dus berekeningen niet opnieuw kan uitvoeren met input van de gebruiker. Omdat Power BI van Microsoft is, werkt dit natuurlijk goed samen wanneer je een database in Azure hebt. Het dashboard kan daarnaast gemakkelijk automatisch geüpdatet worden via een planning en de rapportages kunnen ook automatisch op periodieke basis naar klanten of medewerkers worden verstuurd. 

Conclusie

Er zijn dus veel elementen om rekening mee te houden wanneer je wilt gaan visualiseren. Je begint met bedenken wie je aanspreekt en wat je doel is. Een belangrijk aspect is het niveau van de analyse die je gaat uitvoeren: komt er data science/machine learning bij kijken? Kies in dat geval voor een visualisatietool van R (of een soortgelijke programmeertaal). Wil je enkel inzicht vergaren in jouw (complexe) data? Dan kan een snel te implementeren tool als Power BI juist geschikt zijn. 

Denk ook na over de keuzevrijheid die je de gebruiker geeft: als je de gebruiker een gerichtere visualisatie wilt laten zien, ga dan voor een rapportage, zoals R Markdown. Wil je juist dat de gebruikers zelf naar inzichten opzoek gaan, dan is een dashboard zoals Shiny of Power BI meer geschikt. Daarnaast is het technisch niveau van de maker van het dashboard belangrijk. Heb je geen specifieke technische kennis in huis? Ga voor een drag-and-drop tool zoals Power BI of haal de kennis in huis wanneer de andere opties een betere oplossing zijn voor jouw visualisatiedoel.

Zelf aan de slag

Hopelijk helpt dit je op weg naar het maken van een meer gefundeerde keuze voor jouw eigen projecten. Natuurlijk is deze vergelijking niet uitputtend. Zo kan je ook kijken naar ander BI-tools zoals Tableau, QlikSense en Cognos, en naar bijvoorbeeld Jupyter notebook als vergelijking van de R Markdown. Daarnaast zijn er nog veel andere meer gespecialiseerde tools (voor bijvoorbeeld geografische data) en zijn er meer voor- en nadelen per tool te bedenken. De drie besproken tools kun je zien als een eerste keuzemogelijkheid. Mocht je naar aanleiding van deze blog meer informatie willen over het visualiseren van data, neem dan contact met ons op. Wij denken graag met je mee. 

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *