Projectopdracht Data Lab: statistische analyse van een dataset

Voor de laatste opdracht van ons vak Data Lab moesten we ongeveer een maand lang een dataset aanvullen en hier uitendelijk een analyse van doen. In mijn groep zat ik samen met mijn medeleerling Stan en wij kozen ervoor om zijn dataset te analyseren. In zijn dataset hield Stan elke dag 5 variabelen bij, hieronder weergegeven in een tabel.

Hij verzamelde elke dag de prijs per liter van zowel diesel als benzine 95, de gemeente/stad, het tankstation waar hij de prijzen nakeek en natuurlijk de dag waarop hij ging. Deze data heeft hij verzameld met Google Forms en aan de hand van Power Automate automatisch overgezet naar een Excel document met de tabel die je daar ziet. Volgens hem was het even aanpassen maar was deze manier van werken en workflow zeer handig.

Voor de analyse van de dataset maakten we gebruik van Knime, wat het visualiseren van de data in allerlei verschillende grafieken makkelijker maakte. Hieronder zie je bijvoorbeeld een histogram van het aantal keren dat er data gecheckt is per locatie.

Knime heeft het hele proces zeker makkelijker gemaakt maar dat betekent niet dat we geen problemen ondervonden. De user interface vond ik allesbehalve gebruiksvriendelijk en de software voelde over het algemeen niet intuïtief om mee te werken. Gelukkig vond Stan het wel wat handiger om mee te werken, dus nam hij het voortouw op vlak van analyse van de data in Knime terwijl ik mij ontfermde over het rapport dat we moesten schrijven.

Geef een reactie

Uw e-mailadres zal niet worden gepubliceerd. Vereiste velden zijn gemarkeerd met *.

*
*
U mag gebruik maken van deze <abbr title="HyperText Markup Language">HTML</abbr> tags en attributen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>