De basis van kwantitatieve data-analyse
Wanneer je kwantitatief onderzoek uitvoert kan het lastig zijn om erachter te komen wat je nou precies moet doen met de verzamelde data. Toen ik mijn scriptie schreef en voor het eerst het woord ‘regressieanalyse’ hoorde, schrok ik toch even. Om data-analyse iets eenvoudiger voor jou te maken, leggen we in de blog van deze week een stevige basis. Aan de hand van definities en berekeningen leggen we jou de basisprincipes van kwantitatieve data-analyse uit!
Hulp nodig bij je scriptie?
Vul je gegevens in voor een gratis en vrijblijvend adviesgesprek.
10.000+ studenten geslaagd
98% slaagt op tijd
Hbo & wo, online & offline
Scriptiebegeleiding sinds 2005
Inhoudsopgave
Numerieke samenvatting kwantitatieve gegevens
In de vorige blog beschreef ik hoe je data kunt visualiseren in je scriptie. Een andere manier om jouw onderzoeksgegevens te weergeven is door deze op numerieke wijze samen te vatten. Dit kan op twee manieren. Ten eerste door het midden van een reeks waarnemingen vast te stellen. Dit noemen we de centrummaten. Ten tweede kan dit door de spreiding van de waarnemingen te benoemen. De eerste stap in het omschrijven van de spreiding is het berekenen van de standaarddeviatie.
Het gemiddelde
Van deze centrummaat heb je ongetwijfeld eerder gehoord. Want het gemiddelde wordt vaak gebruikt om het midden van een reeks waarnemingen aan te duiden, en is populair in scripties. Het gemiddelde wordt beïnvloed door outliers, dit zijn extreem hoge of lage waarneming. Hoe kleiner het aantal waarnemingen des te groter is de invloed van outliers op het gemiddelde.
Gemiddelde = De som van alle waarnemingen / Totaal aantal waarnemingen
De modus
De modus is de meest voorkomende waarneming. In een scriptie is de modus eenvoudig af te lezen in een histogram of frequentieverdeling. Je hebt vast eerder gehoord van het modale inkomen. Dit is het meest voorkomende inkomen van de Nederlanders. Een voordeel van deze centrummaat is dat het amper beïnvloed wordt door outliers. De modus is net zoals het gemiddelde en de mediaan een centrummaat. Maar de modus hoeft niet in de buurt van de andere twee centrummaten te liggen. Hierdoor is de modus in sommige gevallen ietwat onnauwkeurig.
De mediaan
De laatste centrummaat is de mediaan. Wanneer je de waarnemingen rangschikt van klein naar groot, is de mediaan de middelste waarneming. De middelste waarneming is eenvoudig aan te wijzen wanneer er een oneven aantal waarnemingen is. Bij een even aantal waarnemingen geldt het gemiddelde van de middelste twee waarnemingen als mediaan. De mediaan is resistent voor outliers.
De standaarddeviatie
De eerste manier om inzicht te krijgen in de spreiding van de verdeling in jouw scriptie is met behulp van de standaarddeviatie. De standaarddeviatie omschrijft hoe ver bepaalde data van het gemiddelde af ligt. Om de standaarddeviatie te kunnen berekenen moet je eerst weten hoe je een deviatie berekent. Dit doe je door van elke waarde het gemiddelde af te trekken. De standaarddeviatie kan je alleen berekenen wanneer onderzoeksgegevens normaal verdeeld zijn en de empirische regel dus van toepassing is. In de blog van volgende week kan je hier meer over lezen. De formule van de standaarddeviatie ziet er als volgt uit:
Heb jij moeite met jouw data-analyse? Wij helpen je graag verder met het afronden van je scriptie. Schrijf je nu in voor een gratis en vrijblijvend adviesgesprek.
Heeft dit jou geholpen? Deel het met anderen:
Heb je vragen over dit artikel?
Laat een comment achter
Heb je vragen over dit artikel? Laat een comment achter en een van onze
begeleiders zal hem zo spoedig mogelijk beantwoorden
Bekijk meer artikelen
Heb je vragen over dit artikel?
Laat een comment achter
Heb je vragen over dit artikel? Laat een comment achter en een van onze
begeleiders zal hem zo spoedig mogelijk beantwoorden