Enkelvoudige lineaire regressie met SPSS

Enkelvoudige lineaire regressie (Engels: simple regression of univeriate regression) of simpelweg enkelvoudige regressie is een statistische analysetechniek om een specifieke samenhang tussen twee variabelen vast te stellen.

Hulp nodig bij je scriptie?

Vul je gegevens in voor een gratis en vrijblijvend adviesgesprek.

Dit veld is bedoeld voor validatiedoeleinden en moet niet worden gewijzigd.
9,1
4.4/5

373

Beoordelingen

10.000+ studenten geslaagd

98% slaagt op tijd

Hbo & wo, online & offline

Scriptiebegeleiding sinds 2005

Inhoudsopgave

Enkelvoudige lineaire regressie (Engels: simple regression of univeriate regression) of simpelweg enkelvoudige regressie is een statistische analysetechniek om een specifieke samenhang tussen twee variabelen vast te stellen. We willen de uitkomst (afhankelijke variabele) voorspellen met één predictor (onafhankelijke variabele). Bijvoorbeeld, op basis van de temperatuur voorspellen hoeveel ijsjes er worden verkocht. In dit artikel lees je aan de hand van een voorbeeld hoe je deze analyse uitvoert in SPSS, hoe je de output interpreteert en je de resultaten rapporteert. In ons artikel Regressie-analyse voor beginners beschreven we de basistheorie van regressie-analyse. Als je nog niet weet welke analyse geschikt is voor jouw probleemstelling, begin dan met ons artikel Data-analyse: waar te beginnen?

Uitvoeren enkelvoudige regressie-analyse

Open SPSS met de betreffende dataset en ga in het menu bovenin naar Analyze –> Regression –> Linear… Onderstaande venster verschijnt. Selecteer de gewenste afhankelijke variabele en klik op het pijltje naast het vak Dependent. Doe hetzelfde voor de onafhankelijke variabele bij het vak Independent(s). In het voorbeeld hebben we leeftijd (age) als onafhankelijke variabele geplaatst en het jaarsalaris (salary) als afhankelijke variabele.

enkelvoudige-regressie-variabelen

Klik vervolgens op OK om de analyse uit te voeren.

Interpreteren SPSS output

De eerste tabel in de SPSS output geeft een samenvatting van het model. De R-kwadraaat (R Square) vertelt dat 49,1% van het salaris verklaart wordt door leeftijd. De overige 51,9% in variatie van salaris wordt dus door andere factoren verklaard.

tabel-model-summary-regressie-spss

De tweede tabel rapporteert de variantieanalyse (ANOVA). Het belangrijkste deel van de tabel is de F-ratio (F) en de bijbehorende significantiewaarde (Sig.) van die F-ratio. In onderstaande voorbeeld is F 42,39, wat significant is bij p < 0,001 (omdat de waarde in de kolom Sig. minder is dan 0,001). Dit resultaat geeft aan dat er minder dan een 0,1% kans is dat een F-ratio van deze omvang voorkomt als de nulhypothese waar zou zijn. Daarom kunnen we concluderen dat ons regressiemodel resulteert in een significant betere voorspelling van salaris dan wanneer we de gemiddelde waarde van de salaris zouden gebruiken voor elke waarde van leeftijd. Kortom, het regressiemodel voorspelt het salaris significant goed.

tabel-ANOVA-regressie-spss

De ANOVA-tabel vertelt ons of het model in het algemeen resulteert in een significant goede voorspelling van de uitkomstvariabele. Echter zegt de ANOVA niets over de individuele bijdrage van variabelen in het model (hoewel er bij een enkelvoudige regressie slechts één variabele in het model zit en dus kunnen we concluderen dat deze variabele een goede voorspeller is). Onderstaande tabel geeft details over de modelparameters (de bètawaarden) en de significantie van deze waarden. In onderstaande voorbeeld heeft de β(de bètawaarde van de intercept, het punt bij X = 0) een waarde van -23776,76. Dit betekent dat als er geen leeftijd bekend is, het model voorspelt dat het salaris -23776,76 is. De β1  (de helling (slope) van de regressielijn) is 2050,12. Deze waarde staat voor de verandering in de uitkomst (salaris) geassocieerd met een eenheidsverandering in de voorspeller (leeftijd). In onderstaande voorbeeld betekent dit dat bij elke verhoging van een jaar in leeftijd het voorspelde jaarsalaris 2050,12 hoger is.

De t (een-na-laatste kolom) geeft aan of de β-waarde anders is dan 0 en de Sig. of dit significant is. Deze is 0,000 in bovenstaande voorbeeld. Dit is lager dan 0,005 en dus significant. Daarom kunnen we concluderen dat leeftijd een belangrijke bijdrage (p <.001) levert aan salaris. Het regressiemodel bij bovenstaande analyse noteren we als volgt:

salaris = 23776,76 + (2040,12 x leeftijd)

Bij een leeftijd van 27 hoort dus het volgende salaris:

salaris = -23776,76 + (2050,12 × 27) salaris = 31576,48

Rapporteren resultaten enkelvoudige regressie

In het resultatenhoofdstuk van je scriptie rapporteer je de uitkomsten van de regressieanalyse. Voor het rapporteren van statistische resultaten zijn richtlijnen afgesproken, bijvoorbeeld zoals opgenomen in de APA-stijl. Zo ook specifiek voor regressie-analyse. Een veel toegepast slabloon gaat als volgt (in het Engels, omdat dit het meest voorkomt bij scripties met statistische analyse in Nederland):

A simple linear regression was used to predict {afhankelijke variabele} from {onafhankelijke variabele}. This variable significantly predicted {afhankelijke variabele}, F({A}, {B}) = {C}, p < {D}, R2 = {E}. Predicted {afhankelijke variabele} is equal to {F}, {+/- G} in {eenheid van onafhankelijke variabele; €/kg/meters/etc} per {eenheid onafhankelijke variabele; €/kg/etc} in {afhankelijke variabele}.

Daarbij zijn F({A},  {B}) de vrijheidsgraden: {A} staat voor het aantal verklarende variabelen en {B} het aantal observaties minus het aantal verklarende variabelen minus één. Het sjabloon ingevuld met bevindingen uit bovenstaande analyse:

A simple linear regression was used to predict salary from age. This variable significantly predicted salary, F(1, 95) = 42.39, p < .0005, R2 = .491. Predicted salary is equal to -23776,76, +2050,12 (€) per euro in income.

Sneller afstuderen? Het maximale uit je scriptie halen?

Maak gebruik van de scriptiehulp van de ScriptieMaster. Meld je hier aan voor een gratis en vrijblijvend oriëntatiegesprek.

Heeft dit jou geholpen? Deel het met anderen:

Bekijk meer artikelen

hypothese formuleren
Implementatieplan
Analysevinder: Welke analyse bij welke data en variabelen?

Heb je vragen over dit artikel?

Laat een comment achter

Heb je vragen over dit artikel? Laat een comment achter en een van onze
begeleiders zal hem zo spoedig mogelijk beantwoorden

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Wij bieden scriptiebegeleiding aan studenten van o.a.:

Inmiddels hebben onze scriptiebegeleiders van nagenoeg iedere vol- en deeltijd opleiding in Nederland studenten mogen ondersteunen bij hun afstudeertraject! Ben je nieuwsgierig geworden welke begeleider jou het beste kan ondersteunen bij jouw specifieke opleiding, studie en onderwerp? Vraag dan een gratis adviesgesprek aan. Hopelijk tot snel!

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *