Bruk av instrumentvariabel i regresjonsanalyse

Kommandoen ivregress kan brukes til å spesifisere instrumentvariabler. Dette er aktuelt dersom en har en hypotese om at det eksisterer multikollinearitet (korrelasjon mellom minst to av de uavhengige variablene). En definerer instrumentvariabler inne i parentesuttrykket. I eksempelet nedenfor brukes instrumentvariabelen formue, og instrumentet alder. Men en kan bruke som mange instrumenter en ønsker. F.eks. om en tror at også bosted (=Oslo) påvirker formue, kan en bruke parentesuttrykket (formue = alder oslo). Men i prinsippet behandler ivregress alle uavhengige variabler som instrumenter, bortsett fra instrumentvariabelen.

require no.ssb.fdb:1 as fdb1
create-dataset ivtest
import fdb1/INNTEKT_WLONN 2013-05-05 as lønn
import fdb1/BEFOLKNING_FOEDSELS_AAR_MND as faarmnd
import fdb1/BEFOLKNING_KJOENN as kjønn
generate alder = 2013 - int(faarmnd /100)
drop if alder < 0
generate mann = 0
replace mann = 1 if kjønn == '1'
import fdb1/INNTEKT_BRUTTOFORM 2013-05-05 as formue

//Foretar først vanlig lineær regresjon
regress lønn alder mann formue

//Mistenker en sammenheng mellom alder og formue. Bruker derfor en modell med instrumentvariabel (formue)
ivregress lønn mann (formue = alder)

//I tillegg til å sammenlikne output fra regresjonene, sjekkes det for multikollinearitet og normalfordelte restledd

correlate formue alder
regress-predict lønn alder mann formue, residuals( res1)
ivregress-predict lønn mann (formue = alder), residuals( res2) 

histogram res1
histogram res2