5.7.2 Prediksjonsverdier og residualverdier
Alle regresjonsvarianter som finnes i microdata.no har tilknyttede kommandoer som genererer blant annet residual- og prediksjonsverdier. Dette er verdier som kan brukes til å analysere dataspredningen og for testing av regresjonsmodeller. Prediksjonsverdier kan dessuten brukes som input til videre analyser.
Kommandoene har samme navn som tilhørende regresjonskommando pluss
-predict
.
Syntax:
logit-predict <variabel> <variabelliste> [if <betingelse>] [,<opsjoner>]
probit-predict <variabel> <variabelliste> [if <betingelse>] [, <opsjoner>]
Variablene angis på samme måte som for den tilhørende
regresjons-modellen som kjøres med kommandoen logit
evt. probit
.
Følgende verdier kan hentes ut:
logit-predict
: Sannsynlighetsverdier, prediksjonsverdier og residualerprobit-predict
: Sannsynlighetsverdier og prediksjonsverdier
En bestemmer selv hvilke verdier en vil generere gjennom bruk av opsjoner. Resultatet av kjøringene er et sett med variabler som inneholder de ulike verdiene. Som standard genereres førstnevnte verditype i listen over, men det anbefales likevel å spesifisere dette gjennom opsjoner ettersom en da også kan bestemme navn på de genererte variablene inni en parentes som vist i syntax-eksempelet nedenfor. Om en kjører flere "predictkommandoer", må en lage nye navn for de automatisk genererte variablene.
Syntax-eksempel:
logit-predict høylønn alder mann formue, residuals(res4) predicted(pred4) probabilities(prob4)
De automatisk genererte variablene kan brukes som input til videre
analyser eller til å vises grafisk. Aktuelle grafiske kommandoer er
hexbin
og histogram
. Ved å kjøre histogram
på residualvariabelen, kan en sjekke hvorvidt residualene er normalfordelte. Hexbin
-kommandoen kan dessuten brukes til lage anonymiserte spredningsplott der en kombinerer to sett med verdier.
For mer detaljer anbefales det å bruke kommandoen help logit-predict
eller help probit-predict
.