Ny regresjonsfunksjonalitet: Uthenting av prediksjons- og residualverdier

 av  Trond Pedersen

Alle regresjonsvarianter som finnes i microdata.no har nå fått tilknyttede kommandoer som genererer blant annet residual- og prediksjonsverdier. Dette er verdier som kan brukes til å analysere dataspredningen og for testing av regresjonsmodeller. Prediksjonsverdier kan dessuten brukes som input til videre analyser.

Kommandoene har samme navn som tilhørende regresjonskommando pluss “-predict”, og genererer et sett med verdier:

  • regress-predict: prediksjonsverdier, residualer og “Cook’s distance”
  • ivregress-predict: prediksjonsverdier og residualer
  • logit-predict: sannsynlighetsverdier, prediksjonsverdier og residualer
  • probit-predict: sannsynlighetsverdier og prediksjonsverdier
  • mlogit-predict: sannsynlighetsverdier og prediksjonsverdier
  • panel-regress-predict: prediksjonsverdier, residualer og enhetseffekter

En bestemmer selv hvilke verdier en vil generere gjennom bruk av opsjoner. Resultatet av kjøringene er et sett med variabler som inneholder de ulike verdiene. Som standard genereres førstnevnte verditype i listen over, men det anbefales likevel å spesifisere dette gjennom opsjoner ettersom en da også kan bestemme navn på de genererte variablene. Om en kjører flere “predictkommandoer”, må en lage nye navn for de automatisk genererte variablene for å unngå at variabler får like navn, noe som gir feilmelding.

Syntax-eksempler:

regress-predict lønn alder mann formue, residuals(res) predicted(pred) cooksd(cook)
logit-predict høylønn alder mann formue, residuals(res2) predicted(pred2) probabilities(prob2)

De automatisk genererte variablene kan brukes som input til videre analyser eller til å vises grafisk. Aktuelle grafiske kommandoer er hexbin og histogram. Ved å kjøre histogram på residualvariabelen, kan en sjekke hvorvidt residualene er normalfordelte. Hexbin-kommandoen kan dessuten brukes til lage anonymiserte spredningsplott der en kombinerer to sett med verdier.

For mer detaljer anbefales det å bruke help-kommandoen, f.eks. help regress-predict

Klikk her for eksempler på bruk av prediksjonskommandoer i analyser

Det jobbes kontinuerlig med å forbedre microdata.no slik at de fleste analysebehov skal kunne dekkes. Fremover vil det derfor bli introdusert stadig flere analysemuligheter. Vi baserer oss på innspill fra forskere, og har opparbeidet en liste med nye verktøy som vi jobber oss gjennom. Har du konkrete forslag til ny funksjonalitet? Kontakt oss gjerne på mail: support@microdata.no