Regresjonsanalyser med robust- og cluster-estimater
Frem til nå har det bare vært mulig å bruke robust- og cluster-estimering på vanlige lineære regresjoner i microdata.no. Det vil nå være mulig å gjøre dette for alle typer regresjoner som finnes i analysesystemet, inkl. logit, probit, multinomisk logit, og lineære panelregresjoner.
Opsjonene robust
og cluster()
brukes hver for seg til å spesifisere om en ønsker hhv. robust- eller cluster-estimering, og vil som resultat presentere regresjonsestimater med justerte standardavvik for de estimerte koeffisienter. Også tilhørende t-, z- og p-verdier påvirkes. Øvrige verdier påvirkes ikke sammenliknet med standard estimering.
Merk at robust og cluster ikke kan benyttes i kombinasjon (cluster impliserer robust estimering).
Robust estimering kan brukes der det er mistanke om problematiske outliers eller heteroskedastisitet.
Cluster-estimering brukes når en mistenker at det er systematiske avhengigheter innen grupper av observasjoner, f.eks. innen skoler eller kommuner. Gruppene spesifiseres gjennom en variabel (cluster-variabel) som inngår i parentesen til cluster-opsjonen, f.eks. cluster(skole)
eller cluster(kommune)
. Følgende forutsetninger gjelder, hvis ikke vil systemet gi en feilmelding:
- Antallet grupper må være av en viss størrelse
- Clustervariabelen må være numerisk
- Clustervariabelen kan ikke inngå som variabel i regresjonsuttrykket.
Eksempler:
regress inntekt mann gift høy_utdanning, robust
regress inntekt mann gift høy_utdanning, cluster(kommune)
For mer om cluster- og robust-opsjoner, samt andre opsjoner, bruk følgende kommandoer:
help regress
help logit
help probit
help mlogit
help regress-panel