5.4.3 Cluster- og robust-estimering
Opsjonene robust
og cluster()
brukes hver for seg til å spesifisere om en ønsker hhv. robust- eller cluster-estimering, og vil som resultat presentere regresjonsestimater med justerte standardavvik for de estimerte koeffisienter. Også tilhørende t-, z- og p-verdier påvirkes. Øvrige verdier påvirkes ikke sammenliknet med standard estimering.
Merk at robust
og cluster
ikke kan benyttes i kombinasjon (cluster
impliserer robust estimering).
Robust estimering kan brukes der det er mistanke om problematiske "outliers" eller heteroskedastisitet.
Cluster-estimering brukes når en mistenker at det er systematiske
avhengigheter innen grupper av observasjoner, f.eks. innen skoler eller
kommuner. Gruppene spesifiseres gjennom en variabel (cluster-variabel)
som inngår i parentesen til cluster-opsjonen, f.eks. cluster(skole)
eller cluster(kommune)
. Følgende forutsetninger gjelder, hvis ikke vil systemet gi en feilmelding:
-
Antallet grupper må være av en viss størrelse
-
Clustervariabelen må være numerisk
-
Clustervariabelen kan ikke inngå som variabel i regresjonsuttrykket
Eksempler:
regress inntekt mann gift høy_utdanning, robust
regress inntekt mann gift høy_utdanning, cluster(kommune)
Robust
- og cluster
-opsjoner kan benyttes også på øvrige regresjonstyper.