Regresjonsanalyser med robust- og cluster-estimater

 av  Trond Pedersen

Frem til nå har det bare vært mulig å bruke robust- og cluster-estimering på vanlige lineære regresjoner i microdata.no. Det vil nå være mulig å gjøre dette for alle typer regresjoner som finnes i analysesystemet, inkl. logit, probit, multinomisk logit, og lineære panelregresjoner.

Opsjonene robust og cluster() brukes hver for seg til å spesifisere om en ønsker hhv. robust- eller cluster-estimering, og vil som resultat presentere regresjonsestimater med justerte standardavvik for de estimerte koeffisienter. Også tilhørende t-, z- og p-verdier påvirkes. Øvrige verdier påvirkes ikke sammenliknet med standard estimering.

Merk at robust og cluster ikke kan benyttes i kombinasjon (cluster impliserer robust estimering).

Robust estimering kan brukes der det er mistanke om problematiske outliers eller heteroskedastisitet.

Cluster-estimering brukes når en mistenker at det er systematiske avhengigheter innen grupper av observasjoner, f.eks. innen skoler eller kommuner. Gruppene spesifiseres gjennom en variabel (cluster-variabel) som inngår i parentesen til cluster-opsjonen, f.eks. cluster(skole) eller cluster(kommune). Følgende forutsetninger gjelder, hvis ikke vil systemet gi en feilmelding:

  • Antallet grupper må være av en viss størrelse
  • Clustervariabelen må være numerisk
  • Clustervariabelen kan ikke inngå som variabel i regresjonsuttrykket.

Eksempler:

regress inntekt mann gift høy_utdanning, robust
regress inntekt mann gift høy_utdanning, cluster(kommune)

For mer om cluster- og robust-opsjoner, samt andre opsjoner, bruk følgende kommandoer:

  • help regress
  • help logit
  • help probit
  • help mlogit
  • help regress-panel