Nå er det mulig å vise standardiserte regresjonsestimater
Den nye opsjonen standardize
lar deg vise standardiserte koeffisient-estimater når du benytter kommandoen regress
(OLS-estimering).
Sammenlikning av koeffisient-estimater for de ulike forklaringsvariablene i en regresjonsmodell vil være utfordrende dersom de benytter forskjellige verdiskalaer. Da blir det vanskelig å se hvilke variabler som har sterkest effekt på responsvariabelen.
Standardisering foregår ved at alle variablene som inngår i en regresjonsmodell, inkludert responsvariabelen, skaleres om til en standardisert fordeling med forventning lik 0 og varians lik 1. Dette gjør estimatene direkte sammenliknbare både innenfor og på tvers av ulike regresjonsmodeller.
Standardiserte koeffisienter viser hvor mange standardavvik responsvariabelen vil endres dersom den aktuelle forklaringsvariabelen øker med ett standardavvik.
Visning av standardiserte estimater for lineær regresjon gjøres enkelt ved å benytte opsjonen standardize
sammen med kommandoen regress
.
Eksempelet under viser resultat fra OLS-regresjon kjørt på de samme data, først vanlig variant og deretter standardisert variant. Merk at modellverdiene i den øverste delen av resultatene knytter seg til estimeringen på vanlige ustandardiserte data, noe som gjør at tallene blir like. Den nederste delen som viser koeffisient-estimatene blir derimot forskjellige med unntak av t- og P-verdiene. Merk også at det ikke rapporteres standardisert estimat for konstantleddet når opsjonen standardize
brukes.
I microdata.no har vi valgt å post-standardisere koeffisient-estimatene ved bruk av følgende formler (gir samme resultat som å bruke standard regress
på pre-standardiserte data):
- Standardiserte koeffisienter: Coef∗ = Coef · (sd(x) / sd(y)) , der Coef = ustandardisert koeffisient, sd(x) = standardavvik for uavhengig variabel målt over gjeldende populasjon, sd(y) = standardavvik for avhengig variabel målt over gjeldende populasjon
- Standardiserte standardfeil: Std.feil* = Coef* / t (tilsvarer Std.feil* = Std.feil · (sd(x) / sd(y)))
- Standardisert konfidensintervall(95%): CI* = [Coef* − 1,96 · Std.feil* ; Coef* + 1,96 · Std.feil*] (parameteren 1,96 samsvarer med standardnivået 95%)