Lineær regresjonsanalyse

Lineære regresjonsanalyser (OLS) brukes til å estimere marginaleffekter/ koeffisientverdier for et sett med forklaringsvariabler, der utfalls-/responsvariabelen er metrisk. Gjennom opsjoner kan en tilpasse outputen (ikke vise fastleddet, endre på signifikansnivået m.m.).

// Starter med å hente variablene en trenger

create-dataset demografidata
import BEFOLKNING_KJOENN as kjonn
import BEFOLKNING_FOEDSELS_AAR_MND as faarmnd
import SIVSTANDFDT_SIVSTAND 2000-01-01 as sivstand
import INNTEKT_BRUTTOFORM 2000-01-01 as formue
import INNTEKT_WYRKINNT 2005-01-01 as innt05

// Tilrettelegger de uavhengige variablene slik at de passer med den statistiske modellen (innebærer at de fleste variabler gjøres som til dummy’er)

generate mann = 0
replace mann = 1 if kjonn == '1'

generate gift = 0
replace gift = 1 if sivstand == '2'

generate alder = 2000 - int(faarmnd / 100)
drop if alder < 16

generate formuehøy = 0
replace formuehøy = 1 if formue > 600000

// Tester for multikollinearitet/korrelasjon mellom enkelte uavhengige variabler

correlate alder formuehøy

// Kjører regresjonsanalysen der den avhengige variabelen alltid listes først

regress innt05 mann gift alder formuehøy