Lage variabel med flere kategorier

Variabler som angir beløp, prosentandeler, alder m.m. er typisk numeriske variabler som tar kontinuerlige verdier. Slike verdier kan kategoriseres gjennom kommandoene generate og replace.

Eksempel på kategorisering av variabelen “bruttoformue”, der en oppretter en ny variabel formueint og plasserer verdiene i 4 kategorier:

1: 0 - 150000

2: 150001 - 250000

3: 250001 - 400000

4: 400001 og oppover

create-dataset demografidata
import INNTEKT_BRUTTOFORM 2000-01-01 as formue

// Gruppere formue i 4 intervaller

generate formueint = 1
replace formueint = 2 if formue > 150000
replace formueint = 3 if formue > 250000
replace formueint = 4 if formue > 400000