Ny funksjon for gruppering av inntekter og andre kontinuerlige verdier: quantile

 av  Trond Pedersen

Det er nå mulig å konvertere kontinuerlige verdier til prosentilverdier ved å bruke den nye funksjonen quantile(). Alle verdiene for den aktuelle variabelen i datasettet vil da bli delt inn og plassert kronologisk i like store grupper. Etter konverteringen vil variabelen inneholde nummeret på den aktuelle prosentilen som verdien tilhører.

En kan også bruke andre inndelinger, som desiler (10 grupper), kvartiler (4 grupper) etc. Groveste tillatte inndeling er i 2 grupper, fineste tillatte er i 100 grupper.

Aktuelt bruksområde for prosentiler, desiler, kvartiler etc er når en ønsker å følge inntektsutviklingen på individnivå over tid, der en kontrollerer for inflasjon. Ved å operere med f.eks. prosentilverdier i stedet for beløp, spiller ikke inflasjon noen rolle siden en kun studerer individers inntektsplassering på en skala fra 0 til 99, der 99 (= 100. prosentil) peker på prosentilen der de med de aller høyeste inntektene befinner seg.

NB! Merk at microdata.no av personvernhensyn foretar en topp-/bunnkoding på 1% i hver ende av skalaen. Ved bruk av prosentilinndeling vil en da kunne oppleve at laveste og/eller høyeste prosentil av og til blir slått sammen med naboprosentilet. Dette vil ikke skje ved andre inndelinger, som f.eks. desiler.

Eksempler:

generate prosentil = quantile(inntekt,100)
generate desil = quantile(inntekt,10)
generate kvartil = quantile(inntekt,4)

Klikk her for flere eksempler på bruk av funksjonen