Descriptive statistics: summarize and boxplot
The script below demonstrates different ways to use the summarize
and boxplot
commands to create descriptive statistics. These are applied to numerical variables to create summary statistics such as mean, standard deviation, number of units with a valid value, etc.
// Nøkkelstatistikk for metriske/kontinuerlige variabler
// Kommandoen summarize brukes for å vise nøkkelinformasjon om metriske/kontinuerlige variabler. Verdier som vises er gjennomsnitt, kvartiler m.m. Kommandoen boxplot viser de samme tallene grafisk gjennom standard boxplotfremstilling
require no.ssb.fdb:23 as db
create-dataset demografidata
import db/INNTEKT_WYRKINNT 2020-01-01 as innt
import db/INNTEKT_BRUTTOFORM 2020-01-01 as formue
import db/BEFOLKNING_KJOENN as kjønn
import db/BEFOLKNING_FOEDSELS_AAR_MND as faarmnd
import db/BOSATTEFDT_BOSTED 2020-01-01 as bosted
// Koder om fra kommune- til fylkesnivå
generate fylke = substr(bosted,1,2)
// Lager alder per 2020
generate alder = 2020 - int(faarmnd/100)
summarize innt formue
summarize formue if alder > 50
summarize formue if bosted == '0301'
boxplot innt formue
boxplot innt, over(kjønn)