Hente ut informasjon om pågående utdanning (kurs)

Opplysninger om pågående utdanning (såkalte kursdata) foreligger med kurs som enhetsnivå (med tilhørende kurs-identifikator). Kurs er gitt ved kombinasjonen person x kurstype, der hvert individ i praksis kan være representert med flere kurstyper til samme tid.

Siden kursdata ikke har person som enhet, kan ikke disse importeres inn i persondatasett på vanlig måte, men må kobles på vha. kommandoen merge.

Først må en legge til en lenke mellom kurs-id og person-id på kursdataene. Deretter må en aggregere opp til personnivå vha. kommandoen collapse før en tilslutt kobler på persondatasettet.

I eksempelet opprettes det først et persondatasett bestående av personer bosatt i Norge (regstatus == ‘1’) per 2010-01-01. Deretter hentes det ut historikk over pågående utdanning for perioden 2010-2012, der en tar vare på utdanning på høyere nivå (master eller høyere, nivå 7 og 8). Kommandoen collapse (count) brukes til å telle opp antall observasjoner med pågående utdanning per individ over perioden 2010-2012, og resultatet kobles så på persondatasettet for videre analyse.

NB! Merk at variabelen kurstype etter bruk av collapse vil bestå av verdier for den aktuelle statistikken som blir kjørt, i dette tilfellet antall observasjoner (count).

//Kobler til databank
require no.ssb.fdb:1 as fdb1

//Oppretter persondatasett for bosatte per 2010-01-01 med variabel kjønn
create-dataset persondata
import fdb1/BEFOLKNING_KJOENN as kjønn
import fdb1/BEFOLKNING_REGSTAT 2010-01-01 as regstatus
keep if regstatus == '1'

//Henter personer som tar høyere utdanning i perioden 2010-2012
create-dataset kursdata
import-event fdb1/NUDB_KURS_NUS 2010-01-01 to 2012-01-01 as kurstype
destring kurstype, force
keep if kurstype >= 700000 & kurstype < 999999

//Kobler på lenke mellom kurs-id og fødselsnumre
create-dataset lenke_kurs_person
import fdb1/NUDB_KURS_FNR as fnr
merge fnr into kursdata

//Lager statistikk (collapser) over antall hendelser med høy utdanning per individ, og kobler dette på persondatasettet
use kursdata
collapse (count) kurstype, by(fnr)
rename kurstype ant_kurs
merge ant_kurs into persondata

//Lager tabell over antall personer som tok høy utdanning i 2010-2012
use persondata
generate utdanning_høy = 0
replace utdanning_høy = 1 if ant_kurs >= 1
tabulate utdanning_høy kjønn