Lage datasett bestående av ektefeller og par
Microdata.no tilbyr en rekke demografivariabler som gjør det mulig å blant annet finne ektefeller, samboere og partnere, og bruke dette til å koble sammen opplysninger om begge parmedlemmer til bruk i diverse analyser.
Variabelen BEFOLKNING_REGSTAT_FAMNR inneholder familieidentitetsnummeret til hvert enkelt individ, der alle familiemedlemmer har den samme verdien på familienummeret. Dette kan brukes til å lage familieopplysninger eller til å aggregere data opp til familienivå. Og siden familienummeret defineres av personidentitetsnummeret til eldste person i familien, kan en bruke dette i kombinasjon med andre familieopplysninger til å finne personer som lever sammen som par (ektefeller, samboere, partnere):
- Start med å lage et datasett bestående av opplysninger om:
- Familienummer
- Personkode
- Parstatus (valgfri)
- Ønskede opplysninger tilleggsopplysninger, f.eks. yrke
- Selekter på eldste person i hver familie. Bruk variabelen personkode til dette (personkode = ‘1’)
- Lag et nytt datasett der du importerer de samme variablene, men der du selekterer på yngste person i hver familie (personkode = ‘2’). Barn holdes utenfor siden disse har en egen personkode (personkode = ‘3’).
- Flytt deg over igjen til datasettet med de eldste, og koble de aktuelle variablene sammen med datasettet for de yngste. Siden de yngste har informasjon om hvem som er eldst i familien (= familienummeret), kan dette brukes som koblingsnøkkel og en får som resultat et datasett for alle par.
- Til slutt flytter du deg over til datasettet for de yngste som nå inneholder data for begge par, for alle par i din populasjon.
//Kobler til databasen
require no.ssb.fdb:23 as ds
//Lager datasett bestående av eldste person i hver familie
create-dataset eldst
import ds/BEFOLKNING_REGSTAT_FAMNR 2021-01-01 as famnr
import ds/BEFOLKNING_REGSTAT_PERSONKODE 2021-01-01 as personkode_eldst
import ds/BEFOLKNING_PARSTATUS 2021-01-01 as parstatus_eldst
import ds/REGSYS_ARB_YRKE_STYRK08 2020-11-16 as yrke_eldst
keep if personkode_eldst == '1'
//Lager datasett med yngste person i hver familie, og som ikke er barn
create-dataset yngst
import ds/BEFOLKNING_REGSTAT_FAMNR 2021-01-01 as famnr
import ds/BEFOLKNING_REGSTAT_PERSONKODE 2021-01-01 as personkode_yngst
import ds/BEFOLKNING_PARSTATUS 2021-01-01 as parstatus_yngst
import ds/REGSYS_ARB_YRKE_STYRK08 2020-11-16 as yrke_yngst
keep if personkode_yngst == '2'
//Bruker datasettet med eldste personer og kobler tilhørende variabler inn i datasett med yngste personer via familienummer (familienummer = eldste persons id-nummer)
use eldst
merge personkode_eldst parstatus_eldst yrke_eldst into yngst on famnr
//Datasettet yngst inneholder nå data om begge ektefeller/parmedlemmer for alle par i befolkningen. Kjører kontrolltabeller
use yngst
tabulate personkode_yngst, missing
tabulate personkode_eldst, missing
tabulate parstatus_yngst, missing
tabulate parstatus_eldst, missing
tabulate yrke_eldst, missing
tabulate yrke_yngst, missing
//Sjekke om begge, en eller ingen av ektefellene/parmedlemmene er i jobb
generate jobb_yngst = 1 if sysmiss(yrke_yngst) == 0
generate jobb_eldst = 1 if sysmiss(yrke_eldst) == 0
tabulate jobb_eldst jobb_yngst, missing