Lage datasett bestående av ektefeller og par

Microdata.no tilbyr en rekke demografivariabler som gjør det mulig å blant annet finne ektefeller, samboere og partnere, og bruke dette til å koble sammen opplysninger om begge parmedlemmer til bruk i diverse analyser.

Variabelen BEFOLKNING_REGSTAT_FAMNR inneholder familieidentitetsnummeret til hvert enkelt individ, der alle familiemedlemmer har den samme verdien på familienummeret. Dette kan brukes til å lage familieopplysninger eller til å aggregere data opp til familienivå. Og siden familienummeret defineres av personidentitetsnummeret til eldste person i familien, kan en bruke dette i kombinasjon med andre familieopplysninger til å finne personer som lever sammen som par (ektefeller, samboere, partnere):

  1. Start med å lage et datasett bestående av opplysninger om:
    • Familienummer
    • Personkode
    • Parstatus (valgfri)
    • Ønskede opplysninger tilleggsopplysninger, f.eks. yrke
  2. Selekter på eldste person i hver familie. Bruk variabelen personkode til dette (personkode = ‘1’)
  3. Lag et nytt datasett der du importerer de samme variablene, men der du selekterer på yngste person i hver familie (personkode = ‘2’). Barn holdes utenfor siden disse har en egen personkode (personkode = ‘3’).
  4. Flytt deg over igjen til datasettet med de eldste, og koble de aktuelle variablene sammen med datasettet for de yngste. Siden de yngste har informasjon om hvem som er eldst i familien (= familienummeret), kan dette brukes som koblingsnøkkel og en får som resultat et datasett for alle par.
  5. Til slutt flytter du deg over til datasettet for de yngste som nå inneholder data for begge par, for alle par i din populasjon.
//Kobler til databasen
require no.ssb.fdb:23 as ds

//Lager datasett bestående av eldste person i hver familie
create-dataset eldst
import ds/BEFOLKNING_REGSTAT_FAMNR 2021-01-01 as famnr
import ds/BEFOLKNING_REGSTAT_PERSONKODE 2021-01-01 as personkode_eldst
import ds/BEFOLKNING_PARSTATUS 2021-01-01 as parstatus_eldst
import ds/REGSYS_ARB_YRKE_STYRK08 2020-11-16 as yrke_eldst
keep if personkode_eldst == '1'

//Lager datasett med yngste person i hver familie, og som ikke er barn
create-dataset yngst
import ds/BEFOLKNING_REGSTAT_FAMNR 2021-01-01 as famnr
import ds/BEFOLKNING_REGSTAT_PERSONKODE 2021-01-01 as personkode_yngst
import ds/BEFOLKNING_PARSTATUS 2021-01-01 as parstatus_yngst
import ds/REGSYS_ARB_YRKE_STYRK08 2020-11-16 as yrke_yngst
keep if personkode_yngst == '2'

//Bruker datasettet med eldste personer og kobler tilhørende variabler inn i datasett med yngste personer via familienummer (familienummer = eldste persons id-nummer)
use eldst
merge personkode_eldst parstatus_eldst yrke_eldst into yngst on famnr 

//Datasettet yngst inneholder nå data om begge ektefeller/parmedlemmer for alle par i befolkningen. Kjører kontrolltabeller
use yngst
tabulate personkode_yngst, missing
tabulate personkode_eldst, missing
tabulate parstatus_yngst, missing
tabulate parstatus_eldst, missing
tabulate yrke_eldst, missing
tabulate yrke_yngst, missing

//Sjekke om begge, en eller ingen av ektefellene/parmedlemmene er i jobb
generate jobb_yngst = 1 if sysmiss(yrke_yngst) == 0
generate jobb_eldst = 1 if sysmiss(yrke_eldst) == 0
tabulate jobb_eldst jobb_yngst, missing