113 variabler oppdatert til nyeste årgang

 av  Svein Johansen

2. november ble 113 variabler i microdata.no oppdatert til nyeste tilgjengelige årgang.

De oppdaterte variablene ligger i databaseversjon 3. Oppdateringen omfatter data om befolkning, utdanning, sysselsetting, inntekt og trygd. Detaljert informasjon om denne og tidligere oppdateringer ligger i versjonsloggen, som er åpen for alle.

I oppdateringen har befolkningsvariablene fått 2020-data. For utdanning, sysselsetting og trygd er 2019 siste tilgjengelige årgang, og for inntektsdata 2018.

microdata.no inneholder nå 209 variabler, opp fra 124 ved lanseringen i 2018.

Oppdateringene er mulig fordi microdata.no nå er versjonert med ny teknologi som sørger for at endringer i data ikke forstyrrer tidligere analyser. Det betyr at analyser er reproduserbare selv etter lang tid fordi alle skript blir automatisk kjørt mot den versjonen de er skrevet til.

I 2021 vil data bli oppdatert kvartalsvis. Parallelt med dette fortsetter arbeidet med å bygge ut datatilfanget. Fram til og med 2023 har vi planlagt å legge inn 1 000-1 500 nye variabler fra SSB. I tillegg vil det komme data fra andre kilder, og vi har som mål å utvikle løsninger der brukerne kan legge inn sine egne data i tjenesten.

Du selv bestemmer hvilken eller hvilke versjoner av data du vil bruke ved å angi versjon før du bygger populasjonen og legger til variabler. Kommandoen heter «require». Syntaksen ser du her.

Muligheten til å inkludere flere versjoner av data i samme kjøring gir en helt ny mulighet til å sammenlikne dataversjonene. På den måten kan du kontrollere for effekter av endringer i datagrunnlaget.