1.2 Variabler og variabelbeskrivelser
Microdata.no har en lang rekke demografiske, utdanningsrelaterte, økonomiske, sysselsettingsrelaterte og trygderelaterte variabler i databanken. Disse kan en få en oversikt over gjennom å utforske variabeloversikten en finner på åpningssiden (https://microdata.no/discovery):
Variabellisten viser en oversikt over samtlige variabler i databanken (437 i SSBs databank per august 2023), og en kan bruke søkefunksjonalitet for å lettere kunne finne variabler en leter etter.
Det er også mulig å filtrere søk ved å huke av på ønsket databank, emneområde, datatype, enhetstype, nøkkelvariabel og/eller temporalitet.
Ved å klikke på en variabel i variabellisten, får en opp definisjoner, kodelister, endringshistorikk og annen nøkkelinformasjon knyttet til den spesifikke variabelen:
Merk at kodelisten for en gitt variabel endres over tid. Dette må en ta hensyn til dersom en jobber med lengre tidsserier som strekker seg bakover i tid. Det er nemlig gjeldende kodeliste for det aktuelle tidspunktet en må forholde seg til. Spesielt kommunekoder, utdanningskoder og næringskoder har relativt hyppige endringer i kodelistene. Ved å klikke på punktene foran tidspunktene som angir start for en ny kodeversjon, får en opp gjeldende kodeliste for den aktuelle tidsperioden. Om en klikker på angivelsen av antallet endringer, får en opp en oversikt over hvilke endringer som er blitt gjort for samme tidsperiode:
Som illustrasjonen nedenfor viser, finnes det også en fullstendig variabeloversikt nederst til venstre inne i selve kommandovinduet. Også her kan en filtrere variabellisten ved å skrive inn deler av et variabelnavn i søkefeltet. Som for variabelisten en finner på åpningssiden, fungerer søket både mot variabelbeskrivelse og selve navnet. På den måten blir det lettere å finne variabelen en ønsker.
Alle variabler vises med en tilhørende tidslinje som markerer gyldighetsperioden(e), dvs. hvilket tidsspenn som er dekket. Variabler i microdata.no er tredimensjonale - de inneholder tid. Ved å "klikke" på variabler i listen kan en hente frem deskriptiv statistikk og annen informasjon som variabeltype o.l.
I eksempelet nedenfor blir dette eksemplifisert for variabelen "Sivilstand". Variabelen presenteres da i et eget vindu som en kan flytte på og justere. Det gir detaljert informasjon om variabelen:
-
Nøkkelinformasjon: Variabelnavn, variabel-label, variabelbeskrivelse, variabeltype
-
Detaljert interaktiv tidslinje som gir mulighet til å studere endringer i kodingen over tid: Endringer i kodingen vises gjennom ulike farger som illustrerer hvilke tidsperioder de gjelder for. Klikker en på de ulike feltene i tidslinjen får en frem en liste over de kodene som var gyldige i den aktuelle perioden. I eksempelet er det markert i feltet som gjelder 1. august 1993 - 31. desember 2016, og det dukker da opp en liste på 10 kategorier
-
Informasjon om endringer: I eksempelet vises det "4 endringer". Dette er antallet endringer i forhold til forrige tidsperiode. En kan klikke på "4 endringer", og få opp en liste over kodene som er nye
For variabler som er importert til brukerens datasett ("demografidata") vises det en litt annen type informasjon som kan være nyttig når en arbeider med mange ulike variabler. Denne informasjonen justerer seg fortløpende dersom en endrer på variablene, og vises i separate popup-vinduer når en klikker på variabler i listen tilhørende det aktuelle datasettet ditt:
-
Formel: Øverst i vinduet finner en "skapelseshistorikken" til den aktuelle variabelen. Dette brukes til å slå opp hvordan en variabel har blitt laget eller omkodet
-
Nøkkelinformasjon: Variabeltype og antall enheter som har verdi for manglende data (sysmiss)
-
Frekvensfordeling og enkel statistikk: For kategoriske variabler vises frekvensfordelingen, mens det for kontinuerlige variabler vises en standard boksplot med boks for de to midterste kvartilene, gjennomsnitt og minimums- og maksimumsverdi (såkalte whiskers). Om verdier blir uleselige pga. overlapp, så kan dette popup-vinduet utvides.