Ofte stilte spørsmål

Hva er microdata.no?

microdata.no er en tjeneste som er utviklet for gjøre det enklere og raskere å bruke registerdata i forskning.

Norge har mange gode kilder til registerdata, og norsk lov åpner for at de kan brukes til forskning. Søknadsprosessen rundt utlån av avidentifiserte mikrodata fra registre er imidlertid omfattende. I tillegg er tilrettelegging av datasett for utlån tid- og kostnadskrevende.

I microdata.no gjøres registerdata tilgjengelig på en måte som gjør at:

  • det ikke lenger er nødvendig å søke om konsesjon eller dispensasjon fra dataeier for å få tilgang gjennom det anonymiserende grensesnittet
  • SSB ikke behøver å legge tilrette datasett etter bestilling; forskeren legger selv til rette de data en vil bruke gjennom grensesnittet

Hva er sammenhengen mellom microdata.no og RAIRD?

Tjenesten microdata.no er et resultat av prosjektet RAIRD, og bygger på teknologiløsninger, data og metadata utviklet i prosjektet.

RAIRD står for “Remote Access Infrastructure to Register Data” og er et samarbeidsprosjekt mellom NSD - Norsk senter for forskningsdata og Statistisk sentralbyrå (SSB). Prosjektet er finansiert av Norges forskningsråd under programmet Nasjonal satsing på forskningsinfrastruktur (INFRASTRUKTUR).

Hvilke registre vil inngå i microdata.no?

Registre som SSB selv har behandlingshjemmel for (innsamlet med hjemmel i Statistikkloven) Dette gjelder:

  • Folkeregisteret
  • Nasjonal utdanningsdatabase (NUDB)
  • Selvangivelsesregisteret
  • Arbeidsmarkedsdata
  • Forløpsdatabasen FD-Trygd

Når ble microdata.no lansert?

Første offentlig tilgjengelige versjon av microdata.no ble lansert i mars 2018.

Kan man kun kjøre deskriptive analyser i microdata.no?

Nei. Analysemiljøet støtter også linær og logistisk regresjon (logit, probit, mlogit), variansanalyse, panelregresjon (klar om kort tid), m.m.

Den teknologiske løsningen legger ingen begrensninger for hvilke analyser som kan støttes (se eget punkt om hvilke statistikkbiblioteker som brukes nedenfor), men all funksjonalitet som fases inn må gjennom tester, vurderinger og eventuelle konfidensialiserende tiltak først.

Flere analysemuligheter er på vei.

Analysemiljøet er også et databearbeidingsmiljø, med støtte for populasjonsavgrensninger, kobling, aggregering/disaggregering og utvikling av egne variabler.

Inneholder microdata.no anonyme data?

Nei. microdata.no inneholder komplette, umodifiserte data der direkte personidentifikasjon er slettet. Personvernet ivaretas gjennom et “anonymiserende grensesnitt” som gir tilgang til bearbeiding og analyse av dataene, men hvor man ikke kan se eller få kjennskap til personopplysningene.

Er microdata.no hovedsaklig et tilbud til mastergradsstudenter?

Nei. Tjenesten er en nasjonal infrastruktur for forskning på registerdata, og målet er å forenkle og forbedre tilgangen til slike data for alle grupper av forskere som kvalifiserer for tilgang.

Mastergradsstudenter ble ofte brukt som eksempel i omtalen av RAIRD-prosjektet, fordi denne gruppen i dag av tids- og kostnadsmessige årsaker er avskåret fra å forske på registerdata (utover et 20%-utvalg av FD-Trygd).

microdata.no skal være en infrastruktur som bedrer tilgangen for alle grupper av forskere.

Vil microdata.no medføre endring av nåværende utlån av registerdata til forskning?

Nei, formålet med prosjektet er å stimulere til mer forskning og etablering av flere miljø som forsker på registerdata.

Suksesskriteriet for microdata.no er at systemet blir så bra at det på sikt kan stå for eller effektivisere brorparten av dataformidlingen fra SSB. Målet er slik sett at en størst mulig gruppe forskere vil kunne utføre mer av sitt arbeid med registerdata gjennom microdata.no. Den eksisterende ordningen blir ikke lagt ned, men microdata.no skal supplere den gjeldende ordningen i muligheter og volum.

Microdata vil kunne spille en positiv rolle for miljøer som fortsatt vil søke om utlån av mikrodata fordi systemet kan brukes til utforskning/analyse av datatilfanget i forkant av eller som en del av søknadsprosessen for utlån.

Hvordan kan jeg søke om tilgang til microdata.no?

Informasjon om dette finner du på Hvordan få tilgang.

Hvorfor får man ikke adgang til å se direkte på dataene i microdata.no?

Den forenklede tilgangen i microdata.no (som reduserer tidsbruk og kostnader knyttet til tilgang) bygger på en modell hvor mikrodata hverken lastes ned eller er tilgjengelig for direkte visuell inspeksjon. Forskeren må i stedet bruke dokumentasjon (metadata), samt de bearbeidings-, analyse- og visualiseringsteknikker som foreligger for å gjøre seg kjent med data.

Hvis det likevel er nødvendig å se på data, eller å koble egne data sammen med registerdata, iverksettes regelverket for utlån av mikrodata (inkludert dispensasjonssøknad, eventuell konsesjonssøknad, etc). I en slik situasjon kan forskeren bruke microdata.no til å strømlinjeforme søknadsprosessen gjennom utforskning av data og tilrettelegging av egne datasett som det så kan søkes tilgang til etter gjeldende retningslinjer.

Kan man koble på egne data i microdata.no?

Ikke per i dag. Kobling av egne data til registerdata medfører høyere risiko for identifisering av enkeltindivider, og er ikke i samsvar med tjenestens forenklede modell for tilgang. SSB som koblingsinstans har heller ikke behandlingshjemmel for brukernes “egne data”. Derfor krever slike problemstillinger at det må søkes om nødvendige tillatelser.

Det vil være mulig å utrede og utvikle modeller og verktøy for kobling av egne data i microdata.no i fremtidige videreutviklingsprosjekter.

Har brukere adgang til å bruke vanlige statistikkpakker i microdata.no?

Nei. Tradisjonelle statistikkpakker og -verktøy som Stata, SAS, SPSS, R, Python, etc, er ikke kompatible med anonymiseringsmodellen som er valgt i tjenesten, hvor bearbeiding og analyse utføres i et kontrollert miljø som gjør det mulig å sikre datakonfidensialiteten gjennom hele analyseprosessen.

microdata.no tilbyr et alternativt grensesnitt for import, bearbeiding og analyse og visualisering av registerdata (både forløpsdata og statusdata). Dette grensesnittet ivaretar personvernet og støtter samtidig velkjente analyseteknikker og arbeidsmåter. microdata.no skiller seg fra vanlige statistikkpakker ved at vesentlig mer metadata (informasjon, datadokumentasjon) er fullt integrert i verktøyet.

Hvilke statistikkpakker/biblioteker benyttes i microdata.no-plattformen?

Algoritmene som benyttes hentes fra åpne og velprøvde programvarebiblioteker og -moduler.

Per i dag benyttes følgende moduler fra programmeringsmiljøet Python:

Vil microdata.no få støtte for nye statistiske metoder etter hvert?

Ja. Tjenesten vil være i stadig utvikling og vi vil innlemme flere analysemetoder etterhvert. Før en analyseteknikk kan bli inkludert, vil vi vurdere den med tanke på konfidensialitetssikring, og eventuelt implementere avsløringskontroll for output fra analyser.

Behov og ønsker rundt funksjonalitet kommuniseres til support@microdata.no

Kan man bruke/installere “plugins” i microdata.no?

Konfidensialitetshensyn gjør at vi må gjennomgå alle analysetyper og -funksjoner før de blir innlemmet i systemet. Det er derimot fullt mulig å be om at nye algoritmer/metoder blir lagt til, og det vil bli etablert et apparat for å håndtere denne type forespørsler.

Behov og ønsker rundt funksjonalitet kommuniseres til support@microdata.no

Vil man ikke avsløre sensitive data med et slikt system? Hva med personvernet?

microdata.no er gjennom RAIRD-prosjektet utviklet med en helhetlig tilnærming til personvern og konfidensialitetssikring, og teknologien ivaretar innebygd personvern langs flere akser:

  • Dataene kan ikke inspiseres eller lastes ned
  • Analyser, grafikk og annen output fra systemet er anonym
  • Systemet kan kun brukes av forskere og studenter fra godkjente forskningsinstitusjoner
  • Bruk reguleres av avtaler mellom SSB og institusjonene
  • Innlogging skjer vha sterk autentisering (ID-porten)
  • All bruk av systemet logges i 5 år

microdata.no gjør det mulig å forske på registerdata, men de aktuelle data ligger beskyttet mot direkte tilgang, slik at en bruker ikke får ut identifiserende eller sensitiv informasjon.

Hvordan skal jeg kunne analysere data uten å få se dem?

Visuell inspeksjon av data er tradisjonelt en mye brukt teknikk for å forstå data, og for å verifisere og kontrollere stegene i en databearbeidingsprosess. I microdata.no er det ikke mulig å se datamatrisene. Det er derfor utviklet metadataløsninger og deskriptive teknikker og andre hjelpemidler som skal bidra til forståelse av data og kontroll av databearbeidingsprosesser uten direkte visuell tilgang til de enkelte dataverdiene.

Kan hvem som helst registrere seg som bruker?

Nei. Kun forskere og studenter ved godkjente forskningsinstitusjoner får tilgang.

Informasjon om dette finner du på Hvordan få tilgang.

Hvorfor skiller microdata.no seg fra registerdataløsningene i f.eks. Sverige og Danmark?

Løsningene i Sverige og Danmark er er basert på en såkalt “Remote Access”-tilnærming (RA), hvor forskere gis fjerntilgang til mikrodata (som er tilrettelagt i henhold til en bestilling) via Citrix- eller Remote Desktop-lignende løsninger, og hvor analyseresultater blir gjenstand for manuell personvernrelatert avsløringskontroll. Etter norsk lovverk vil denne type løsning utløse samme krav til dispensasjoner og konsesjoner som gjelder i dag, og RA-modellen ble derfor ikke funnet hensiktsmessig for RAIRD/microdata.no.

RAIRD-modellen skiller seg fra RA-modellene ved at direkte visuell tilgang til mikrodata forhindres gjennom et anonymiserende grensesnitt. Modellen forenkler tilgangsprosessen og eliminerer i stor grad behovet for at datasett tilrettelegges ut fra detaljerte bestillinger i forkant.

I stedet får forskere frihet til selv å sette sammen og tilrettelegge datasett med utgangspunkt i registerdatakildene. Ambisjonen for microdata.no er på sikt å dekke mer og mer av de databearbeidings- og analysesmuligheter som forskere har behov for.

Tilgangsmodellen er valgt fordi den gir følgende fordeler målt opp mot tradisjonelle modeller:

  • Forskeren kan i microdata.no eksplorere data fritt og selv legge tilrette datasett med utgangspunkt i registerkildene
  • Søknadsprosessen rundt tilgang forenkles betraktelig i og med at forskeren kun får benytte mikrodata gjennom et anonymiserende grensesnitt
  • Konfidensialitetssikring kan automatiseres

RAIRD-modellen har også visse ulemper målt opp mot de svenske og danske systemene:

  • Grensesnittet er nyutviklet, og inspirert av, men ikke identisk likt eksisterende statistikkpakker
  • Forskeren får ikke se mikrodata direkte
  • Påkobling av egne data er ikke mulig uten videre
  • Utvikling av egne statistiske metoder og bruk av “plug-ins” blir mer tungvint fordi alle nye metoder må testes og godkjennes i henhold til anonymiseringskriteriene i tjenesten

Disse egenskapene er valgt for å oppnå målet om en anonymiserende plattform for registerforskning og dermed raskere og forenklet tilgang.

I situasjoner hvor det er nødvendig å se på data, eller å koble egne data sammen med registerdata, kommer regelverket for utlån av mikrodata inn (inkludert dispensasjonssøknad, eventuell konsesjonssøknad, etc). I en slik situasjon kan forskeren bruke microdata.no til å informere søknadsprosessen gjennom utforskning av data og tilrettelegging av de ønskede data fra SSB, som det så kan søkes tilgang til etter gjeldende retningslinjer.