Om microdata.no

Microdata.no er utviklet i samarbeid mellom NSD - Norsk senter for forskningsdata (NSD) og Statistisk sentralbyrå (SSB) gjennom infrastrukturprosjektet RAIRD finansiert av Norges forskningsråd.

Tjenesten driftes og videreutvikles i samarbeid mellom NSD og SSB, og gir forskere og studenter ved godkjente forskningsinstitusjoner tilgang til å bruke registerdata fra SSB.

  • Forskere og studenter kan bearbeide og analysere alle tilgjengelige registervariabler
  • Data fra Folkeregisteret, Nasjonal utdanningsdatabase (NUDB), Selvangivelsesregisteret og FD-trygd er tilgjengelig
  • Institusjoner som har tegnet avtale om bruk av systemet kan administrere egne brukere
  • Løsningen har et anonymiserende grensesnitt med innebygd personvern

Bakgrunn  

Norge har et godt utviklet og veldokumentert system for registerdata. Noen av de viktigste registrene er også brukt som grunnlag for produksjon av offisiell statistikk.

Slike data er også verdifulle og attraktive som forskningsdata. Tilgangen til å bruke registerdata i forskning i Norge er god, men hensynet til personvern gjør at prosessene rundt søknad om bruk og utlevering av data kan være tid- og kostnadskrevende.

NSD og SSB har gjennom RAIRD-prosjektet og tjenesten microdata.no gjort nye grep for å kunne tilby enklere tilgang til SSBs registerdata. Konseptet i microdata.no er å tilby bruk av ikke-anonymiserte data gjennom en konfidensialtetssikrende plattform, hvor forsker kun er i indirekte kontakt med personopplysninger, hvor data ikke forlater SSB, og hvor plattformen sørger for at all output er anonym.

Muligheter og begrensninger  

Microdata.no gir altså mulighet for rask og enkel tilgang til bruk av registerdata fra Statistisk sentralbyrå.

Forskere meldes inn av egen institusjon (forutsatt at denne har tegnet institusjonsavtale), og kan jobbe med stor grad av fleksiblitet i analysemiljøet.

Tilgangen gjelder samtlige variabler som er gjort tilgjengelig i systemet, og man trenger ikke søke tilgang til spesifikke variabler på forhånd.

Analysemiljøet tilbyr avansert databearbeidingsfunksjonalitet, deskriptiv analyse, aggregering, lineær regresjonsanalyse, logistisk regresjon, etc. Panelmetoder blir faset inn relativt snart.

Begrensninger

  • Forskere kan ikke se på eller laste ned data
  • Forskere kan ikke benytte egne statistikkpakker eller -biblioteker
  • Det er ikke mulig å koble på egne data
  • Utvalget statistiske analyser er begrenset (men vil utvides)
  • All output er gjenstand for konfidensialitetssikring. Metodene er beskrevet i Appendix C i brukermanualen