Trekke tilfeldige utvalg fra en totalpopulasjon

Eksempelet under demonstrerer hvordan en kan trekke ut tilfeldige utvalg fra en totalpopulasjon/større populasjon. Dette gjøres vha. kommandoen sample.

Første inputparameter angir størrelsen på uttrekket. Om dette er et desimaltall (0.0-1.0), trekkes det ut en andel. Ønsker en et tilfeldig uttrekk av et spesifikt antall individer, oppgis et heltall > 1000.

Siste inputparameter er et egendefinert positivt heltall som en står fritt til å velge selv, dvs. et seed-nummer. Dette sikrer at individene i utvalget en trekker ut blir identisk ved påfølgende kjøringer. Om en ønsker å trekke flere utvalg bestående av nye personer for hvert uttrekk, velges et nytt seed-nummer for hver gang kommandoen kjøres.

//Lager datasett med alle bosatte i Norge per 1/1 2015 og trekker så ut et 10% utvalg av disse
create-dataset totalpop
import BEFOLKNING_REGSTAT 2015-01-01 as registerstatus15
keep if registerstatus15 == '1'
sample 0.1 999

//Lager datasett med alle bosatte i Norge per 1/1 2015 og trekker så ut et utvalg bestående av 5000 individer
create-dataset totalpop2
import BEFOLKNING_REGSTAT 2015-01-01 as registerstatus15
keep if registerstatus15 == '1'
sample 5000 888

//Lager datasett med alle bosatte i Norge per 1/1 2015 og trekker så ut et utvalg bestående av 5000 nye individer (forskjellige fra forrige uttrekk)
create-dataset totalpop3
import BEFOLKNING_REGSTAT 2015-01-01 as registerstatus15
keep if registerstatus15 == '1'
sample 5000 950