2.6 Filtrering av datasettutvalg
Filtrering av datasett gjøres gjennom å bruke kommandoene drop
eller keep
etter at man først har laget et datasett ved hjelp av en import-kommando:
import ds/BEFOLKNING_KJOENN as kjønn
drop if kjønn == '1'
If-betingelser kan brukes i mange sammenhenger i microdata.no, og kan bygges opp med de vanlige logiske operatorene:
-
Større enn:
>
-
Mindre enn:
<
-
Er lik:
==
-
Større enn eller lik:
>=
-
Mindre enn eller lik:
<=
-
Er ulik:
!=
-
Eller:
|
-
Og:
&
For å fjerne personer under 18 år fra utvalget, kan en skrive følgende:
keep if alder >= 18
Verdi for manglende data ("missingverdier") kan angis på følgende måte:
sysmiss(<variabel>)
For å fjerne alle individer uten oppgitt lønnsinntekt, kan en da skrive:
drop if sysmiss( lonn )
Det er også mulig å trekke et tilfeldig utvalg av en datapopulasjon. Dette gjøres med kommandoen sample
. For mer om syntax og eksempler, bruk kommandoen help sample
.