2.3.2 Datasett med hendelsesopplysninger
I tillegg til å hente ut opplysninger på valgte eller gitte datoer, kan en foreta beregninger basert på hendelser over tid. F.eks. kan en være interessert i å finne individer som giftet seg i løpet av en lengre tidsperiode, som ble arbeidsledig over et gitt tidsspenn, eller som var arbeidsledige i over 6 måneder i en gitt periode. Til dette benyttes kommandoen import-event
som importerer alle records (=hendelser) per enhet (= individ) over et angitt tidsspenn. I tillegg til
variabelnavnet angis 2 tidspunkter for datauttrekkets hhv. start- og stopp-tidspunkt. Da vil alle hendelser som har skjedd mellom de to
tidspunktene hentes til ditt datasett. Datasettet vil inneholde et varierende antall records for hver enhet (= individ), avhengig av hvor
mange endringshendelser som har skjedd for hver enkelt.
Merk at man bare kan importere én hendelsesorganisert variabel til et gitt datasett. En må altså opprette separate datasett for hver hendelsesorganiserte variabel en trenger å arbeide med. Det er likevel mulig å koble på variabler med faste opplysninger, som f.eks. kjønn, fødeland, fødselsdato eller enhetsidentifikatorer (person-id m.m.), vha. kommandoen merge
. Dette gjør det mulig å aggregere et hendelsesdatasett opp til et enhetsdatasett vha. kommandoen collapse()
.
Importen gjøres på følgende måte:
create-dataset <datasett>
import-event <variabel> <startdato> to <stoppdato> as <alias>
Eksempel: Datamatrise ved bruk av import-event (tidsintervall: 2000-01-01 - 2003-01-01)
ID | Start | Stopp | Variabel |
---|---|---|---|
123456 | 2000-01-01 | 2000-05-30 | 1 |
123456 | 2000-05-31 | 2001-12-31 | 4 |
123456 | 2002-01-01 | 2003-08-15 | 2 |
135791 | 2000-04-10 | 2002-03-03 | 2 |
135791 | 2002-03-04 | 2002-11-11 | 3 |
147036 | 2002-02-28 | 2004-07-16 | 1 |
Merk at alle hendelser som overlapper med perioden 2000-01-01 - 2003-01-01 tas med ved import