Skip to main content

5.13.2 Kaplan-Meier

Dette er den enkleste og kanskje vanligste typen overlevelsesanalyse. Standardresultat fra en slik analyse er kaplan-meier-grafer som typisk viser en trappetrinnformet kurve som går nedover langs x-aksen (tid). Selve kurven viser overlevelsesraten som funksjon av tid, og er gitt vedfølgende formel:

I tillegg til grafer vises også nøkkeltall for den aktuelle analysepopulasjonen. Kaplan-Meier kan også brukes til å lage bivariat analyse av overlevelsesraten der man ser på forskjeller mellom grupper av populasjonen. Dette gjøres gjennom bruk av en by-opsjon der man kan vise separate kurver for hver gruppe i en og samme graf.

Kaplan-Meier er en ikke-parametrisk analyseform for enkle overlevelsesanalyser, men kan også brukes som hjelpeverktøy for å sette opp mer avanserte analyser, f.eks. multivariate Cox-analyser: Ved å studere Kaplan-Meier-grafer kan man sammenlikne overlevelsesratene for de ulike gruppene av individer man grupperer gjennom forklaringsvariabler, og se om det er signifikante forskjeller i overlevelsesraten mellom f.eks. kvinner og menn. Om kurvene ikke overlapper, er dette et tegn på at den aktuelle forklaringsvariabelen kan benyttes som forklaringsvariabel til en multivariat analyse.

Etter at datasettet er tilrettelagt for overlevelsesanalyse, jfr. kap. 5.11.1, kan du kjøre en kaplan-meier-analyse gjennom å bruke kommandoen kaplan-meier der man først angir variabelen «hendelse» og deretter «tid» (rekkefølgen er viktig).

Eksempler:

Typiske resultat:

Måleperiode 2010-01-01 - 2019-12-15. Utvalgsstørrelse = 10000. Hendelse = arbeidsledig. Tid = antall år. Gruppert på aldergrupper målt i 2010.


Samme datasett som figur over, der tid = antall dager.


TOLKNING AV RESULTAT
  • Kurvene er gitt ved Kaplan-Meier-formelen for hver av aldergruppene. De yngste kommer best ut med en høyere «overlevelsesgrad» (blir i mindre grad arbeidsledige over tid).

  • De skraverte områdene representerer standard log-log 5% konfidensintervall tilknyttet overlevelsesraten for hver av aldersgruppene. Disse vil være mindre synlig ved store populasjoner.

  • «Akkumulert overlevelsestid»: Summen av tid målt over alle enheter i populasjonen (innen hver aldergruppe).

  • «Hendelsesrate»: Antall hendelser inntruffet (antall enheter med hendelse = 1) dividert med «akkumulert overlevelsestid».

  • «Antall»: Antall enheter (for hver av aldersgruppene).

  • «75%»: Tid målt der hvor overlevelsesraten = 0.75 (for hver av aldergruppene).

  • «50%»: Tid målt der hvor overlevelsesraten = 0.5 (for hver av aldersgruppene). Også kalt «median overlevelsestid».

  • «25%»: Tid målt der hvor overlevelsesraten = 0.25 (for hver av aldersgruppene).


\rhd [Eksempel: Tilrettelegging av data for overlevelsesanalyser, deriblant Kaplan-Meier-analyser](docs\eksempel\Regresjonsanalyser\Hvordan tilrettelegge data for overlevelsesanalyse.md)