Kaplan-Meier-Schätzer
Der Kaplan-Meier-Schätzer (auch Produkt-Grenzwert-Schätzer, kurz: PGS) dient zum Schätzen der Wahrscheinlichkeit, dass bei einem Versuchsobjekt ein bestimmtes Ereignis innerhalb eines Zeitintervalls nicht eintritt. Es handelt sich um eine nichtparametrische Schätzung der Überlebensfunktion im Rahmen der Ereigniszeitanalyse. Die zu Grunde liegenden Daten können rechts-zensiert sein. Diese Methode wurde 1958 von Edward L. Kaplan und Paul Meier entwickelt.[1]
Die Bezeichnung Produkt-Grenzwert-Schätzer rührt daher, dass man diesen Schätzer als Grenzwert von Sterbetafelschätzungen mit gegen null gehenden Intervalllängen interpretieren kann.
Rechenvorschrift
Der Kaplan-Meier-Schätzer für die Überlebensfunktion (also die Wahrscheinlichkeit dafür, dass die Zeit bis zum Eintreten des Ereignisses überschreitet) ist gegeben durch:
mit
- Versuchsobjekte, bei denen das Ereignis zum Zeitpunkt eingetreten ist
- Versuchsobjekte zum Zeitpunkt unter Risiko
Beispiel
Zugrunde liegend soll folgende Tabelle sein:
Objekt Nr. | Zeit t (Tage) | 1=Ereignis eingetreten, 0=Zensiert |
Unter Risiko
n(t) |
S(t) |
---|---|---|---|---|
#1 | 1 | 0 | 15 | 1 |
#2 | 12 | 1 | 14 | 0,93 |
#3 | 22 | 0 | ||
#4 | 29 | 1 | 12 | 0,85 |
#5 | 31 | 1 | 11 | 0,77 |
#6 | 36 | 0 | ||
#7 | 38 | 0 | ||
#8 | 50 | 0 | ||
#9 | 60 | 0 | ||
#10 | 61 | 1 | 6 | 0,64 |
#11 | 70 | 1 | 5 | 0,52 |
#12 | 88 | 0 | ||
#13 | 99 | 0 | ||
#14 | 110 | 0 | ||
#15 | 140 | 0 |
Stellt die Tabelle die Ergebnisse einer klinischen Studie dar, so repräsentiert sie folgendes Geschehen:
Anfänglich sind 15 Patienten vorhanden. Sie stehen aber „unter Risiko“, d. h. bei ihnen ist das Ereignis noch nicht eingetroffen.
Tag 1: Ein Patient geht bereits nach einem Tag in der Studie verloren, d. h., er hat die Studie verlassen, ohne dass bei ihm bis dahin das Ereignis eingetreten ist (z. B. letzte Beobachtung 1 Tag vor Studienende).
Solche durch Zensur verursachten Terme sind immer 1 und werden daher in den folgenden Berechnungen nicht mehr mitgeschrieben. Er wird zensiert, somit stehen nun nur noch 14 Patienten unter Risiko.
Tag 12: Bei einem Patienten tritt das Ereignis ein.
Es stehen nun noch 13 Patienten unter Risiko.
Tag 22: Ein weiterer Patient muss zensiert werden. ändert sich nicht:
Die Anzahl der Patienten unter Risiko verringert sich auf 12.
Tag 29: Bei einem weiteren Patienten tritt das Ereignis ein.
Es stehen nun 11 Patienten unter Risiko.
usw.
Deshalb stehen die am längsten beobachteten Patienten am Ende der Kurve. Durch die reduzierte Anzahl an Patienten unter Risiko steigt auch die Unsicherheit der Schätzung für das Risiko zum späteren Zeitpunkt (breiteres Konfidenzintervall).
Eigenschaften
Konfidenzintervall
Das Konfidenzintervall kann wie gewohnt aus der Varianz bzw. dem Standardfehler berechnet werden.
Diese Formel wird auch als Greenwood-Formel oder Greenwoodsche Formel bezeichnet.
Das 95 %-Konfidenzintervall lautet somit:
Siehe auch
Literatur
- A. Ziegler, S. Lange & R. Bender: Überlebenszeitanalyse: Eigenschaften und Kaplan-Meier Methode. Deutsche Medizinische Wochenschrift, 132(S 01) (2007), S. e36–e38. doi:10.1055/s-2007-959038
- Karl Michael Ortmann: Praktische Lebensversicherungsmathematik, Springer Spektrum, Wiesbaden 2016, ISBN 978-3-658-10199-2, S. 74–77.
Weblinks
- StatistikGuru.de – Anleitung zur Berechnung des Kaplan-Meier-Schätzers mit SPSS (mit Online-Rechner für paarweise Vergleiche)
Einzelnachweise
- Edward L. Kaplan & Paul Meier: Individual Nonparametric Estimation from Incomplete Observations. Journal of the American Statistical Association, 53(282) (1958), S. 457–481. doi:10.1080/01621459.1958.10501452 JSTOR 2281868