M-Schätzer
M-Schätzer, auch maximum-likelihood-artige Schätzer stellen eine Klasse von Schätzfunktionen dar, die als Verallgemeinerung der Maximum-Likelihood-Methode angesehen werden können. M-Schätzer sind im Vergleich zu anderen Schätzern wie z. B. den Maximum-Likelihood-Schätzern robuster gegen Ausreißer.
Dieser Artikel behandelt M-Schätzer zur Ermittlung des Lageparameters.
Herleitung durch Verallgemeinerung der Maximum-Likelihood-Methode
Das Prinzip von Maximum-Likelihood-Schätzern beruht darauf, die Funktion
mit entsprechender Dichte- bzw. Wahrscheinlichkeitsfunktion in Abhängigkeit von zu minimieren.
Die Idee bei M-Schätzern ist, die Funktion durch eine Funktion zu ersetzen, welche weniger empfindlich auf Ausreißer reagiert. Aufgabe ist es, den Ausdruck
in Abhängigkeit von zu minimieren, bzw. die Gleichung
mit
zu lösen.
Jede Lösung dieser Gleichung wird M-Schätzer genannt.
Implizite Definition
Sei eine beliebige Verteilungsfunktion und eine ungerade und monoton wachsende Funktion ungleich 0. Dann ist definiert als die Lösung der Gleichung
Beachtet werden muss, dass abhängig von der Wahl von und es entweder keine, eine oder mehrere Lösungen geben kann. Im Falle einer konkreten Stichprobe wird , die Lösung von
M-Schätzer genannt.
Geeignete Funktionen ρ
Im Folgenden sind die gemäß
standardisiert, um Skaleninvarianz zu erreichen. stellt hierbei einen Streuungschätzer dar, für den meist der MAD (Median Absolute Deviation) verwendet wird.
Methode | |||
---|---|---|---|
Kleinste-Quadrate-Methode | |||
Huber-k-Schätzer | |||
Hampel-Schätzer | |||
Andrews wave | |||
Tukey's biweight |
Die Gewichtsfunktionen im folgenden Bild zeigen die Unterschiede zwischen den Schätzern auf: bei Huber-k haben auch extreme Beobachtungen ein geringes Gewicht, beim Hampel-, Andrews wave- und Tukey's biweight-Schätzer wird extremen Beobachtungen das Gewicht Null zugeordnet.
Robustheit
Bei geeigneter Wahl von (gerade, beschränkt und monoton steigend) haben M-Schätzer einen Bruchpunkt von
Numerische Lösungsmethode
Für viele Funktionen lässt sich keine explizite Lösung angeben, sie muss daher numerisch berechnet werden. Wie üblich zur Berechnung von Nullstellenproblemen bietet sich auch hier das Newton-Raphson-Verfahren an, und es ergibt sich folgende Iterationsvorschrift, wobei wiederum :
Als geeigneter Startwert wird meist der Median verwendet. Dieses Iterationsverfahren konvergiert sehr schnell, meist sind zwei bis drei Iterationsschritte ausreichend.
W-Schätzer
W-Schätzer sind M-Schätzern sehr ähnlich und liefern im Normalfall gleiche Ergebnisse. Der einzige Unterschied liegt in der Lösung des Minimierungsproblems. W-Schätzer werden meist bei der robusten Regression eingesetzt.
Es wird die Wichtungsfunktion
mit
eingeführt, mit deren Hilfe das Minimierungsproblem umgeschrieben werden kann in
Einsetzen der Definition von , ausmultiplizieren und umstellen ergibt schließlich über die Fixpunktgleichung
die Iterationsvorschrift
Siehe auch
- Sogenannte RANSAC-Algorithmen
Literatur
- Robert G. Staudte: Robust estimation and testing. Wiley, New York 1990. ISBN 0-471-85547-2
- Rand R. Wilcox: Introduction to robust estimation and hypothesis testing. Academic Press, San Diego Cal 1997. ISBN 0-12-751545-3