Lagemaß (Stochastik)
Ein Lagemaß[1] oder Lageparameter[2] ist in der Stochastik eine Kennzahl der Verteilung einer Zufallsvariable beziehungsweise eines Wahrscheinlichkeitsmaßes. Anschaulich ist es die Aufgabe eines Lagemaßes, den „typischen“ Wert einer Zufallsvariable anzugeben. In Abgrenzung dazu gibt ein Dispersionsmaß an, wie sehr die Zufallszahlen um den typischen Wert streuen würden.
Der Begriff des Lagemaßes und des Lageparameters wird in der Literatur nicht immer eindeutig verwendet. So spricht man in der Statistik auch von Lageparametern von Stichproben oder nennt bei Wahrscheinlichkeitsmaßen, deren Lage durch Wahl eines Parameters bestimmt werden kann, diesen Parameter Lageparameter. Eine genaue Abgrenzung erfolgt im unten stehenden Abschnitt.
Typische Lagemaße
Erwartungswert
Klassisches Lagemaß ist der Erwartungswert. Er ist allgemein definiert als
für eine reelle Zufallsvariable auf dem Grundraum , versehen mit dem Wahrscheinlichkeitsmaß . Anschaulich entspricht der Erwartungswert dem „Schwerpunkt“ der Wahrscheinlichkeitsverteilung. Dem Erwartungswert zugeordnete Dispersionsmaße sind beispielsweise die Varianz und die Standardabweichung. Ein Nachteil des Erwartungswertes ist, dass er im Allgemeinen nicht existieren muss, wie die Cauchy-Verteilung zeigt.
Median
Eine Zahl heißt ein Median, wenn
- und
ist (oder allgemeiner über die verallgemeinerte inverse Verteilungsfunktion). Ein Median ist also ein Wert, der die Wahrscheinlichkeitsverteilung so trennt, dass jede Hälfte die Wahrscheinlichkeit 0,5 hat. Bei entsprechender Definition existiert der Median im Gegensatz zum Erwartungswert immer, ist aber nicht eindeutig. Ein mit dem Median assoziiertes Dispersionsmaß ist beispielsweise der Interquartilabstand.
Modus
Als Modus bezeichnet man bei diskreten Wahrscheinlichkeitsmaßen diejenige Stelle, an der die Wahrscheinlichkeitsfunktion ein Maximum annimmt, entsprechend bei Wahrscheinlichkeitsmaßen mit Wahrscheinlichkeitsdichtefunktion diejenige Stelle, an der die Wahrscheinlichkeitsdichtefunktion ein Maximum annimmt. In diesen beiden Fällen existiert der Modus immer, ist aber nicht notwendigerweise eindeutig. Beispiel hierfür sind die bimodalen Verteilungen. Außerdem gibt es auch Wahrscheinlichkeitsmaße ohne Wahrscheinlichkeitsdichtefunktion, wie die Cantor-Verteilung.
Beispiele
Die folgenden Beispiele zeigen die Grenzen der verschiedenen Lagemaße und typische auftretende Probleme.
Alle Lagemaße bestimmt, aber verschieden
Betrachtet man als Beispiel eine exponentialverteilte Zufallsvariable , so besitzt diese die Wahrscheinlichkeitsdichtefunktion
für einen reellen Parameter . Der Erwartungswert ergibt sich zu , der Median zu . Somit müssen Erwartungswert und Median nicht übereinstimmen. Aufgrund der Monotonie der Wahrscheinlichkeitsdichtefunktion auf dem Intervall besitzt sie im Punkt 0 ein Maximum. Somit ist der Modus der Exponentialverteilung bei 0. Alle drei Lagemaße können also, selbst wenn sie existieren, völlig verschieden sein. Die Aussagekraft des Modus ist hier allerdings gering.
Modus ohne Aussagekraft
Betrachtet man eine Zufallsvariable , die auf dem Intervall stetig gleichverteilt ist, also die Wahrscheinlichkeitsdichtefunktion
- ,
so sind sowohl Erwartungswert als auch Median gleich 0.5. Als Modus erhält man jedoch das komplette Intervall , da es ein Maximum der Wahrscheinlichkeitsdichtefunktion ist. Auch hier ist wieder die Aussagekraft des Modus gering
Nicht existenter Erwartungswert
Typischer Fall einer Wahrscheinlichkeitsverteilung ohne Erwartungswert ist die Cauchy-Verteilung, im einfachsten Fall mit der Wahrscheinlichkeitsdichtefunktion
- .
Dann existiert der Erwartungswert
nicht. Allerdings sind sowohl Modus als auch Median in diesem Fall eindeutig. Der Median befindet sich aufgrund der Symmetrie der Wahrscheinlichkeitsdichtefunktion bei 0, ebenso wie der Modus.
Mehrdeutiger Median
Der Median ist in der obigen Definition nicht immer eindeutig. Ist beispielsweise binomialverteilt mit dem Parameter , so ist . Somit gilt
- und
für alle . Somit ist jede Zahl in diesem Intervall ein Median. Definiert man den Median allgemeiner über die verallgemeinerte inverse Verteilungsfunktion, so ist er eindeutig.
Abgrenzung der Begriffe
An zwei Stellen ist die Verwendung des Begriffs des Lageparameters zweideutig:
- Bei Verwendung von Verteilungsklassen, die durch ein oder mehrere (reelle) Parameter näher bestimmt werden können
- Im Übergang zur deskriptiven Statistik, in der Stichproben Kennzahlen zugeordnet werden sollen, im Gegensatz zu Wahrscheinlichkeitsmaßen
Parametrische Wahrscheinlichkeitsverteilungen
Beispiel für den ersten Fall ist die Normalverteilung: Sie wird durch zwei Parameter bestimmt. Dabei ist der Parameter sowohl Erwartungswert, Median und Modus und bestimmt die Position der Verteilung auf der x-Achse. Daher wird er auch Lageparameter genannt. Allerdings muss nicht immer solch ein Parameter existieren, der eine Verschiebung entlang der Achse bewirkt, ebenso muss dieser nicht automatisch mit einem der Lagemaße im allgemeine Sinn übereinstimmen.
Lageparameter in der deskriptiven Statistik
In der deskriptiven Statistik sind Lagemaße Kennzahlen einer Stichprobe, wohingegen die hier besprochenen Lagemaße Kennzahlen von Wahrscheinlichkeitsmaßen, also (Mengen)funktionen sind. So ist ein Lagemaß der Stichprobe beispielsweise das arithmetische Mittel, das arithmetische Mittel eines Wahrscheinlichkeitsmaßes auf ist aber intuitiv nicht wohldefiniert. Zusätzlich verwirrend ist oft, dass dieselbe Bezeichnung für Kennzahlen von Stichproben und von Wahrscheinlichkeitsverteilungen verwendet werden (Modus, Median, manchmal Mittelwert synonym mit Erwartungswert oder arithmetisches Mittel).
Allerdings lassen sich die Begriffe über die empirische Verteilung verknüpfen. Ist eine Stichprobe gegeben, so gilt:
- der Erwartungswert der empirischen Verteilung zu ist das arithmetische Mittel der Stichprobe .
- der Median (im Sinne der Wahrscheinlichkeitstheorie) der empirischen Verteilung zu ist der Median (im Sinne der deskriptiven Statistik) der Stichprobe .
- der Modus (im Sinne der Wahrscheinlichkeitstheorie) der empirischen Verteilung zu ist der Modus (im Sinne der deskriptiven Statistik) der Stichprobe .
Literatur
- Christian Hesse: Angewandte Wahrscheinlichkeitstheorie. 1. Auflage. Vieweg, Wiesbaden 2003, ISBN 3-528-03183-2, S. 153, doi:10.1007/978-3-663-01244-3.
- Norbert Kusolitsch: Maß- und Wahrscheinlichkeitstheorie. Eine Einführung. 2., überarbeitete und erweiterte Auflage. Springer-Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-45386-1, doi:10.1007/978-3-642-45387-8.
Einzelnachweise
- Hesse: Angewandte Wahrscheinlichkeitstheorie. 2003, S. 153.
- Kusolitsch: Maß- und Wahrscheinlichkeitstheorie. 2014, S. 241.