Verallgemeinerte inverse Verteilungsfunktion
Die (verallgemeinerte) inverse Verteilungsfunktion,[1] auch Quantil-Transformation[2] oder Quantil-Funktion[3] oder percent point function genannt, ist eine spezielle reelle Funktion in der Stochastik, einem Teilgebiet der Mathematik. Jeder Verteilungsfunktion kann eine verallgemeinerte inverse Verteilungsfunktion zugeordnet werden, die unter gewissen Bedingungen die inverse Funktion der Verteilungsfunktion ist. Die verallgemeinerte inverse Verteilungsfunktion ordnet jeder Zahl zwischen null und eins den kleinsten Wert zu, an dem die Verteilungsfunktion diese Zahl überschreitet.
Beschreibt beispielsweise eine Wahrscheinlichkeitsverteilung die Schuhgrößen der Europäer und ist die entsprechende Verteilungsfunktion gegeben, so gibt die zugehörige verallgemeinerte inverse Verteilungsfunktion an der Stelle diejenige kleinste Schuhgröße an, so dass mehr als 90 % der Europäer eine Schuhgröße kleiner als tragen.
Die verallgemeinerte inverse Verteilungsfunktion wird unter anderem zur Bestimmung von Quantilen herangezogen. Ebenso liefert sie einen Ansatz zur Konstruktion von Zufallsvariablen mit vorgegebenen Verteilungen. Derselben zugrunde liegenden Idee folgend dient sie bei der Inversionsmethode zur Erzeugung von Zufallszahlen mit vorgegebener Verteilung aus Standardzufallszahlen.
Definition
Sei
eine Verteilungsfunktion in dem Sinne, dass sie monoton wachsend und rechtsseitig stetig ist sowie das Grenzwertverhalten und besitzt.
Dann heißt die Funktion
definiert durch
die verallgemeinerte inverse Verteilungsfunktion von .[1]
Bemerkungen zur Definition
Zu beachten ist, dass die Verteilungsfunktion, zu der die verallgemeinerte inverse Verteilungsfunktion definiert wird, nicht notwendigerweise zu einer Wahrscheinlichkeitsverteilung gehören muss. Sie muss lediglich die vier oben genannten Eigenschaften (Monotonie, Rechtsstetigkeit und die zwei Grenzwerteigenschaften) erfüllen. Dies beruht darauf, dass die verallgemeinerte inverse Verteilungsfunktion zur Konstruktion von Wahrscheinlichkeitsverteilungen mit Verteilungsfunktion verwendet wird. Die Existenz solch einer Wahrscheinlichkeitsverteilung in der Definition zu fordern wäre damit zirkulär.
Die Notation der verallgemeinerten inversen Verteilungsfunktion als ist suggestiv zu verstehen, da die Verteilungsfunktion nicht immer invertierbar sein muss. Dies tritt zum Beispiel dann auf, wenn sie auf einem Intervall konstant ist. Ist jedoch invertierbar, so stimmen die Inverse der Verteilungsfunktion und die verallgemeinerte inverse Verteilungsfunktion überein. Da die verallgemeinerte inverse Verteilungsfunktion im Gegensatz zur Inversen immer existiert rechtfertigt dies die Benennung als "verallgemeinert".
Erläuterung
Nach der Definition ist der Funktionswert der verallgemeinerten inversen Verteilungsfunktion an der Stelle die kleinste Zahl, an der die Verteilungsfunktion den Funktionswert überschreitet.
Ist die Verteilungsfunktion stetig, so erhält man diesen Wert anschaulich auf die folgende Art und Weise: Man zeichnet eine zur x-achse parallele Gerade, welche um den Wert nach oben verschoben ist. Diese schneidet die Verteilungsfunktion in einem Punkt oder einem Intervall. Schneidet sie die Verteilungsfunktion in einem Punkt , so ist der Funktionswert der verallgemeinerten inversen Verteilungsfunktion an der Stelle . Schneidet die Gerade die Verteilungsfunktion in einem Intervall, so wählt man denjenigen Punkt aus dem Intervall aus, der die kleinste -Koordinate besitzt.
Beispiel
Betrachte als Beispiel die Verteilungsfunktion der Exponentialverteilung. Sie ist gegeben durch
wobei ein echt positiver reeller Parameter ist. Sie ist auf streng monoton wachsend und bildet dieses Intervall bijektiv auf ab. Somit existiert eine eindeutige Umkehrfunktion , welche sich durch Auflösen von
nach ergibt. Dies liefert die verallgemeinerte inverse Verteilungsfunktion
- .
Im Allgemeinen ist es selten möglich, die verallgemeinerte inverse Verteilungsfunktion wie hier direkt zu berechnen. So sind die wenigsten Verteilungsfunktionen invertierbar, da sie häufig konstante Bereiche aufweisen. Beispiel hierfür sind die Verteilungsfunktionen von diskreten Verteilungen. Ebenso muss selbst bei Invertierbarkeit keine geschlossene Darstellung der Verteilungsfunktion existieren, auf die man zurückgreifen könnte. So muss die Verteilungsfunktion der Normalverteilung stets numerisch berechnet werden.
Eigenschaften
Die verallgemeinerte inverse Verteilungsfunktion ist monoton wachsend, linksseitig stetig und damit eine Zufallsvariable bzw. messbar von nach . Versieht man den Messraum mit der stetigen Gleichverteilung oder äquivalent dem Lebesgue-Maß, so gilt:
- Die Verteilung von unter ist das Wahrscheinlichkeitsmaß auf , welches die Verteilungsfunktion besitzt.
Jedes Wahrscheinlichkeitsmaß auf mit Verteilungsfunktion kann damit als Verteilung der Zufallsvariable
aufgefasst werden.
Verwendung
Konstruktion von Zufallsvariablen vorgegebener Verteilung
Zufallsvariablen werden als messbare Abbildungen zwischen Messräumen eingeführt. Ist auf dem Grundraum noch ein Wahrscheinlichkeitsmaß definiert, so kann ihre Verteilung definiert werden. Im Laufe der weiteren Abstraktion werden aber der Grundraum und zugehörige Wahrscheinlichkeitsmaß immer unwichtiger im Gegensatz zur Verteilung der Zufallsvariable. Effektiv lässt sich zeigen, dass zu jeder Zufallsvariable mit einer vorgegebenen Verteilung ein passender Grundraum mit Wahrscheinlichkeitsmaß ergänzen lässt. Die verallgemeinerte inverse Verteilungsfunktion liefert für reelle Verteilungen solch ein Argument: Jede reellwertige Zufallsvariable mit vorgegebener Verteilung kann als Zufallsvariable auf dem Intervall von null bis eins, versehen mit der stetigen Gleichverteilung, aufgefasst werden.[4] Somit kann die Untersuchung von Zufallsvariablen und ihren Verteilungen von dem zugrunde liegenden Wahrscheinlichkeitsraum losgelöst werden.
Konstruktion stochastisch unabhängiger Zufallsvariablen
Die obige Konstruktion wird teils auch verwendet, um die Existenz reellwertiger unabhängiger Zufallsvariablen zu zeigen. Dabei wird zuerst über ein Approximationsargument die Existenz von stochastisch unabhängigen, auf dem Intervall unabhängigen Zufallsvariablen gezeigt. Die Verkettung dieser Zufallsvariablen mit vorgegebenen verallgemeinerten inversen Verteilungsfunktionen sind dann reellwertige Zufallsvariablen mit vorgegebener Verteilung und wieder stochastisch unabhängig.[5]
Bestimmung von Quantilen
Ist eine Wahrscheinlichkeitsverteilung (oder eine Zufallsvariable mit Verteilung ) gegeben, so liefert die zugehörige verallgemeinerte inverse Verteilungsfunktion , ausgewertet an der Stelle , stets ein -Quantil. Dies folgt direkt aus der Definition.
Literatur
- Norbert Kusolitsch: Maß- und Wahrscheinlichkeitstheorie. Eine Einführung. 2., überarbeitete und erweiterte Auflage. Springer-Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-45386-1, doi:10.1007/978-3-642-45387-8.
- Hans-Otto Georgii: Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7, doi:10.1515/9783110215274.
Einzelnachweise
- Kusolitsch: Maß- und Wahrscheinlichkeitstheorie. 2014, S. 113.
- Georgii: Stochastik. 2009, S. 23.
- Eric W. Weisstein: Quantile Function. In: MathWorld (englisch).
- Achim Klenke: Wahrscheinlichkeitstheorie. 3. Auflage. Springer-Verlag, Berlin Heidelberg 2013, ISBN 978-3-642-36017-6, S. 43, doi:10.1007/978-3-642-36018-3.
- Georgii: Stochastik. 2009, S. 72–73.