F-Verteilung
Die F-Verteilung oder Fisher-Verteilung, auch Fisher-Snedecor-Verteilung (nach Ronald Aylmer Fisher und George W. Snedecor), ist eine stetige Wahrscheinlichkeitsverteilung. Eine F-verteilte Zufallsvariable ergibt sich als Quotient zweier jeweils durch die zugehörige Anzahl der Freiheitsgrade geteilter Chi-Quadrat-verteilter Zufallsvariablen. Die F-Verteilung besitzt zwei unabhängige Freiheitsgrade als Parameter und bildet so eine Zwei-Parameter-Verteilungsfamilie.
Die F-Verteilung wird häufig in einem Test verwendet (F-Test), um festzustellen, ob der Unterschied zweier Stichprobenvarianzen auf statistischer Schwankung beruht oder ob er auf unterschiedliche Grundgesamtheiten hinweist. Auch im Rahmen der Varianzanalyse wird mit einer F-Statistik auf signifikante Unterschiede zwischen Grundgesamtheiten (Gruppen) getestet.[1]
Definition
Eine stetige Zufallsvariable genügt der F-Verteilung , mit Freiheitsgraden im Zähler und Freiheitsgraden im Nenner, wenn sie die Wahrscheinlichkeitsdichte
besitzt. Dabei ist mit die Gammafunktion an der Stelle bezeichnet.
Historisch bildet die nachfolgende Definition den Ursprung der F-Verteilung als die Verteilung der Größe
wobei und unabhängige, Chi-Quadrat-verteilte Zufallsvariablen mit bzw. Freiheitsgraden sind.
Eigenschaften
Verteilungsfunktion
Die Werte der Verteilung werden meist numerisch ermittelt und in einer Tabelle angegeben. Eine komplette Tabellierung bezüglich aller Freiheitsgrade ist i. A. nicht notwendig, sodass die meisten Verteilungstabellen die Quantile bezüglich ausgewählter Freiheitsgrade und Wahrscheinlichkeiten angeben. Man macht sich hier auch die Beziehung zunutze:
wobei das -Quantil der F-Verteilung mit und Freiheitsgraden bedeutet.
Die F-Verteilung lässt sich geschlossen ausdrücken als
wobei die regularisierte unvollständige Betafunktion darstellt.
Maximum
Für nimmt an der Stelle
das Maximum an.
Entropie
Die Entropie der F-Verteilung (ausgedrückt in nats) beträgt
wobei die Digamma-Funktion bezeichnet.
Beziehungen zu anderen Verteilungen
Das Zeichen bedeutet im Folgenden „ist verteilt wie“.
Beziehung zur Beta-Verteilung
Die Zufallsvariable
ist betaverteilt mit Parametern und Es gilt:
wobei und unabhängige Chi-Quadrat-verteilte Zufallsgrößen sind mit bzw. Freiheitsgraden.
Beziehung zur Chi-Quadrat-Verteilung
Aus den unabhängigen und Chi-Quadrat-verteilten Zufallsgrößen mit bzw. Freiheitsgraden lässt sich
konstruieren. Diese Zufallsvariable ist -verteilt.
Beziehung zur nichtzentralen F-Verteilung
Für unabhängige Zufallsvariablen und ist
verteilt nach der nichtzentralen F-Verteilung mit Nichtzentralitäts-Parameter . Dabei ist eine nichtzentrale Chi-Quadrat-Verteilung mit Nichtzentralitäts-Parameter und Freiheitsgraden. Für ergibt sich die zentrale F-Verteilung .
Dichte der nichtzentralen F-Verteilung
Die Funktion ist eine spezielle hypergeometrische Funktion, auch Kummersche Funktion genannt und repräsentiert die oben angegebene Dichte der zentralen F-Verteilung.
Erwartungswert und Varianz der nichtzentralen F-Verteilung sind gegeben durch
- mit
und
- mit
Beide ergeben bei die Formeln der zentralen F-Verteilung.
Beziehung zur Normalverteilung
Wenn die unabhängigen normalverteilten Zufallsvariablen die Parameter
besitzen, sind die jeweiligen Stichprobenvarianzen und unabhängig, und es gilt:
Deshalb unterliegt die Zufallsvariable
einer F-Verteilung mit Freiheitsgraden im Zähler und Freiheitsgraden im Nenner.
Beziehung zur Studentschen t-Verteilung
Wenn (Studentsche t-Verteilung), dann ist
Das Quadrat einer t-verteilten Zufallsvariablen mit Freiheitsgraden folgt einer F-Verteilung mit und Freiheitsgraden.
Herleitung der Dichte
Die Wahrscheinlichkeitsdichte der F-Verteilung lässt sich herleiten (vgl. Herleitung der Dichte der Studentschen t-Verteilung) aus der gemeinsamen Dichte der beiden unabhängigen Zufallsvariablen und , die beide Chi-Quadrat-verteilt sind.[3]
- .
Mit der Transformation
bekommt man die gemeinsame Dichte von und , wobei und gilt.
Die Jacobideterminante dieser Transformation ist:
Der Wert ist unwichtig, weil er bei der Berechnung der Determinante mit 0 multipliziert wird. Die neue Dichtefunktion schreibt sich also
Gesucht ist nun die Randverteilung als Integral über die nicht interessierende Variable :
Quantilfunktionen
Das -Quantil der F-Verteilung ist die Lösung der Gleichung und damit prinzipiell über die Umkehrfunktion zu berechnen. Konkret gilt hier
mit als Inverse der regularisierten unvollständigen Betafunktion. Dieser Wert ist in der F-Verteilungstabelle unter den Koordinaten , und eingetragen oder in der Quantiltabelle der Fisher-Verteilung zu finden.
Für einige Werte , lassen sich die Quantilsfunktionen explizit ausrechnen. Man löst das Beta-Integral mit wobei für ein paar Indizes invertierbare Funktionen auftreten:
Aus der jeweils vollständigen Zeile und Spalte kann man sogar die allgemeinen Ausdrücke für höhere Indizes ablesen. Man findet:
Siehe auch
Literatur
- Joachim Hartung, Bärbel Elpelt, Karl-Heinz Klösener: Statistik. 12. Auflage, Oldenbourg 1999, S. 156 ff., ISBN 3-486-24984-3.
Weblinks
Einzelnachweise
- P. R. Kinnear, C. D. Gray (2004): SPSS 12 MADE SIMPLE. Psychology Press. New York. S. 208–209.
- Eric W. Weisstein: Snedecor’s F-Distribution. In: MathWorld (englisch).
- Frodesen, Skjeggestad, Tofte: Probability and Statistics in Particle Physics. Universitetsforlaget, Bergen – Oslo – Tromsø S. 145 f.