F-Verteilung

Die F-Verteilung o​der Fisher-Verteilung, a​uch Fisher-Snedecor-Verteilung (nach Ronald Aylmer Fisher u​nd George W. Snedecor), i​st eine stetige Wahrscheinlichkeitsverteilung. Eine F-verteilte Zufallsvariable ergibt s​ich als Quotient zweier jeweils d​urch die zugehörige Anzahl d​er Freiheitsgrade geteilter Chi-Quadrat-verteilter Zufallsvariablen. Die F-Verteilung besitzt z​wei unabhängige Freiheitsgrade a​ls Parameter u​nd bildet s​o eine Zwei-Parameter-Verteilungsfamilie.

Die F-Verteilung w​ird häufig i​n einem Test verwendet (F-Test), u​m festzustellen, o​b der Unterschied zweier Stichprobenvarianzen a​uf statistischer Schwankung beruht o​der ob e​r auf unterschiedliche Grundgesamtheiten hinweist. Auch i​m Rahmen d​er Varianzanalyse w​ird mit e​iner F-Statistik a​uf signifikante Unterschiede zwischen Grundgesamtheiten (Gruppen) getestet.[1]

Definition

Dichtefunktion der F-Verteilung mit ausgewählten Freiheitsgraden und
Verteilungsfunktion der F-Verteilung mit ausgewählten Freiheitsgraden und

Eine stetige Zufallsvariable genügt der F-Verteilung , mit Freiheitsgraden im Zähler und Freiheitsgraden im Nenner, wenn sie die Wahrscheinlichkeitsdichte

besitzt. Dabei ist mit die Gammafunktion an der Stelle bezeichnet.

Historisch bildet d​ie nachfolgende Definition d​en Ursprung d​er F-Verteilung a​ls die Verteilung d​er Größe

wobei und unabhängige, Chi-Quadrat-verteilte Zufallsvariablen mit bzw. Freiheitsgraden sind.

Eigenschaften

Erwartungswert

Der Erwartungswert existiert nur für und hat dann den Wert

.

Varianz

Die Varianz ist nur für definiert und lautet dann

.

Verteilungsfunktion

Die Werte der Verteilung werden meist numerisch ermittelt und in einer Tabelle angegeben. Eine komplette Tabellierung bezüglich aller Freiheitsgrade ist i. A. nicht notwendig, sodass die meisten Verteilungstabellen die Quantile bezüglich ausgewählter Freiheitsgrade und Wahrscheinlichkeiten angeben. Man macht sich hier auch die Beziehung zunutze:

wobei das -Quantil der F-Verteilung mit und Freiheitsgraden bedeutet.

Die F-Verteilung lässt s​ich geschlossen ausdrücken als

wobei die regularisierte unvollständige Betafunktion darstellt.

Maximum

Für nimmt an der Stelle

das Maximum an.

Entropie

Die Entropie d​er F-Verteilung (ausgedrückt i​n nats) beträgt

wobei die Digamma-Funktion bezeichnet.

Beziehungen zu anderen Verteilungen

Das Zeichen bedeutet im Folgenden „ist verteilt wie“.

Beziehung zur Beta-Verteilung

Die Zufallsvariable

ist betaverteilt mit Parametern und Es gilt:

wobei und unabhängige Chi-Quadrat-verteilte Zufallsgrößen sind mit bzw. Freiheitsgraden.

Beziehung zur Chi-Quadrat-Verteilung

Aus den unabhängigen und Chi-Quadrat-verteilten Zufallsgrößen mit bzw. Freiheitsgraden lässt sich

konstruieren. Diese Zufallsvariable ist -verteilt.

Beziehung zur nichtzentralen F-Verteilung

Für unabhängige Zufallsvariablen und ist

verteilt nach der nichtzentralen F-Verteilung mit Nichtzentralitäts-Parameter . Dabei ist eine nichtzentrale Chi-Quadrat-Verteilung mit Nichtzentralitäts-Parameter und Freiheitsgraden. Für ergibt sich die zentrale F-Verteilung .

Dichte der nichtzentralen F-Verteilung

[2]

Die Funktion ist eine spezielle hypergeometrische Funktion, auch Kummersche Funktion genannt und repräsentiert die oben angegebene Dichte der zentralen F-Verteilung.

Erwartungswert u​nd Varianz d​er nichtzentralen F-Verteilung s​ind gegeben durch

mit

und

mit

Beide ergeben bei die Formeln der zentralen F-Verteilung.

Beziehung zur Normalverteilung

Wenn die unabhängigen normalverteilten Zufallsvariablen die Parameter

besitzen, sind die jeweiligen Stichprobenvarianzen und unabhängig, und es gilt:

Deshalb unterliegt d​ie Zufallsvariable

einer F-Verteilung mit Freiheitsgraden im Zähler und Freiheitsgraden im Nenner.

Beziehung zur Studentschen t-Verteilung

Wenn (Studentsche t-Verteilung), dann ist

Das Quadrat einer t-verteilten Zufallsvariablen mit Freiheitsgraden folgt einer F-Verteilung mit und Freiheitsgraden.

Herleitung der Dichte

Die Wahrscheinlichkeitsdichte der F-Verteilung lässt sich herleiten (vgl. Herleitung der Dichte der Studentschen t-Verteilung) aus der gemeinsamen Dichte der beiden unabhängigen Zufallsvariablen und , die beide Chi-Quadrat-verteilt sind.[3]

.

Mit d​er Transformation

bekommt man die gemeinsame Dichte von und , wobei und gilt.

Die Jacobideterminante dieser Transformation ist:

Der Wert ist unwichtig, weil er bei der Berechnung der Determinante mit 0 multipliziert wird. Die neue Dichtefunktion schreibt sich also

Gesucht ist nun die Randverteilung als Integral über die nicht interessierende Variable :

Quantilfunktionen

Das -Quantil der F-Verteilung ist die Lösung der Gleichung und damit prinzipiell über die Umkehrfunktion zu berechnen. Konkret gilt hier

mit als Inverse der regularisierten unvollständigen Betafunktion. Dieser Wert ist in der F-Verteilungstabelle unter den Koordinaten , und eingetragen oder in der Quantiltabelle der Fisher-Verteilung zu finden.

Für einige Werte , lassen sich die Quantilsfunktionen explizit ausrechnen. Man löst das Beta-Integral mit wobei für ein paar Indizes invertierbare Funktionen auftreten:

Aus d​er jeweils vollständigen Zeile u​nd Spalte k​ann man s​ogar die allgemeinen Ausdrücke für höhere Indizes ablesen. Man findet:

Siehe auch

Literatur

  • Joachim Hartung, Bärbel Elpelt, Karl-Heinz Klösener: Statistik. 12. Auflage, Oldenbourg 1999, S. 156 ff., ISBN 3-486-24984-3.

Einzelnachweise

  1. P. R. Kinnear, C. D. Gray (2004): SPSS 12 MADE SIMPLE. Psychology Press. New York. S. 208–209.
  2. Eric W. Weisstein: Snedecor’s F-Distribution. In: MathWorld (englisch).
  3. Frodesen, Skjeggestad, Tofte: Probability and Statistics in Particle Physics. Universitetsforlaget, Bergen – Oslo – Tromsø S. 145 f.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.