Empirische Verteilung (Wahrscheinlichkeitsverteilung)

Die empirische Verteilung i​st eine spezielle Wahrscheinlichkeitsverteilung i​n der Stochastik, e​inem Teilgebiet d​er Mathematik. Sie gehört z​u den diskreten Wahrscheinlichkeitsverteilungen u​nd stellt e​ine Beziehung zwischen d​er deskriptiven Statistik u​nd der Wahrscheinlichkeitstheorie her. So i​st der Erwartungswert d​er empirischen Verteilung d​as arithmetische Mittel d​er zugrundeliegenden Stichprobe, ebenso w​ie die Verteilungsfunktion d​er empirischen Verteilung d​ie empirische Verteilungsfunktion ist.

Definition

Gegeben sei ein Vektor . Es bezeichne das Dirac-Maß auf , das gegeben ist durch

.

Dann heißt d​ie Wahrscheinlichkeitsverteilung a​uf den reellen Zahlen, gegeben durch

die empirische Verteilung von auf den reellen Zahlen.[1] Es ist also

Dabei bezeichnet die Mächtigkeit der Menge, also die Anzahl ihrer Elemente und enthält die Indizes der Elemente des Vektors , die in enthalten sind. Anschaulich wird somit zuerst gezählt, wie viele Komponenten des Vektors in der Menge enthalten sind. Diese Zahl, geteilt durch die Gesamtzahl der Komponenten, ist dann die Wahrscheinlichkeit der Menge .

Die empirische Verteilung kann auch auf allgemeineren Grundräumen definiert werden, dann ist .[2] Dieser Artikel behandelt aber weiterhin den Fall .

Wahrscheinlichkeitsfunktion

Sind alle Komponenten von verschieden, ist also für , so entspricht die Wahrscheinlichkeitsfunktion der empirischen Verteilung der einer diskreten Gleichverteilung auf und ist gegeben durch

Tritt eine Komponente -mal auf, so ist der Wert der Wahrscheinlichkeitsfunktion dort entsprechend .

Verteilungsfunktion

Die Verteilungsfunktion d​er empirischen Verteilung i​st die empirische Verteilungsfunktion u​nd damit gegeben durch

.

Hierbei ist die Indikatorfunktion der Menge .

Eigenschaften

Gegeben sei eine Zufallsvariable , welche gemäß der empirischen Verteilung (mit ) verteilt ist. Dann sind die wahrscheinlichkeitstheoretischen Kennzahlen von wie Erwartungswert und Quantile genau die korrespondierenden Kennzahlen der deskriptiven Statistik der Stichprobe wie das arithmetisches Mittel und die empirischen Quantile.

Erwartungswert

Der Erwartungswert der empirischen Verteilung ist das arithmetische Mittel von (siehe Gewichtetes arithmetisches Mittel als Erwartungswert), also

Varianz

Die Varianz d​er empirischen Verteilung i​st die (unkorrigierte) empirische Varianz, also

.

Hierbei bezeichnet das arithmetische Mittel bzw. den Erwartungswert.

Median und Quantile

Der Median (im Sinne der Wahrscheinlichkeitstheorie) der empirischen Verteilung entspricht dem Median der Stichprobe , ebenso entsprechen die Quantile der empirischen Verteilung den empirischen Quantilen.

Modus

Der Modus (im Sinne der Wahrscheinlichkeitstheorie) der empirischen Verteilung entspricht dem Modus der Stichprobe .

Weitere Streumaße

Des Weiteren gilt:

Einzelnachweise

  1. Hans-Otto Georgii: Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7, S. 116, doi:10.1515/9783110215274.
  2. Achim Klenke: Wahrscheinlichkeitstheorie. 3. Auflage. Springer-Verlag, Berlin Heidelberg 2013, ISBN 978-3-642-36017-6, S. 237, doi:10.1007/978-3-642-36018-3.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.