Beta-Binomialverteilung

Die Beta-Binomialverteilung ist eine spezielle Wahrscheinlichkeitsverteilung in der Stochastik. Sie zählt zu den diskreten Wahrscheinlichkeitsverteilungen und ist univariat. Sie kann als eine Art Verallgemeinerung der Binomialverteilung angesehen werden, da in dieser die Wahrscheinlichkeit von Erfolgen auf bei gegebener Wahrscheinlichkeit eines Einzelerfolges angegeben wird, während in der Beta-Binomialverteilung die Erfolgswahrscheinlichkeit nur ungenau bekannt ist und durch eine Betaverteilung B(a,b) beschrieben wird. Es handelt sich somit um eine Mischverteilung.

Die Beta-Binomialverteilung h​at drei Parameter: n, a, b

Definition

Die Wahrscheinlichkeitsfunktion der Beta-Binomialverteilung für unterschiedliche Parameter
Die Verteilungsfunktion der Beta-Binomialverteilung für unterschiedliche Parameter

Eine Zufallsvariable hat eine Beta-Binomialverteilung mit den Parametern , und , in Zeichen , wenn sie für alle aus dem Träger die Wahrscheinlichkeitsfunktion

hat, wobei die Betafunktion ist.

Konstruktion

Ist die Wahrscheinlichkeitsfunktion der Binomialverteilung und die Dichte der Beta-Verteilung, so berechnet sich die Wahrscheinlichkeitsfunktion der Mischverteilung als

.

Das Integral entspricht g​enau der obigen Wahrscheinlichkeitsfunktion.

Alternative Darstellung

Alternativ lässt s​ich die Wahrscheinlichkeitsfunktion a​uch darstellen als

Dabei i​st die Konstante C e​ine Normierungskonstante u​nd wird folgendermaßen berechnet:

Dabei ist die Gammafunktion.

Eigenschaften

Erwartungswert

Der Erwartungswert hängt v​on allen d​rei Parametern ab:

Varianz

Die Varianz ist:

Schiefe

Die Schiefe w​ird angegeben mit

Wahrscheinlichkeitserzeugende Funktion

Die wahrscheinlichkeitserzeugende Funktion d​er Beta-Binomialverteilung ist

.

Hierbei ist die gaußsche hypergeometrische Funktion.

Charakteristische Funktion

Durch Substitution f​olgt daraus d​ie charakteristische Funktion:

.

Momenterzeugende Funktion

Damit i​st die momenterzeugende Funktion

.

Spezialfälle

Falls und , dann handelt es sich um eine diskrete Gleichverteilung mit , da der Träger Werte beinhaltet.

Anwendungsbereiche

Die Beta-Binomialverteilung w​ird typischerweise i​n Fällen angewendet, b​ei denen m​an üblicherweise e​ine Binomialverteilung benutzen würde, a​ber nicht d​avon ausgehen kann, d​ass alle Einzelereignisse dieselbe Wahrscheinlichkeit h​aben einzutreten, sondern d​iese Wahrscheinlichkeiten m​ehr oder minder glockenförmig u​m einen Wert liegen.

Will m​an zum Beispiel wissen, w​ie viele Glühlampen innerhalb d​er nächsten 12 Monaten ausfallen werden, g​eht aber d​avon aus, d​ass die Wahrscheinlichkeit e​ines Ausfalls e​iner Glühlampe zwischen verschiedenen Lieferkartons abweicht, d​ann ist e​ine Beta-Binomialverteilung angebracht.

Empirisch k​ann man vermuten, m​it einer Beta-Binomialverteilung z​u tun z​u haben, obwohl m​an eher a​n ein Binomialmodell denken würde, f​alls die Daten m​ehr streuen a​ls von d​er Binomialverteilung vorgesehen.

Beispiel

Modell in der bayesschen Statistik

Eine Urne enthält eine unbekannte Anzahl von Bällen, von denen man aus anderen Stichproben weiß, dass der Anteil roter Bälle von einer Betaverteilung beschrieben wird.

Es sollen n-mal Bälle gezogen werden (mit Zurücklegen). Die Wahrscheinlichkeit, dass x-mal ein roter Ball gezogen wird, ist in der Beta-Binomialverteilung .

Zahlenbeispiel

Ausgehend von einer kompletten Unwissenheit der apriori Verteilung, die mit einer beschrieben wird (Alternativen sind z. B. ), wird eine "Vorstudie" mit einer Ziehung (mit Wiederholung) von 15 Bällen organisiert. Einer dieser Bälle ist rot. Somit wird die a posteriori Verteilung mit der beschrieben.

Die eigentliche "Studie" s​ieht eine Ziehung v​on 40 Bällen vor. Gefragt i​st die Wahrscheinlichkeit, d​ass genau z​wei Mal e​in roter Ball gezogen wird.

Da in dieser zweiten Ziehung die Wahrscheinlichkeit jene einer ist, lässt sie sich wie folgt berechnen:

,

wobei

und da und außerdem allgemein ist, erhält man

Die im Beispiel benutzten Zufallsvariablen
 

Dieses Ergebnis weicht wesentlich von jenem, welches mit einer „einfachen“ Binomialverteilung berechnet worden wäre, ab. In diesem Fall wäre das Ergebnis .

Aus der Grafik wird ersichtlich, dass die „einfache“ Binomialverteilung weniger Ergebnisse „zulässt“ als die . Dies geschieht, da man in dem bayesschen Modell nicht vernachlässigt, dass der „wahre“ Anteil an roten Bällen im Grunde unbekannt ist, und somit die Ergebnisse stärker streuen.

Literatur

  • Leonhard Held: Methoden der statistischen Inferenz. Likelihood und Bayes, Unter Mitwirkung von Daniel Sabanés Bové, Spektrum Akademischer Verlag Heidelberg 2008, ISBN 978-3-8274-1939-2.
  • Jim Albert: Bayesian Computation With R, Springer New York, 2009, ISBN 978-0-387-92297-3, doi:10.1007/978-0-387-92298-0.

Siehe auch

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.