Probit-Modell

Das Probit-Modell ist in der Statistik, einem Teilgebiet der Mathematik, die Spezifikation eines verallgemeinerten linearen Modells. Probit ist dazu ein Kofferwort für prob(ability un)it, das aus den zwei englischen, überlappenden Wörtern für Wahrscheinlichkeit und Einheit (0 oder 1) entstanden ist.[1]

Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen.

Bitte hilf mit, die Mängel dieses Artikels zu beseitigen, und beteilige dich bitte an der Diskussion! (Artikel eintragen)

Die statistische Spezifikation bezeichnet denjenigen Prozess der Modellentwicklung, in dem ein statistisch schätzbares Modell (Schätzmodell) festgelegt wird. Verallgemeinerte lineare Modelle sind nichtlineare Erweiterungen der klassischen linearen Regression. Das Probit-Modell verwendet eine Probit-Kopplungsfunktion, die den Erwartungswert der Zielgröße in Beziehung zum linearen Prädiktor des Modells setzt. Probit-Modelle wurden von Chester Bliss eingeführt.

Anwendung

Die Probit-Modelle werden wie die Logit-Modelle dazu verwendet, binäre Zielgrößen in binären diskreten Entscheidungsmodellen abzubilden. Sie verwenden Zielgrößen $Y$ , die nur zwei Werte annehmen können. Beispiele:

„Lässt sich scheiden“ → Ja/Nein,

„Kunde

i

hat Produkt A gekauft“ → Ja/Nein,

X

→

Y

.

Als Stichprobe werden Kunden beim Ausgang befragt, ob sie das Produkt A gekauft haben. Das Probit-Modell kann erstens – analog zur Regression – berechnen, ob die gleichzeitig erhobenen Merkmale $X$ das Kaufverhalten $Y$ „gut“ erklären. Im positiven Fall ist eine Schätzung möglich, wie groß der Absatz ist, wenn $X$ den ganzen Markt beschreibt.

Diese Modelle haben in der Anwendung eine sehr weite Verbreitung. Innerhalb der verallgemeinerten linearen Modelle liefert das Logit-Modell bessere Resultate bei extrem unabhängigen Variablenebenen. Umgekehrt ist das Probit-Modell im Allgemeinen besser bei Zufallseffekten mit Datensätzen mittlerer Größe.

Definition

Probit-Modelle sind ökonometrische, nichtlineare Modelle zur Erklärung von binären Zielgrößen mit der Kodierung: 0 = Ereignis tritt nicht ein, 1 = Ereignis tritt ein. Der Vektor der erklärenden Variablen $\mathbf {x} _{i}$ steht für die verschiedenen Beobachtungen, welche über den Index $i$ unterscheidbar sind. Er beeinflusst die Wahrscheinlichkeit, ob das Ereignis 0 oder 1 eintritt. Sei $Y$ die Zielgröße und $X$ die Einflussgröße.

Das Probit-Modell ist eine geschickte Definition bei der Modellentwicklung und lautet als Formel:

\Pr(Y=1|X=x)=\Phi (\mathbf {x} _{i}'{\boldsymbol {\beta }})\;{\stackrel {\mathrm {def} }{=}}\;{\frac {1}{\sqrt {2\pi }}}\int _{-\infty }^{\mathbf {x} _{i}'{\boldsymbol {\beta }}}\operatorname {exp} \left(-{\frac {1}{2}}t^{2}\right)\mathrm {d} \,t

,

Notation:

$\Phi (x)$ , gesprochen „Phi von x“, bezeichnet die Verteilungsfunktion einer Standardnormalverteilung mit der Wahrscheinlichkeit, dass die zugehörige Zufallsvariable $X$ einen Wert kleiner oder gleich $x$ annimmt.
Die Normierungskonstante ${\tfrac {1}{\sqrt {2\pi }}}$ gehört zum Integral von minus unendlich bis $x$ , geschrieben $\textstyle \int _{-\infty }^{x}\mathrm {d} \,t$ über die Exponentialfunktion $\operatorname {exp} ()$ , und $t$ ist eine gebundene Variable.
Das nichtelementare Integral ist notwendig, um die Normalverteilungsdichte an der Wahrscheinlichkeitsdichte zu normieren. Es wurde 1782 von Pierre-Simon Laplace entwickelt.

Die Formel zum Probit-Modell heißt: Die auf die erklärenden Variablen $X$ bedingte Wahrscheinlichkeit „ $\Pr$ “, dass die Antwortvariable $Y$ gleich $1$ ist, entspricht einer Funktion $\Phi (x)$ mit der Linearkombination der erklärenden Variablen $\mathbf {x} _{i}'{\boldsymbol {\beta }}$ . Der Parametervektor ${\boldsymbol {\beta }}$ wird typischerweise mit der Maximum-Likelihood-Methode geschätzt. Bei dieser Methode der größten Dichte wird derjenige Vektor ${\boldsymbol {\beta }}$ als Schätzung ausgewählt, gemäß dessen Verteilung die Realisierung der beobachteten Daten $Y$ am plausibelsten erscheint.

Modell

Das Probit-Modell ist ein einfaches latentes Variablenmodell, das den Zusammenhang zwischen beobachtbaren (oder manifesten) Variablen $Y$ und dahinter liegenden, latenten Variablen $X$ beschreibt. Der Term $\mathbf {x} _{i}'{\boldsymbol {\beta }}$ kann kleine Fehler $\varepsilon _{i}$ haben. Darum wird er durch $y_{i}^{*}$ ersetzt:

y_{i}^{*}\;{\stackrel {\mathrm {def} }{=}}\;\mathbf {x} _{i}'{\boldsymbol {\beta }}+\varepsilon _{i}

,

wobei die Fehlerterme $\varepsilon _{i}$ einer Normalverteilung folgen mit $\varepsilon _{i}\sim {\mathcal {N}}(0,1)$ . Sie sind ähnlich zur bekannten Gauß-Verteilung ${\mathcal {N}}$ mit dem Mittelwert $0$ und der Standardabweichung $1$ . Zudem stellt $Y$ eine Dummy-Variable (ja-nein-Variable) dar, die ein Indikator dafür ist, ob die latente Variable $y_{i}^{*}$ positiv ist:

Y\;{\stackrel {\mathrm {def} }{=}}\;1\Leftrightarrow y^{*}>0

.

Dann kann man zeigen, dass folgende Gleichung für das Probit-Modell erfüllt ist:

\Pr(Y=1|X=x)=\Phi (\mathbf {x} _{i}'{\boldsymbol {\beta }})

.

Einzelnachweise

Oxford English Dictionary, 3rd ed. s.v. probit (article dated June 2007): C. I. Bliss: The Method of Probits. In: Science. 79, Nr. 2037, 1934, S. 38–39. doi:10.1126/science.79.2037.38. PMID 17813446. „These arbitrary probability units have been called ‘probits’.“

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.

[1] Oxford English Dictionary, 3rd ed. s.v. probit (article dated June 2007): C. I. Bliss: The Method of Probits. In: Science. 79, Nr. 2037, 1934, S. 38–39. doi:10.1126/science.79.2037.38. PMID 17813446. „These arbitrary probability units have been called ‘probits’.“