Pseudo-Bestimmtheitsmaß

Im Falle einer linearen Regression beschreibt das Bestimmtheitsmaß den erklärten Anteil der Variabilität (Varianz) einer abhängigen Variablen durch ein statistisches Modell. Bei einem nominalen oder ordinalen Skalenniveau von existiert jedoch kein Äquivalent, da man die Varianz und damit ein nicht berechnen kann. Mit Hilfe der Maximum-Likelihood-Schätzung lassen sich indes allgemeinere Regressionsmodelle schätzen. Für diese wurden verschiedene Pseudo-Bestimmtheitsmaße (notiert als ) vorgeschlagen.

Das Pseudo-Bestimmtheitsmaß

Pseudo-Bestimmtheitsmaße sind so konstruiert, dass sie den verschiedenen Interpretationen (z. B. erklärte Varianz, Verbesserung gegenüber dem Nullmodell oder als Quadrat der Korrelation) des Bestimmtheitsmaßes genügen. Sie sind dem in der Hinsicht ähnlich, dass dessen Werte ebenfalls im Intervall von 0 und 1 liegen und ein höherer Wert einer besseren Anpassung des Modells an die Daten entspricht.

Maddalas / Cox & Snells Pseudo-R2

,

mit

: Nullmodell,
: Modell mit erklärenden Variablen

Vergleicht das Verhältnis der Werte der Wert der Likelihood-Funktion, in dem die völlige Unabhängigkeit aller Variablen angenommen wird (Nullmodell oder Leermodell) und der Likelihood-Funktionen unter Kenntnis des Zusammenhanges zwischen und (volles Regressionsmodell). Je geringer dieses Verhältnis, desto größer die Verbesserung des ganzen Modells gegenüber dem Nullmodell. Maddalas kann auch bei perfekter Vorhersage nie den Wert 1 erreichen.

Nagelkerkes / Cragg & Uhlers Pseudo-R2

,

mit

: Nullmodell,
: Modell mit erklärenden Variablen

Nagelkerkes Pseudo-R2 erweitert Maddalas Pseudo-R2, sodass d​urch eine Reskalierung e​in möglicher Wert v​on 1 erreicht werden kann, w​enn das vollständige Modell e​ine perfekte Vorhersage m​it einer Wahrscheinlichkeit v​on 1 trifft.

Nagelkerke g​ab auch allgemeine Bedingungen für e​in Pseudo-Bestimmtheitsmaß an:

  1. Ein Pseudo-Bestimmtheitsmaß sollte mit dem Bestimmtheitsmaß übereinstimmen, wenn beide berechnet werden können.
  2. Es sollte ebenfalls mit der Maximum-Likelihood-Schätzung des Modells maximiert werden.
  3. Es sollte, zumindest asymptotisch, unabhängig vom Stichprobenumfang sein.
  4. Die Interpretation sollte die durch das Modell erklärte Variabilität von sein.
  5. Es sollte zwischen Null und Eins liegen. Bei einem Wert von Null sollte es keine Aussage über die Variabilität von machen; bei einem Wert von Eins, sollte es die Variabilität von vollständig erklären.
  6. Es sollte keine Maßeinheit besitzen.

McFadden R2

,

mit

: Nullmodell,
: Modell mit erklärenden Variablen

Das Verhältnis der logarithmierten der Werte und der Likelihood-Funktion (Wahrscheinlichkeiten) spiegelt den Grad der Verbesserung des vollständigen Modells mit Prädiktoren gegenüber dem Nullmodell wider. Ein Modell mit einem größeren McFaddens hat eine bessere Anpassung gegenüber einem anderen Modell mit einem geringeren Wert.

Daumenregel: Bereits stellt ein besonders gute Anpassung des Modells dar.

McFaddens korrigiertes R2

Das korrigierte McFaddens bewertet die Anzahl der Prädiktoren für die Anpassungsgüte eines Modells. Ähnlich dem korrigierten Bestimmtheitsmaß verringern zu viele Prädiktoren, die dem Modell nicht genügend beitragen, die Effektivität eines Modells und schlagen sich negativ im korrigierten McFaddens nieder. Somit sind Werte kleiner 0 möglich.

Aldrich / Nelsons R2

, c = 1 (Probit-Modell), 3,29 (Logit-Modell)

Aldrich / Nelsons s​etzt den Likelihood-Quotienten i​ns Verhältnis, d​er die Rate v​on Nullmodell u​nd Alternativmodell b​ei eingetretenem Ereignis angibt. Es h​at eine o​bere Grenze v​on weit u​nter 1.

Lave / Efrons R2

Lave / Efrons kann man ähnlich dem normalen Bestimmtheitsmaß als Quadrat der Korrelation und als erklärte Variabilität interpretieren. Es werden die quadrierten Residuen aufsummiert, wobei eine vom Modell vorhergesagte Wahrscheinlichkeit für ist, welche die diskrete abhängige Variable in eine stetige überführt (Hinweis: kann nur die Werte 0 und 1 annehmen).

McKelvey & Zavoinas R2

McKelvey & Zavoinas i​st strukturell d​em normalen Bestimmtheitsmaß nachempfunden. Es w​ird die geschätzte erklärte Quadratsumme d​er Regression m​it der geschätzten erklärten u​nd unerklärten Quadratsumme v​on Regression u​nd Fehler i​ns Verhältnis gesetzt.

Vergleichbarkeit

Die Werte der verschiedenen Pseudo-Bestimmtheitsmaße können innerhalb eines Modells stark variieren. Somit können unterschiedliche Maße zwischen verschiedenen Datensätzen nicht miteinander verglichen und unabhängig interpretiert werden. Als beste Approximation hat sich McKelvey & Zavoinas erwiesen[1]; Laves, McFaddens, Nagelkerkes unterschätzen das "wahre" einer Kleinste-Quadrate-Schätzung für ein Modell mit latenten Variablen stark.

Beispiel

Ein Wäscheklammerproduzent möchte seine neuartigen Wäscheklammern auf den Markt bringen und deswegen vorab die Wahrscheinlichkeit eines Kaufes berechnen. Er berät sich mit seinem Geschäftspartner, der ein Statistikprogramm besitzt. Dieser nimmt an, dass der Kauf nur von einem Attribut abhängt, dem Preis . Der aggregierte Einfluss auf die Kaufentscheidung soll eine lineare Beziehung haben, , auch Logit genannt. Der Wäscheklammerproduzent hingegen glaubt eher, dass die Kaufabsicht vom Preis, der Farbe und der Größe abhängt:. Mittels Marktforschungsdaten sind die Regressionsparameter , , und nach der Maximum-Likelihood-Schätzung vom Computer iterativ ermittelt worden. Allerdings fragt sich nun der Wäscheklammerproduzent, welche Modellhypothese die Realität besser wiedergibt und auf welche man weitere Überlegungen stützen sollte. Zur Einschätzung der Anpassungsgüte der angenommenen Modelle an die vorhandenen Daten sollen verschiedene Pseudo-Bestimmtheitsmaße benutzt werden. Diese lassen sich die beiden Geschäftspartner vom Statistikprogramm ausgeben.

Maße der Anpassungsgüte   Modell 1 ()   Modell 2 ()   
McFadden R20,3070,445
McFadden Adj R20,2730,389
Cragg-Uhler (Nagelkerke) R20,4360,578
McKelvey & Zavoina R20,5190,643
Efron / Lave R20,3300,472

Da d​ie Pseudo-Bestimmtheitsmaße für Modell 2 durchweg höher sind, d. h., d​ass dieses Modell d​ie Marktforschungsdaten besser abbildet, entscheidet m​an sich für dieses u​nd schätzt d​amit die Kaufwahrscheinlichkeit bzw. d​en möglichen Marktanteil.

Literatur

  • Cragg, J.G., Uhler, R. (1970), "The Demand for Automobiles", Canadian Journal of Economics 3, S. 386–406, JSTOR 133656.
  • Hagle, T. M., Mitchell II, G. E. (1992), "Goodness-of-Fit Measures for Probit and Logit", American Journal of Political Science 36, S. 762–784, JSTOR 2111590.
  • McFadden, D. (1973), "Conditional Logit Analysis of Qualitative Choice Behavior" (PDF 1,77 MB), in: P. Zarembka (ed.) Frontiers in Econometrics, Academic Press: New York, ISBN 0-12-776150-0, S. 105–142.
  • McKelvey, R., Zavoina, W. (1975), "A Statistical Model for the Analysis of Ordinal Level Dependent Variables", Journal of Mathematical Sociology 4, S. 103–120, doi:10.1080/0022250X.1975.9989847.
  • Nagelkerke, N. J. D. (1991), "A Note on a General Definition of the Coefficient of Determination", Biometrika 78, Nr. 3, S. 691–692, doi:10.1093/biomet/78.3.691.
  • Veall, M. R., Zimmermann, K. F. (1996), "Pseudo-R2 Measures for Some Common Limited Dependent Variable Models", Sonderforschungsbereich 386, Paper 18, doi:10.5282/ubm/epub.1421.

Einzelnachweise

  1. Veall, Zimmermann (1996), "Pseudo-R2 Measures for Some Common Limited Dependent Variable Models", Sonderforschungsbereich 386, Paper 18.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.