RESET-Test nach Ramsey
Der RESET-Test nach Ramsey bzw. Test auf Fehlspezifikation der Regressionsgleichung nach Ramsey (englisch Ramsey Regression Equation Specification Error Test) ist ein von James B. Ramsey 1969 vorgeschlagener Test in der Statistik zur Überprüfung der Modellspezifikation im Rahmen der linearen Regression.[1] Er prüft, ob nichtlineare Kombinationen der erklärenden Variablen einen Einfluss auf die erklärte Variable haben. Falls die nichtlinearen Kombinationen der erklärenden Variablen einen Einfluss haben, dann sollte die lineare Modellspezifikation überdacht werden. Aber auch Fehlspezifikationen wie das Nichtberücksichtigen relevanter Variablen, Strukturbrüche, Homoskedastizität etc. können durch den Test angezeigt werden.[2] Ein Vorteil des RESET-Test nach Ramsey ist es, dass kein explizites Alternativmodell spezifiziert werden muss; der Nachteil, dass er aber auch keinen Hinweis auf eine „richtige“ Spezifikation liefert.
Mathematische Formulierung
Im linearen Modell wird folgende Modellspezifikation angenommen
und man schätzt
Der Test prüft, ob ein nichtlineares Modell der Form
nicht eine größere Erklärungskraft als das lineare Modell hat.
Die Hypothesen sind
- vs. .
Die Teststatistik ist
mit
- : das Bestimmtheitsmaß des linearen Modells,
- : das Bestimmtheitsmaß des nichtlinearen Modells,
- : der Stichprobenumfang,
- : die Anzahl der erklärenden Variablen und
- : die Anzahl der zusätzlichen Parameter im nichtlinearen Modell.
Werden auch die Koeffizienten der linearen Regression im nichtlinearen Modell neu geschätzt und unterscheiden sie sich wesentlich von den geschätzten Koeffizienten im linearen Modell, so ist dies auch ein Hinweis auf eine Fehlspezifikation.
Der RESET-Test nach Ramsey lässt sich auch auf verallgemeinerte lineare Modelle erweitern.[3]
Beispiel
In den Boston-Housing-Daten wird der mittlere Kaufpreis von Häusern pro Bezirk (medv) in Abhängigkeit vom Anteil der Unterschichtbevölkerung (lstat) mittels einer einfachen linearen Regression geschätzt. Die Regressiongerade im Streudiagramm zeigt deutlich, dass der Zusammenhang zwischen den beiden Variablen nichtlinear ist.
Der RESET-Test nach Ramsey (mit und ) ergibt folgendes Ergebnis:
RESET test data: linreg RESET = 83.4103, df1 = 2, df2 = 502, p-value < 2.2e-16
Wie die Grafik bereits nahelegt, wird die Nullhypothese verworfen, da der p-Wert kleiner ist als z. B. ein Signifikanzniveau von .
Einzelnachweise
- J.B. Ramsey: Tests for Specification Errors in Classical Linear Least-squares Regression Analysis. In: Journal of the Royal Statistical Society, Series B. Band 31, Nr. 2, 1969, S. 350–371, JSTOR:2984219.
- Peter Hackl: Einführung in die Ökonometrie. Addison-Wesley Verlag, 2004, ISBN 978-3-8273-7118-8.
- Sunil Sapra: A regression error specification test (RESET) for generalized linear models. In: Economics Bulletin. Band 3, Nr. 1, 2005, S. 1–6 (economicsbulletin.com [PDF; abgerufen am 9. September 2012]). A regression error specification test (RESET) for generalized linear models (Memento vom 25. Dezember 2015 im Internet Archive)