Standardfehler des Regressionskoeffizienten
In der Statistik ist der Standardfehler des Regressionskoeffizienten ein Maß für die Variabilität des Schätzers für den Regressionskoeffizienten. Der Standardfehler des Regressionskoeffizienten wird benötigt, um die Präzision der Schätzung des Regressionskoeffizienten beurteilen zu können, etwa anhand eines statistischen Tests oder eines Konfidenzintervalls.[1]
Die Schätzung einer Regressionsgerade wird oft so angegeben, dass unter den ermittelten Koeffizienten die Standardfehler in Klammern angeführt werden. Damit erreicht man eine übersichtliche Darstellung der beiden Aspekte, der Punktschätzung sowie einer Angabe der Präzision.
Spezialfall: Lineare Einfachregression
In der linearen Einfachregression (nur eine erklärende Variable) ist der (geschätzte) Standardfehler des Regressionskoeffizienten (hier des Anstiegs ) gegeben durch die positive Quadratwurzel der geschätzten Varianz von (siehe auch Lineare Einfachregression#Varianzen der Kleinste-Quadrate-Schätzer):
mit der erwartungstreuen Schätzung der Varianz der Störgrößen
- ,
dessen empirisches Pendant das mittlere Residuenquadrat
ist. Daher folgt für den (empirischen) Standardfehler des Anstiegs:[2]
.
Mit diesem Standardfehler lässt sich die Präzision der Schätzung des Anstiegs beurteilen, z. B. mittels eines Konfidenzintervalls. Ein -Konfidenzintervall für den unbekannten (wahren) Regressionskoeffizienten ist gegeben durch:[3]
- ,
wobei das -Quantil der studentschen t-Verteilung mit Freiheitsgraden ist.
Multiple lineare Regression
Gegeben ein typisches multiples lineares Regressionsmodell , mit dem Vektor der unbekannten Regressionsparameter, der Versuchsplanmatrix , dem Vektor der abhängigen Variablen und dem Vektor der Störgrößen . Dann ist in der multiplen linearen Regression ist die erwartungstreuen Schätzung der Varianz der Störgrößen in Matrixschreibweise gegeben durch die Residuenquadratsumme adjustiert durch die residualen Freiheitsgrade:
.
Für den Standardfehler der (geschätzten) Regressionskoeffizienten folgt daraus, dass sie gegeben sind durch die Quadratwurzel des -ten Diagonalelements der geschätzten Kovarianzmatrix des Kleinste-Quadrate-Schätzers[4]
- .
Eine andere Darstellung mittels des Bestimmtheitsmaßes ist[5]
- .
Einzelnachweise
- Axel M. Gressner, Torsten Arndt: Lexikon der Medizinischen Laboratoriumsdiagnostik. Springer-Verlag, 2013., 3. Auflage, S. 2209.
- Werner Timischl: Angewandte Statistik. Eine Einführung für Biologen und Mediziner. 2013, 3. Auflage, S. 313.
- Werner Timischl: Angewandte Statistik. Eine Einführung für Biologen und Mediziner. 2013, 3. Auflage, S. 327.
- Lothar Sachs, Jürgen Hedderich: Angewandte Statistik: Methodensammlung mit R. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin/ Heidelberg 2018, ISBN 978-3-662-56657-2, S. 806
- Jeffrey Marc Wooldridge: Introductory econometrics: A modern approach. 5. Auflage. Nelson Education, 2015, S. 101.