Sphärische Kovarianzstruktur
In der Statistik liegt eine sphärische Kovarianzstruktur vor, wenn die Kovarianzmatrix proportional zur Einheitsmatrix ist.[1] Beispielsweise ist die aus der multiplen linearen Regression bekannte Kovarianzmatrix sphärisch.
Multiple lineare Regression
Das klassische Beispiel einer sphärischen Kovarianzstruktur ist das der Kovarianzmatrix des Vektors der Störgrößen in einer multiplen linearen Regression. In der multiplen linearen Regression werden, statt lediglich die Varianzen und Kovarianzen der Störgrößen einzeln zu betrachten, diese in folgender Kovarianzmatrix zusammengefasst:
- .
Hierbei ist die unbekannte (wahre) skalare Varianz der Störgrößen, die sich erwartungstreu schätzen lässt durch . Da diese Kovarianzmatrix proportional zu Einheitsmatrix ist (), wird diese Kovarianzstruktur als sphärisch bezeichnet. Kovarianzstrukturen dieser Art werden aufgrund des folgenden Zusammenhangs als sphärisch bezeichnet: Die Hypothese, dass die Realisierungen der Antwortvariablen unabhängig sind und die gleiche Varianz aufweisen (Homoskedastizität), lässt sich überprüfen, indem man die Nullhypothese gegen die Alternativhypothese testet. Unter der Gültigkeit der Nullhypothese reduziert sich der Hyperellipsoid zu , was der Gleichung einer Sphäre entspricht.[2] Anders ausgedrückt liegt eine sphärische Struktur der Kovarianzmatrix bzw. sphärische Störgrößen vor, wenn die Unkorreliertheits- und Homoskedastizitätsannahme bzgl. der Störgrößen gelten:
- und .
Diese Annahmen zählen zu den Annahmen des klassischen linearen Regressionsmodells.[3] Um die Hypothese zu überprüfen, ob die Stichprobe aus einer Grundgesamtheit kommt, in der die Variablen unkorreliert sind, wird oft der Bartlett-Test auf Sphärizität herangezogen. Er testet, ob die Stichproben-Korrelationsmatrix signifikant von einer Einheitsmatrix abweicht: gegen . Es wird also getestet, ob die Korrelationsmatrix überzufällig von einer Einheitsmatrix abweicht, da im Falle der Einheitsmatrix alle Außerdiagonaleinträge null sind (es liegen keine Korrelationen zwischen den Variablen vor).[4]
Einzelnachweise
- Fumio Hayashi: Econometrics., Princeton University Press., 2000, S. 54.
- Alvin C. Rencher: Methods of multivariate analysis. Vol. 492. John Wiley & Sons, 2003. S. 250.
- Fumio Hayashi: Econometrics., Princeton University Press., 2000, S. 10
- Klaus Backhaus: Multivariate Analysemethoden eine anwendungsorientierte Einführung. Hrsg.: Springer Gabler. Springer, Berlin 2018, ISBN 978-3-662-56654-1, S. 376.