Gemischtes Modell

Ein gemischtes Modell (englisch mixed model) ist ein statistisches Modell, das sowohl feste Effekte als auch zufällige Effekte enthält, also gemischte Effekte. Diese Modelle werden in verschiedenen Bereichen der Physik, Biologie und den Sozialwissenschaften angewandt. Sie sind besonders nützlich, sofern eine wiederholte Messung an der gleichen statistischen Einheit oder Messungen an Clustern von verwandten statistischen Einheiten durchgeführt werden.

Geschichte und momentaner Stand der Forschung

Ronald Fisher führte das Modell mit zufälligen Effekten ein, um Korrelationen von charakteristischen Merkmalen zwischen Verwandten zu untersuchen.[1] In den fünfziger Jahren entwarf Charles Roy Henderson beste lineare erwartungstreue Schätzer für feste Effekte und beste lineare erwartungstreue Vorhersagen (BLEV) für zufällige Effekte.[2][3][4][5] Anschließend wurde gemischte Modellierung eines der Hauptforschungsfelder der statistischen Forschung, einschließlich Arbeiten zur Berechnung von Maximum-Likelihood-Schätzern, nichtlinearen gemischte-Effekte-Modellen, fehlenden Daten in gemischten Modellen und bayessche Schätzungen von gemischten Modellen. Gemischte Modelle werden in vielen Disziplinen angewandt, insbesondere sofern verschiedene korrelierte Messungen an jeder zu untersuchenden Einheit gemacht werden. Sie werden besonders häufig bei Forschung über Menschen oder Tieren benutzt, wobei die Spanne der Einsatzmöglichkeiten von Genetik bis zu Marketing reicht.

Definition

In Matrixschreibweise kann ein gemischtes Modell dargestellt werden als:

\mathbf {y} =\mathbf {X} {\boldsymbol {\beta }}+\mathbf {Z} \mathbf {u} +{\boldsymbol {\varepsilon }}

,

wobei

$\mathbf {y}$ ein Vektor aus Beobachtungen der abhängigen Variablen ist, mit Erwartungswert $\operatorname {E} (\mathbf {y} )=\mathbf {X} {\boldsymbol {\beta }}$

${\boldsymbol {\beta }}$ ein Vektor aus festen Effekten ist

${\boldsymbol {u}}$ ein Vektor aus zufälligen Effekten ist mit Erwartungswert $\operatorname {E} (\mathbf {u} )=\mathbf {0}$ und Varianz-Kovarianzmatrix $\operatorname {Cov} (\mathbf {u} )=\mathbf {G}$

${\boldsymbol {\varepsilon }}$ ein Vektor aus zufälligen Fehlertermen ist mit Erwartungswert $\operatorname {E} ({\boldsymbol {\varepsilon }})=\mathbf {0}$ und Varianz-Kovarianzmatrix $\operatorname {Cov} ({\boldsymbol {\varepsilon }})=\mathbf {R}$

$\mathbf {X}$ und $\mathbf {Z}$ Matrizen mit Regressoren sind, die die Beobachtungen $\mathbf {y}$ mit ${\boldsymbol {\beta }}$ und $\mathbf {u}$ verknüpfen

Schätzung

Die Henderson'schen Mischmodellgleichungen (englisch mixed model equations, kurz: MME) lauten:[2][4]

{\begin{pmatrix}\mathbf {X} '\mathbf {R} ^{-1}\mathbf {X} &\mathbf {X} '\mathbf {R} ^{-1}\mathbf {Z} \\\mathbf {Z} '\mathbf {R} ^{-1}\mathbf {X} &\mathbf {Z} '\mathbf {R} ^{-1}\mathbf {Z} +\mathbf {G} ^{-1}\end{pmatrix}}{\begin{pmatrix}{\tilde {\boldsymbol {\beta }}}\\{\tilde {\boldsymbol {u}}}\end{pmatrix}}={\begin{pmatrix}\mathbf {X} '\mathbf {R} ^{-1}\mathbf {y} \\\mathbf {Z} '\mathbf {R} ^{-1}\mathbf {y} \end{pmatrix}}

Die Lösungen der Mischmodellgleichungen ${\tilde {\boldsymbol {\beta }}}$ und ${\tilde {\boldsymbol {u}}}$ sind beste lineare erwartungstreue Schätzer (BLES bzw. englisch Best Linear Unbiased Estimator, kurz: BLUE) für ${\boldsymbol {\beta }}$ bzw. ${\boldsymbol {u}}$ . Dies folgt aus dem Satz von Gauß-Markow, da die konditionelle Varianz des Ergebnisses nicht auf die Einheitsmatrix skalierbar ist. Falls die konditionelle Varianz bekannt ist, ist der mit der inversen Varianz gewichtete Kleinste-Quadrate-Schätzer BLES. Jedoch ist die konditionelle Varianz selten bekannt, sodass es bei der Lösung der Mischmodellgleichungen erwünscht ist, die Varianz und die gewichteten Parameterschätzungen gemeinsam zu schätzen.

Eine Methode zur Anpassung gemischter Modelle ist der EM-Algorithmus[6], in dem die Komponenten der Varianz als unbeobachtete Störparameter in der gesamten Wahrscheinlichkeit behandelt werden. Zurzeit ist diese Methode in den wichtigsten Statistiksoftwarepaketen R (lme() im nlme Paket und lmer() im lme4 Paket) und SAS (proc mixed) implementiert. Die Lösung der Mischmodellgleichungen ist eine Maximum-Likelihood-Schätzung, falls die Fehler normalverteilt sind.[7]

Einzelnachweise

R. A. Fisher: The correlation between relatives on the supposition of Mendelian inheritance. In: Transactions of the Royal Society of Edinburgh. 52, 1918, S. 399–433.
G.K. Robinson: That BLUP is a Good Thing: The Estimation of Random Effects. In: Statistical Science. 6, Nr. 1, 1991, S. 15–32. JSTOR 2245695. doi:10.1214/ss/1177011926.
C. R. Henderson, Oscar Kempthorne, S. R. Searle and C. M. von Krosigk: The Estimation of Environmental and Genetic Trends from Records Subject to Culling. In: International Biometric Society (Hrsg.): Biometrics. 15, Nr. 2, 1959, S. 192–218. JSTOR 2527669. doi:10.2307/2527669.
L. Dale Van Vleck: Charles Roy Henderson, April 1, 1911 – March 14, 1989. United States National Academy of Sciences. Abgerufen am 28. Mai 2012.
Robert A. McLean, Sanders, William L.; Stroup, Walter W.: A Unified Approach to Mixed Linear Models. In: American Statistical Association (Hrsg.): The American Statistician. 45, Nr. 1, 1991, S. 54–64. JSTOR 2685241. doi:10.2307/2685241.
ML Lindstrom, Bates, DM: Newton-Raphson and EM algorithms for linear mixed-effects models for repeated-measures data. In: JASA. 83, Nr. 404, 1988, S. 1014–1021.
Nan M. Laird, Ware, James H.: Random-Effects Models for Longitudinal Data. In: International Biometric Society (Hrsg.): Biometrics. 38, Nr. 4, 1982, S. 963–974. doi:10.2307/2529876. PMID 7168798.

Weiterführende Literatur

G. A. Milliken, D. E. Johnson: Analysis of messy data: Vol. I. Designed experiments. Chapman & Hall, New York 1992.
B. T. West, K. B. Welch, A. T. Galecki: Linear mixed models: A practical guide to using statistical software. Chapman & Hall/CRC. New York 2007.

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.

[1] R. A. Fisher: The correlation between relatives on the supposition of Mendelian inheritance. In: Transactions of the Royal Society of Edinburgh. 52, 1918, S. 399–433.

[GKR1991-2] G.K. Robinson: That BLUP is a Good Thing: The Estimation of Random Effects. In: Statistical Science. 6, Nr. 1, 1991, S. 15–32. JSTOR 2245695. doi:10.1214/ss/1177011926.

[3] C. R. Henderson, Oscar Kempthorne, S. R. Searle and C. M. von Krosigk: The Estimation of Environmental and Genetic Trends from Records Subject to Culling. In: International Biometric Society (Hrsg.): Biometrics. 15, Nr. 2, 1959, S. 192–218. JSTOR 2527669. doi:10.2307/2527669.

[LDVV1989-4] L. Dale Van Vleck: Charles Roy Henderson, April 1, 1911 – March 14, 1989. United States National Academy of Sciences. Abgerufen am 28. Mai 2012.

[5] Robert A. McLean, Sanders, William L.; Stroup, Walter W.: A Unified Approach to Mixed Linear Models. In: American Statistical Association (Hrsg.): The American Statistician. 45, Nr. 1, 1991, S. 54–64. JSTOR 2685241. doi:10.2307/2685241.

[6] ML Lindstrom, Bates, DM: Newton-Raphson and EM algorithms for linear mixed-effects models for repeated-measures data. In: JASA. 83, Nr. 404, 1988, S. 1014–1021.

[7] Nan M. Laird, Ware, James H.: Random-Effects Models for Longitudinal Data. In: International Biometric Society (Hrsg.): Biometrics. 38, Nr. 4, 1982, S. 963–974. doi:10.2307/2529876. PMID 7168798.