Kovarianz (Stochastik)

Die Kovarianz (lateinisch con- = „mit-“ und Varianz (Streuung) von variare = „(ver)ändern, verschieden sein“, daher selten auch Mitstreuung[1]) ist in der Stochastik ein nichtstandardisiertes Zusammenhangsmaß für einen monotonen Zusammenhang zweier Zufallsvariablen mit gemeinsamer Wahrscheinlichkeitsverteilung. Der Wert dieser Kennzahl macht tendenzielle Aussagen darüber, ob hohe Werte der einen Zufallsvariablen eher mit hohen oder eher mit niedrigen Werten der anderen Zufallsvariablen einhergehen.

Die Kovarianz ist ein Maß für die Assoziation zwischen zwei Zufallsvariablen.

Definition

Sind $X$ und $Y$ zwei reelle, integrierbare Zufallsvariablen, deren Produkt ebenfalls integrierbar ist, d. h., die Erwartungswerte $\operatorname {E} (X)$ , $\operatorname {E} (Y)$ und $\operatorname {E} (XY)$ existieren, dann heißt

\operatorname {Cov} (X,Y):=\operatorname {E} {\bigl [}(X-\operatorname {E} (X))\cdot (Y-\operatorname {E} (Y)){\bigr ]}

die Kovarianz von $X$ und $Y$ . Die Kovarianz ist also das Produkt der Differenzen je zwischen $X$ und $Y$ und ihren Erwartungswerten. In der Statistik werden $\operatorname {E} (X)$ und $E(Y)$ als Abweichungen vom arithmetischen Mittelwert berechnet.[2]

Falls $X$ und $Y$ quadratintegrierbar sind, also falls $\operatorname {E} (|X|^{2})=\operatorname {E} (X^{2})<\infty$ und $\operatorname {E} (|Y|^{2})=\operatorname {E} (Y^{2})<\infty$ gelten, so folgen aus der Cauchy-Schwarz-Ungleichung:

\operatorname {E} (|X|)=\operatorname {E} (|X|\cdot 1)\leq {\sqrt {\operatorname {E} (|X|^{2})}}<\infty

und analog

\operatorname {E} (|Y|)\leq {\sqrt {\operatorname {E} (|Y|^{2})}}<\infty

und zusätzlich

\operatorname {E} (|X\cdot Y|)\leq \operatorname {E} (|X|\cdot |Y|)\leq {\sqrt {\operatorname {E} (|X|^{2})\cdot \operatorname {E} (|Y|^{2})}}<\infty

.

Somit ist die geforderte Existenz der Erwartungswerte für quadratintegrierbare Zufallsvariablen erfüllt.

Berechnung

Die Berechnung der empirischen Kovarianz aus einer Datenreihe erfolgt durch die Gleichung

\sigma _{x,y}^{2}={\frac {\sum _{i}w_{x,i}w_{y,i}\left(x_{i}-{\bar {x}}\right)\left(y_{i}-{\bar {y}}\right)}{\left(\sum _{i}w_{x,i}w_{y,i}\right)-1}}

.

Dabei sind ${\bar {x}}$ und ${\bar {y}}$ die Mittelwerte der Messwerte $x_{i}$ und $y_{i}$ . Mit $w_{x,i}$ und $w_{y,i}$ kann den beiden Variablen, sowie jedem einzelnen Messwert optional ein individuelles Gewicht ungleich Eins zugeordnet werden. Die $-1$ im Nenner ist nur dann notwendig, wenn bei sehr wenigen Messwerten die empirische Kovarianz erwartungstreu geschätzt werden soll. In diesem Fall müssen auch die Mittelwerte ${\bar {x}}$ und ${\bar {y}}$ mit entsprechender Gewichtung gebildet werden:

{\bar {x}}={\frac {\sum _{i}w_{x,i}w_{y,i}x_{i}}{\sum _{i}w_{x,i}w_{y,i}}}

,

{\bar {y}}={\frac {\sum _{i}w_{x,i}w_{y,i}y_{i}}{\sum _{i}w_{x,i}w_{y,i}}}

.

Eigenschaften und Rechenregeln

Interpretation der Kovarianz

Die Kovarianz ist positiv, wenn zwischen $X$ und $Y$ ein monotoner Zusammenhang besteht, d. h., hohe (niedrige) Werte von $X$ gehen mit hohen (niedrigen) Werten von $Y$ einher.
Die Kovarianz ist hingegen negativ, wenn zwischen $X$ und $Y$ ein gegensinniger monotoner Zusammenhang besteht, d. h. hohe Werte der einen Zufallsvariablen gehen mit niedrigen Werten der anderen Zufallsvariablen einher und umgekehrt.
Ist das Ergebnis null, so besteht kein monotoner Zusammenhang zwischen $X$ und $Y$ ; nichtmonotone Beziehungen sind aber möglich.

Die Kovarianz gibt zwar die Richtung einer Beziehung zwischen zwei Zufallsvariablen an, über die Stärke des Zusammenhangs wird aber keine Aussage getroffen. Dies liegt an der Linearität der Kovarianz. Um einen Zusammenhang vergleichbar zu machen, muss die Kovarianz standardisiert werden. Die gebräuchlichste Standardisierung – mittels der Standardabweichung – führt zum Korrelationskoeffizienten.

Verschiebungssatz

Zur oft einfacheren Berechnung der Kovarianz kann man auch den Verschiebungssatz als alternative Darstellung der Kovarianz anwenden.

Satz (Verschiebungssatz für die Kovarianz):

\operatorname {Cov} (X,Y)=\operatorname {E} (XY)-\operatorname {E} (X)\operatorname {E} (Y).

Beweis:

{\begin{aligned}\operatorname {Cov} (X,Y)&=\operatorname {E} {\bigl [}(X-\operatorname {E} (X))\cdot (Y-\operatorname {E} (Y)){\bigr ]}\\&=\operatorname {E} {\bigl [}(XY-X\operatorname {E} (Y)-Y\operatorname {E} (X)+\operatorname {E} (X)\operatorname {E} (Y)){\bigr ]}\\&=\operatorname {E} (XY)-\operatorname {E} (X)\operatorname {E} (Y)-\operatorname {E} (Y)\operatorname {E} (X)+\operatorname {E} (X)\operatorname {E} (Y)\\&=\operatorname {E} (XY)-\operatorname {E} (X)\operatorname {E} (Y)\qquad \Box \end{aligned}}

Beziehung zur Varianz

Satz: Die Kovarianz ist die Verallgemeinerung der Varianz, denn es gilt

\operatorname {Var} (X)=\operatorname {Cov} (X,X).

Beweis:

{\begin{aligned}\operatorname {Cov} (X,X)&=\operatorname {E} {\bigl [}(X-\operatorname {E} (X))^{2}{\bigr ]}\\&=\operatorname {Var} (X)\qquad \Box \end{aligned}}

Die Varianz ist demnach die Kovarianz einer Zufallsvariablen mit sich selbst.

Mit Hilfe der Kovarianzen lässt sich auch die Varianz einer Summe von quadratintegrierbaren Zufallsvariablen berechnen. Allgemein gilt

{\begin{aligned}\operatorname {Var} \left(\sum _{i=1}^{n}X_{i}\right)&=\sum _{i,j=1}^{n}\operatorname {Cov} (X_{i},X_{j})\\&=\sum _{i=1}^{n}\operatorname {Var} (X_{i})+\sum _{i,j=1,i\neq j}^{n}\operatorname {Cov} (X_{i},X_{j})\\&=\sum _{i=1}^{n}\operatorname {Var} (X_{i})+2\sum _{i=1}^{n-1}\sum _{j=i+1}^{n}\operatorname {Cov} (X_{i},X_{j}).\end{aligned}}

Speziell für die Summe zweier Zufallsvariablen gilt daher die Formel

\operatorname {Var} (X+Y)=\operatorname {Var} (X)+\operatorname {Var} (Y)+2\operatorname {Cov} (X,Y).

Wie sich unmittelbar aus der Definition ergibt, ändert die Kovarianz das Vorzeichen, wenn eine der Variablen das Vorzeichen ändert:

\operatorname {Cov} (X,-Y)=-\operatorname {Cov} (X,Y)

Somit ergibt sich für die Differenz zweier Zufallsvariablen die Formel

\operatorname {Var} (X-Y)=\operatorname {Var} (X+(-Y))=\operatorname {Var} (X)+\operatorname {Var} (Y)-2\operatorname {Cov} (X,Y).

Linearität, Symmetrie und Definitheit

Satz: Die Kovarianz ist eine positiv semidefinite symmetrische Bilinearform auf dem Vektorraum der quadratisch integrierbaren Zufallsvariablen.

Es gelten also die folgenden drei Sätze:

Satz (Bilinearität): Für $a,b,c,d,e,f,g,h\in \mathbb {R}$ gilt:

\operatorname {Cov} (aX+b,cY+d)=ac\operatorname {Cov} (X,Y)\qquad und

\operatorname {Cov} [X,(eY+f)+(gZ+h)]=e\operatorname {Cov} (X,Y)+g\operatorname {Cov} (X,Z).

Beweis:

{\begin{aligned}\operatorname {Cov} (aX+b,cY+d)&=\operatorname {E} {\bigl [}(aX+b-\operatorname {E} (aX+b))\cdot (cY+d-\operatorname {E} (cY+d)){\bigr ]}\\&=\operatorname {E} {\bigl [}(aX-a\operatorname {E} (X))\cdot (cY-c\operatorname {E} (Y)){\bigr ]}\\&=ac\operatorname {E} {\bigl [}(X-\operatorname {E} (X))\cdot (Y-\operatorname {E} (Y)){\bigr ]}\\&=ac\operatorname {Cov} (X,Y)\end{aligned}}

{\begin{aligned}\operatorname {Cov} [X,(eY+f)+(gZ+h)]&=\operatorname {E} {\bigl [}(X-\operatorname {E} (X))\cdot (eY+f+gZ+h-\operatorname {E} (eY+f+gZ+h)){\bigr ]}\\&=\operatorname {E} {\bigl [}(X-\operatorname {E} (X))\cdot (eY-e\operatorname {E} (Y)+gZ-g\operatorname {E} (Z)){\bigr ]}\\&=\operatorname {E} {\bigl [}(X-\operatorname {E} (X))\cdot e(Y-\operatorname {E} (Y))+(X-\operatorname {E} (X))\cdot g(Z-\operatorname {E} (Z)){\bigr ]}\\&=e\operatorname {E} {\bigl [}(X-\operatorname {E} (X))\cdot (Y-\operatorname {E} (Y)){\bigr ]}+g\operatorname {E} {\bigl [}(X-\operatorname {E} (X))\cdot (Z-\operatorname {E} (Z)){\bigr ]}\\&=e\operatorname {Cov} (X,Y)+g\operatorname {Cov} (X,Z)\qquad \Box \end{aligned}}

Die Kovarianz ist offensichtlich invariant unter der Addition von Konstanten zu den Zufallsvariablen. In der zweiten Gleichung ist die Kovarianz wegen der Symmetrie auch im ersten Argument linear.

Satz (Symmetrie):

\operatorname {Cov} (X,Y)=\operatorname {Cov} (Y,X)

Beweis:

{\begin{aligned}\operatorname {Cov} (X,Y)&=\operatorname {E} {\bigl [}(Y-\operatorname {E} (Y))\cdot (X-\operatorname {E} (X)){\bigr ]}\\&=\operatorname {Cov} (Y,X)\qquad \Box \end{aligned}}

Satz (Positive Semidefinitheit):

\operatorname {Cov} (X,X)\geq 0.

Beweis:

\operatorname {Cov} (X,X)=\operatorname {Var} (X)\geq 0\qquad \Box

Insgesamt folgt wie für jede positiv semidefinite symmetrische Bilinearform die Cauchy-Schwarzsche Ungleichung

|\operatorname {Cov} (X,Y)|\leq {\sqrt {\operatorname {Var} (X)}}\cdot {\sqrt {\operatorname {Var} (Y)}}

Die Linearität der Kovarianz hat zur Folge, dass die Kovarianz vom Maßstab der Zufallsvariablen abhängt. So erhält man beispielsweise die zehnfache Kovarianz, wenn man anstatt $X$ die Zufallsvariable $10X$ betrachtet. Insbesondere hängt der Wert der Kovarianz von den verwendeten Maßeinheiten der Zufallsvariablen ab. Da diese Eigenschaft die absoluten Werte der Kovarianz schwer interpretierbar macht, betrachtet man bei der Untersuchung auf einen linearen Zusammenhang zwischen $X$ und $Y$ häufig stattdessen den maßstabsunabhängigen Korrelationskoeffizienten. Der maßstabsunabhängige Korrelationskoeffizient zweier Zufallsvariablen $X$ und $Y$ ist die Kovarianz der standardisierten (auf die Standardabweichung bezogenen) Zufallsvariablen ${\tilde {X}}=X/\sigma _{X}$ und ${\tilde {Y}}=Y/\sigma _{Y}$ :[3]

\operatorname {Cov} ({\tilde {X}},{\tilde {Y}})=\operatorname {Cov} (X/\sigma _{X},Y/\sigma _{Y})={\frac {1}{\sigma _{X}\sigma _{Y}}}\operatorname {Cov} (X,Y)=:\rho (X,Y)

.

Unkorreliertheit und Unabhängigkeit

Definition (Unkorreliertheit): Zwei Zufallsvariablen $X$ und $Y$ heißen unkorreliert, wenn $\operatorname {Cov} (X,Y)=0$ .

Satz: Zwei stochastisch unabhängige Zufallsvariablen sind unkorreliert.

Beweis: Für stochastisch unabhängige Zufallsvariablen $X$ und $Y$ gilt $\operatorname {E} (XY)=\operatorname {E} (X)\operatorname {E} (Y)$ , d. h.

{\begin{aligned}\operatorname {E} (XY)-\operatorname {E} (X)\operatorname {E} (Y)&=0\\\Leftrightarrow \qquad \qquad \qquad \operatorname {Cov} (X,Y)&=0.\qquad \end{aligned}}

Der Umkehrschluss gilt im Allgemeinen nicht. Ein Gegenbeispiel ist gegeben durch eine im Intervall $[-1,1]$ gleichverteilte Zufallsvariable $X$ und $Y=X^{2}$ . Offenkundig sind $X$ und $Y$ voneinander abhängig. Es gilt aber

\operatorname {Cov} (X,Y)=\operatorname {Cov} (X,X^{2})=\operatorname {E} (X^{3})-\operatorname {E} (X)\operatorname {E} (X^{2})=0-0\cdot \operatorname {E} (X^{2})=0

.

Stochastisch unabhängige Zufallsvariablen, deren Kovarianz existiert, sind also auch unkorreliert. Umgekehrt bedeutet Unkorreliertheit aber nicht zwingend, dass die Zufallsvariablen stochastisch unabhängig sind, denn es kann eine nichtmonotone Abhängigkeit bestehen, die die Kovarianz nicht erfasst.

Weitere Beispiele für unkorrelierte, aber stochastisch abhängige Zufallsvariablen:

Seien $X$ und $Y$ Zufallsvariablen mit $P(X=0,Y=1)={\tfrac {1}{2}}$ und $P(X=2,Y=0)=P(X=2,Y=2)={\tfrac {1}{4}}.$

Dann gilt

P(X=0)=P(X=2)={\tfrac {1}{2}}

und

P(Y=0)=P(Y=2)={\tfrac {1}{4}}

,

P(Y=1)={\tfrac {1}{2}}.

Es folgt

\operatorname {E} (X)=\operatorname {E} (Y)=1

und ebenfalls

\operatorname {E} (XY)=1

, also

\operatorname {Cov} (X,Y)=0.

Andererseits sind

X

und

Y

wegen

P(X=0,Y=1)={\tfrac {1}{2}}\neq {\tfrac {1}{2}}\cdot {\tfrac {1}{2}}=P(X=0)P(Y=1)

nicht stochastisch unabhängig.

Seien die Zufallsvariablen $X$ und $Y$ bernoulliverteilt mit Parameter $p$ und unabhängig, dann sind $(X+Y)$ und $(X-Y)$ unkorreliert, aber nicht unabhängig.

Die Unkorreliertheit ist klar, denn

\operatorname {Cov} (X+Y,X-Y)=\operatorname {Cov} (X,X)-\operatorname {Cov} (X,Y)+\operatorname {Cov} (Y,X)-\operatorname {Cov} (Y,Y)=0.

Aber

(X+Y)

und

(X-Y)

sind nicht unabhängig, denn es ist

P(X+Y=0,X-Y=1)=0\neq p(1-p)^{3}=P(X+Y=0)P(X-Y=1).

Siehe auch

Kovarianzmatrix

Literatur

Norbert Henze: Stochastik für Einsteiger: Eine Einführung in die faszinierende Welt des Zufalls. 10. Auflage. Verlag Springer Spektrum, Wiesbaden 2013, ISBN 978-3-658-03076-6, Kapitel 21, doi:10.1007/978-3-658-03077-3_21.
Karl Bosch: Elementare Einführung in die Angewandte Statistik: Mit Aufgaben und Lösungen, 9. erw. Auflage. Vieweg+Teubner Verlag 2010, ISBN 978-3834812292, doi:10.1007/978-3-8348-9705-3.

Einzelnachweise

Hansjochem Autrum, Erwin Bünning et al.: Ergebnisse Der Biologie., S. 88
Rainer Diaz-Bone: Statistik für Soziologen. 5. Auflage. UVK Verlag, ISBN 978-3-8252-5210-6, 4.3.2, S87.
Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, und Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin/ Heidelberg 2016, ISBN 978-3-662-50371-3, S. 326.

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.

[1] Hansjochem Autrum, Erwin Bünning et al.: Ergebnisse Der Biologie., S. 88

[2] Rainer Diaz-Bone: Statistik für Soziologen. 5. Auflage. UVK Verlag, ISBN 978-3-8252-5210-6, 4.3.2, S87.

[3] Ludwig Fahrmeir, Rita Künstler, Iris Pigeot, und Gerhard Tutz: Statistik. Der Weg zur Datenanalyse. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin/ Heidelberg 2016, ISBN 978-3-662-50371-3, S. 326.