Was ist eine Kovarianz? – Erklärung & Beispiel

Um den Zusammenhang zwischen zwei Merkmalen, wie zum Beispiel zwischen der Körpergröße und dem Gewicht zu messen, wird die Kovarianz angewandt.

Dabei basiert diese, bei der Berechnung dieses Zusammenhänge, auf arithmetischen Mittelwerten. Deshalb muss zunächst einmal die Differenz zwischen dem Messwert, also der Merkmalsausprägung und dessen arithmetischen Mittwert bestimmt werden, um anschließend die Kovarianz berechnen zu können.

Wurde dies bestimmt, dann ergeben die Differenzen bzw die Abweichungen anschließend multipliziert, aufaddiert und durch die Anzahl der Merkmalsträger bzw. Messungen geteilt, die Kovarianz.

Die Formel hierfür sieht folgendermaßen aus:, Cov (x, y) = [ ∑ (x – ∅ x) × (y – ∅ y) ] / n.

Erklärung

In der Formel steht ∅ x bzw. ∅ y für den arithmetischen Mittelwert, sprich den Durchschnitt von x bzw. Y. Der Buchstabe n steht stellvertretend für die die Anzahl der untersuchten Merkmalsträger. Zu guter letzt müssen x bzw. y von 1 bis n aufsummiert werden, wofür dieses Zeichen steht ∑.

Ein Beispiel

In dem Beispiel, um die Kovarianz berechnen zu können, gibt es drei Milchbauern Anton, Bernd und Claus.
Anton hat eine Kuh, welche täglich 30 Liter Milch gibt, Bernd zwei, womit er auf eine tägliche Milchmenge von 60 Litern kommt und Claus hat drei Kühe, welche ihm täglich 90 Liter Milch bringen.

Ist der Durchschnitt berechnet, dann weicht die Anzahl der Küche jeweils um – 1, 0 und 1 von diesem ab. Die Milchproduktion hingegen weicht um je -30, 0 und 30 von dem Durchschnitt ab.
Das Produkt der Abweichungen beträgt für Anton und Bernd 30 und für Claus 0.

Durch die Anwendung der Formel beträgt der Durchschnitt der Kühe ( 1 + 2 + 3) / 3 = 2 und der, der Milchleistung (30 + 60 + 90 Liter) / 3 = 60 Liter.

Aus dem Streudiagramm wäre der lineare Zusammenhang zwischen der Anzahl der Kühe und der Milchproduktion sofort erkennbar und offensichtlich, doch diese Kovarianz kann auch berechnet werden.

Die Berechnung

Zunächst werden die 3 Abweichungsprodukte aufaddiert: 30 + 0 + 30 = 60 und dann durch die drei Merkmalsträger, welches in dem Beispiel die drei Milchbauern sind, geteilt: 60 / 3 = 20.
Um die Abweichung für Anton berechnen zu können, muss die negative Abweichung von -1 mit der negativen Abweichung von – 30 (Liter) multipliziert werden, wobei das Ergebnis +30 resultiert.

Die vollständige Formel für diese Berechnung lautet Cov = [ (1 – 2) × (30 – 60) + (2 – 2) × (60 – 60) + (3 – 2) × (90 – 60) ] / n = (30 + 0 + 30) / 3 = 60/3 = 20.
Wenn eine Kovarianz positive Werte hat, ist daraus zu schließen, dass ein Merkmal hohe Werte hat und zudem mit hohen Werten des anderen Merkmals einhergeht, was umgekehrt auf negative Ergebnisse reagiert Kovarianz übertragbar ist.

Probleme der Kovarianz

Da bei der Kovarianz unterschiedliche Einheiten miteinander multipliziert werden, ist diese schlecht interpretierbar.
Würde man die Messeinheiten ändern, dann würde sich dementsprechend auch der Wert der Kovarianz ändern.
Aus diesem Grund wird die Kovarianz nur als Ausgangspunkt für weitere Berechnungen mit anderen Korrelationskoeffizienten, wie den Pearson-Korrelationskoeffizient benutzt.

Unkorreliertheit

Eine Unkorreliertheit bedeutet, dass zwei Merkmale unkorreliert sind. Davon ist dann die Rede, wenn das Ergebnis der Kovarianz gleich Null ist und somit nicht weiter gerechnet werden muss.

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here

* Die Checkbox für die Zustimmung zur Speicherung ist nach DSGVO zwingend.

Ich stimme zu.