Was ist ein Chi-Quadrat? – Erklärung & Beispiel

Um zu sehen, ob zischen normalskalierten Merkmalen ein Zusammenhang besteht und wie stark dieser ist, wird das Chi-Quadrat (χ2), welches ein Korrelationsmaß ist, verwendet.
Während der unterste Wert für das Chi-Quadrat bei 0 festgelegt ist, ist das Korrelationsmaß nach oben unbegrenzt.

Das Ergebnis der Chi-Quadrat-Berechnung ist aus diesem Grund schwer zu interpretieren, weshalb oft normierte Zusammenhangsmaße wie Cramers V oder der Phi-Koeffizient verwendet werden. Diese werden aus dem Chi-Quadrat abgeleitet.

Andere Bezeichnungen

Alternative Begriffe, welche man für das Chi-Quadrat verwenden kann, sind zum einen Chi-Quadrat-Koeffizient und zum anderen Chi-Quadrat-Wert.

Ein Beispiel

In einer Vierfeldertafel werden Häufigkeiten für zwei nominalskalierte Merkmale angezeigt. Diese sind zum einen das Merkmal 1 Geschlecht und das Merkmal 2 Mitgliedschaft in einem Sportverein. Betrachtet werden die Schüler einer Klasse.

Ob und inwiefern zwischen den beiden Merkmalen ein Zusammenhang besteht, wird durch das Chi-Quadrat ermittelt.
Die Frage, ob Jungen häufiger in einem Sportverein sind, ist dabei die Basis.

Bereits in der Vierfeldertafel, in welcher absolute Häufigkeiten dargestellt sind, kann man sehen, dass Jungen tendenziell häufiger in einem Sportverein sind, als Mädchen.
Mädchen Jungen Gesamt
im Sportverein 9 9 18
nicht im Sportverein 9 3 12
Gesamt 18 12 30
Im ersten Schritt müssen nun die relativen Häufigkeiten berechnet werden, damit man herausfindet, wie stark die Zusammenhänge sind. Man kann jedoch auch mit den absoluten Häufigkeiten rechnen. In dem Beispiel werden allerdings die relativen Häufigkeiten verwendet. Für die Vierfeldertafel bedeutet das folgendes:
Vierfeldertafel mit relativen Häufigkeiten
Mädchen Jungen Gesamt
im Sportverein 0,3 0,3 0,6
nicht im Sportverein 0,3 0,1 0,4
Gesamt 0,6 0,4 1,0
Berechnet wird die relative Häufigkeit jeweils so, dass zum Beispiel 9 von den 30 Schülern in der Klasse Mädchen sind und gleichzeitig in einem Sportverein tätig sind. 9 geteilt durch 30 ergibt 0,3, was dann die relative Häufigkeit für die Mädchen in einem Sportverein ist.

In dem zweiten Schritt muss nun berechnet werden, wie die Verteilung aussehen würde, wenn man davon ausgeht, dass es keinen Zusammenhang zwischen den Geschlechtern und der Mitgliedschaft in einem Sportverein gibt.
Dafür wird die sogenannte Indiferenztabelle, was nichts weiter als eine Vierfeldertafel ist, angefertigt.
Mädchen Jungen Gesamt
im Sportverein 0,36 0,24 0,6
nicht im Sportverein 0,24 0,16 0,4
Gesamt 0,6 0,4 1,0
Um zu zeigen wie gerechnet wird, sieht man sich nochmal die Mädchen an, welche in einem Sportverein sind. Der Wert wird so berechnet, dass die beiden Randhäufigkeiten einmal für Mädchen und einmal für Mitglied im Sportverein multipliziert werden, wobei 0,6 × 0,6 = 0,36 resultiert.

Nun kann im dritten Schritt das Chi-Quadrat berechnet werden.
Um dies zu tun, werden zwischen den tatsächlichen und den unabhängigen, theoretischen Häufigkeiten, jeweils die Differenzen gebildet.

Diese Differenzen werden anschließend ins Quadrat gesetzt und dann durch die theoretischen Häufigkeiten geteilt.
Die einzelnen Ergebnisse werden dann aufsummiert und zu guter letzt mit der Anzahl der Merkmalsträger, was in dem Beispiel die 30 Schüler sind, multipliziert.
Chi-Quadrat χ2 = 30 × { [ (0,3 – 0,36) 2 / 0,36 ] + [ (0,3 – 0,24) 2 / 0,24 ] + [ (0,3 – 0,24) 2 / 0,24 ] + [ (0,1 – 0,16) 2 / 0,16 ] }
= 30 × { [ 0,01 ] + [ 0,015 ] + [ 0,015 ] + [ 0,0225 ] }
= 30 × 0,0625 = 1,875.

Hinweis

Rechnet man, anders als in dem Beispiel gezeigt, mit den absoluten Häufigkeit, fällt der letzte Rechenschritt, welcher die Multiplikation mit der Anzahl der Merkmalsträger ist, weg.

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here

* Die Checkbox für die Zustimmung zur Speicherung ist nach DSGVO zwingend.

Ich akzeptiere