Zusammenhangsmaß
aus Wikipedia, der freien Enzyklopädie
Ein Zusammenhangsmaß oder Kontingenzkoeffizient gibt in der Statistik die Stärke und die Art eines Zusammenhangs zweier Größen wieder.
Zusammenhangsmaße sind z. B.:
- nominal: normierter Kontingenzkoeffizient, z.B. Cramers V, Chi-Quadrat, Assoziationskoeffizient
- ordinal: Rangkorrelationskoeffizient
- metrisch: Korrelationskoeffizienten: Kovarianz, normiert: nach Bravais-Pearson.
Man muss beachten, dass zwei Merkmale bzw. zwei Variablen unterschiedliche Skalenniveaus besitzen können, daher bietet die obige Auflistung nur einen kleinen Überblick.
In der Statistik drückt der Kontingenzkoeffizient die Enge des Zusammenhangs zwischen zwei (oder mehreren) qualitativen Merkmalen aus. Der Kontingenzkoeffizient (CC) berechnet sich dabei aus:
n -> Summe aller Ereignisse χ2 -> ist ein Maß für den Unterschied zwischen beobachteten und erwarteten Ereignissen
[Bearbeiten] Kontingenzkoeffizient K (nach Karl Pearson)
Der Pearsonsche Kontingenzkoeffizient basiert auf dem Vergleich von tatsächlich ermittelten Häufigkeiten zweier Merkmale mit den Häufigkeiten die man bei Unhabhängigkeit dieser Merkmale erwartet hätte.
χ2 kann grundsätzlich sehr große Werte annehmen und ist nicht auf die Bildmenge [0,1] beschränkt. Dazu wird aus dem χ2 der sogenannte Kontingenzkoeffizient nach Karl Pearson ermittelt:
- .
Wenn k = min( | I | , | J | ) das Minimum aus der Anzahl der möglichen Merkmalausprägungen ist, dann gilt . Daher benutzt man auch häufig den korrigierten Kontigenzkoeffizient:
- .
Ein Kkorr nahe 0 deutet dabei auf unabhängige Merkmale hin, ein Kkorr in der Nähe von 1 dagegen auf ein hohes Maß an Abhängigkeit.