Zusammenhangsmaße – Statistischen Zusammenhang ermitteln

04.02.23 Zusammenhangsmaße Lesedauer: 9min

Wie gefällt dir dieser Beitrag?

0 Bewertungen


Zusammenhangsmaße-Definition

Um Daten in deiner wissenschaftlichen Arbeit auswerten zu können, ist es relevant zu wissen, wie diese korrelieren. Zusammenhangsmaße verstehen und berechnen zu können ist hierfür notwendig, um mehrere Variablen in einen Kontext bringen zu können.

In diesem Beitrag erhältst du einen Überblick über die Zusammenhangsmaße, deren Formeln und Beispiele für ihre Anwendung.

Zusammenhangsmaße „einfach erklärt“

Zusammenhangsmaße geben die Stärke des Zusammenhangs zwischen statistischen Variablen an. Sie zeigen belegbare Abhängigkeiten zwischen zwei Größen an. In der empirischen Forschung verwendest du Zusammenhangsmaße wie den Korrelationskoeffizienten nach Pearson zur Überprüfung von Hypothesen.1

Definition: Zusammenhangsmaße

Zusammenhangsmaße sind Größen, die angeben, wie stark der Zusammenhang zwischen zwei Variablen ist. Es existieren in der Statistik unterschiedliche Zusammenhangsmaße, die jeweils für ein bestimmtes oder für bestimmte Skalenniveaus geeignet sind. Liegen dir metrische Daten vor, dann kannst du unter anderem den Korrelationskoeffizienten nach Pearson verwenden. Für nominale Daten ist Chi-Quadrat eines der im Studium am häufigsten angewandten Zusammenhangsmaße.2

Die digitale Vorschau deiner Arbeit
Du möchtest vor dem Druck wissen, ob deine Arbeit nach deinen Vorstellungen gedruckt werden kann? Kein Problem! Mit der formellen Endkontrolle von BachelorPrint erhältst du eine digitale und kostenlose Vorschau deiner gedruckten Arbeit.

Relevanz der Zusammenhangsmaße

Zusammenhangsmaße verwendest du, um Abhängigkeiten zwischen den Variablen deiner empirischen Daten zu erkennen. Beispielsweise untersuchst du, ob die Wahrscheinlichkeit für das Auftreten der Krankheit X vom Alter der Menschen abhängig ist. Du erkennst Einflussfaktoren auf die von dir definierten Variablen. Zunächst stellst du Hypothesen auf, die du mittels der Zusammenhangsmaße untersuchst.3

In der Wissenschaft werden Zusammenhangsmaße für statistische Auswertungen verwendet. Im Studium ist die Anwendung vor allem im Rahmen von Hausarbeiten und Abschlussarbeiten notwendig. Entscheidest du dich für eine empirische Untersuchung im praktischen Teil der Bachelorarbeit oder der Masterarbeit und fokussierst du dich dabei auf quantitative Forschungsmethoden, dann wendest du statistische Methoden an. Du wertest die Datensätze zunächst mittels deskriptiver Statistiken – wie dem Mittelwert und der Häufigkeitsverteilung – aus. Anschließend nutzt du die Daten zur Überprüfung von Hypothesen – beispielsweise dem Ermitteln von Einflussfaktoren auf Beobachtungen.

Empirische Studien, die auf statistische Methoden zurückgreifen, finden unter anderem in folgenden Studiengängen statt:

  • Wirtschaftswissenschaften
  • Psychologie
  • Medizin
  • Sozialwissenschaften
  • Pädagogik

Die Ergebnisse der empirischen Studien dienen der Erkenntnisgewinnung für die zugehörigen Professionen und sind daher für Theorie und Praxis von Belangen.

Zusammenhangsmaße richtig anwenden

In diesem Abschnitt erfährst du, wie du Zusammenhangsmaße richtig anwendest. Du lernst, unter welchen Bedingungen du welche Zusammenhangsmaße einsetzen kannst und auf welche Aspekte du bei der Anwendung achten musst.

Im ersten Schritt überprüfst du, welches Skalenniveau die Daten aufweisen. Für jedes Skalenniveau stehen bestimmte Zusammenhangsmaße zur Auswahl, die du nutzen kannst. Wähle das passende Zusammenhangsmaß aus und folge dem Algorithmus des betreffenden Maßes.

Zusammenhangsmaße bei nominalen Daten

Ein nominal skaliertes Merkmal weist unterscheidbare Ausprägungen auf, die jedoch in keine natürliche Ordnung gebracht werden können. Ein Beispiel ist das Merkmal „Farbe“ mit den Ausprägungen „Rot“, „Blau“ und „Gelb“. Die Merkmale sind eindeutig unterscheidbar, allerdings ist keine Farbe höher oder niedriger als eine andere Farbe. Werden Zusammenhangsmaße bei nominal skalierten Daten bestimmt, dann berechnest du die Häufigkeiten für die einzelnen Ausprägungen und die Kombination aus den verschiedenen Ausprägungen. 4

Angenommen im Rahmen einer empirischen Untersuchung soll der Zusammenhang zwischen dem Geschlecht und der der ausgeübten Sportart bei Jugendlichen untersucht werden. Folgende Daten liegen vor:

  • Fußball; m
    Fußball; m
    Fußball; w
  • Handball; m
    Handball; w
    Handball; w
  • Tennis; m
  • Basketball; w
    Basketball; m
  • Leichtathletik; w

Die zugehörige Kreuztabelle gibt die Häufigkeitskombinationen wieder. Sie wird beispielsweise zur Berechnung von Chi-Quadrat benötigt:

Sportart männlich weiblich
Fußball 2 1
Basketball 1 1
Handball 1 2
Tennis 1 0
Leichtathletik 0 1

Chi-Quadrat

Mittels des Chi-Quadrat-Unabhängigkeitstests überprüfst du die Unabhängigkeit zweier Merkmale. Es handelt sich um einen Hypothesentest der stochastischen Mathematik. Für die Durchführung des Chi-Quadrat-Tests berechnest du den Chi-Quadrat-Wert. Du stellst wie oben beschrieben die Kontingenztafel auf und führst den Signifikanztest durch. Das Ergebnis beantwortet die Frage, ob die beiden Variablen signifikant unabhängig voneinander sind.
Die Nullhypothese lautet:

H0: Die beiden Variablen sind stochastisch unabhängig voneinander.

Wird die Nullhypothese abgelehnt, dann ist Abhängigkeit anzunehmen. 5

Die Formel zur Berechnung von Chi-Quadrat lautet:6

X² = Σ (OE) 2 / E.

In der vereinfachten Formel sieht die Formel so aus:

X² = Summe ((beobachtete Häufigkeit – erwartete Häufigkeit)² : erwartete Häufigkeit)

Für jedes Feld der Kontingenztafel existiert ein erwarteter Häufigkeitswert. Die einzelnen Summanden berechnen den relativen Wert der quadratischen Abweichung von beobachteter und erwarteter Häufigkeit. In der ersten Formel sorgen die beiden Summenzeichen dafür, dass für jedes Feld der Kontingenztafel diese relative quadratische Abweichung bestimmt wird.

Im Rahmen des Chi-Quadrat-Tests überprüfst du, ob der berechnete X²-Wert größer oder kleiner dem aus der Chi-Quadrat-Tabelle abgelesenem Wert ist. Ist X² größer als der kritische Wert der Testprüfgröße, dann wird die Hypothese bei Vorliegen von Signifikanz abgelehnt.

Cramers V

Cramers V ist ein Zusammenhangsmaß für nominalskalierte Variablen. Der Wert liegt stets zwischen 0 und 1. Je dichter der Wert an 1 liegt, desto stärker ist der Zusammenhang zwischen den beiden Variablen. Die folgende Übersicht dient als Orientierung zur Interpretation des Cramers V:

  • 0 bis 0,2: Schwacher Zusammenhang
  • 0,2 bis 0,6: Mittlerer Zusammenhang
  • 0,6 bis 1: Starker Zusammenhang

Die Berechnung des Cramers V erfolgt ausgehend vom Chi Quadrat Wert mit der Formel:

V = sqrt(X² / (N * n(k-1; m-1))

  • mit V als Cramers V
  • N als Stichprobenumfang
  • k als Anzahl der Zeilen und m als Anzahl der Spalten.7

Kontingenzkoeffizient

Der Kontingenzkoeffizient nach Pearson gehört der Gruppe der Zusammenhangsmaße an. Er drückt die Stärke des Zusammenhangs zweier Variablen aus. Anwendbar ist der Kontingenzkoeffizient bei nominalen und ordinalen Merkmalen. Berechnungsgrundlage ist der Vergleich zwischen den beobachteten Häufigkeiten zweier Merkmale und den Häufigkeiten, welche bei Unabhängigkeit der Merkmale erwartet hätte dürfen. Die quadratische Kontingenz stimmt in ihrer Berechnung mit X² überein.
Sie wird für den Chi-Quadrat-Test genutzt. Der Kontingenzkoeffizient nach Karl Pearson bildet X² auf das Intervall [0;1] ab. Die Umrechnung erfolgt über die Formel:

C = sqrt(X² / (X² + n)

mit C als Kontingenzkoeffizienten nach Pearson, X² als Chi Quadrat und n als Stichprobenumfang. 8

Beispiel für ein nominales Skalenniveau

Für das oben beschriebene Beispiel der Frage nach dem Zusammenhang zwischen der Sportart und dem Geschlecht wurde bereits die Kontingenztafel aufgestellt. Als Zusammenhangsmaß berechne ich X² mit Hilfe der Formel:

X² = Summe ((beobachtete Häufigkeit – erwartete Häufigkeit)² : erwartete Häufigkeit)

Die erwarteten Häufigkeiten werden für die einzelnen Felder nach folgendem Schema bestimmt:

nkj = nj * nk / n

mit nj als Zeilenhäufigkeitssumme und nk als Spaltenhäufigkeitssumme. Für die einzelnen Zellen werden die Quotienten bestimmt, die anschließend zum X²-Wert aufsummiert werden.

Zusammenhangsmaße bei ordinalen Daten

Ordinale Daten weisen eine natürliche Reihenfolge auf. Es ist eindeutig ersichtbar, in welcher Reihenfolge sich die Daten befinden. Ein Beispiel ist die Messung der Zufriedenheit. Die Befragten einer Umfrage geben an, ob sie nicht zufrieden, zufrieden oder sehr zufrieden sind. Die Antworten lassen sich sortieren.9

Rangkorrelationskoeffizient

Rangkorrelationskoeffizienten sind Zusammenhangsmaße, die die Korrelation zwischen zwei Variablen angeben. Die bekanntesten diesbezüglichen Zusammenhangsmaße sind der Spearman’sche Rangkorrelationskoeffizienten (Spearman’sches Rho) und der Kendall’sche Rangkorrelationskoeffizienten (Kendall’sches Tau).

Den empirischen Spearman’schen Rangkorrelationskoeffizient berechnest du über folgende Formel:10

r = Stichprobenkovarianz von R(x) und R(y) / (Standardabweichung der Ränge von x * Standardabweichung der Ränge von y)

Beispiel für ein ordinales Skalenniveau

Zwei Merkmale eines ordinalen Skalenniveaus liegen vor, beispielsweise die Zufriedenheit mit einem Produkt und die Häufigkeit des Kaufs des betreffenden Produktes. Im ersten Schritt wird der Rang der Beobachtungen bestimmt. Die Werte werden hierzu sortiert, dann werden die Ränge vergeben. Liegen gleiche Werte vor, dann wird der Mittelwert gebildet. Anschließend werden die für die Anwendung der Formel erforderlichen Größen bestimmt und die Formel kann angewandt werden. 10

Zusammenhangsmaße bei metrischen Daten

Intervallskalierte Merkmale gelten als metrische Daten. Der Abstand zwischen ganzzahligen Werten ist immer gleichgroß.11

Kovarianz

Die Kovarianz ist gehört der Kategorie der nichtstandardisierten Zusammenhangsmaße an. Aus dem Ergebnis liest du ab, ob hohe Werte tendenziell mit hohen oder niedrigen Werten der jeweils anderen Variable assoziiert sind. Die Formel für die Kovarianz lautet:

COV (X,Y) = E [(X – E(X)) * (Y- E(Y))]

mit E(X) als Erwartungswert von X und E(Y) als Erwartungswert von Y. Die Berechnung der Erwartungswerte erfolgt in der Statistik als Abweichung vom arithmetischen Mittelwert.12

Korrelationskoeffizient nach Pearson (r)

Der Korrelationskoeffizient gibt den Grad des linearen Zusammenhangs wieder. Sein Betrag liegt zwischen 0 und 1, wobei 1 den größten Zusammenhang darstellt. Ein negativer Wert weist auf eine fallende Regressionsgerade hin, ein positiver Wert zeigt eine steigende Regressionsgerade an.
Die Berechnung erfolgt nach folgender Formel:

Zusammenhangsmaße Korrelationskoeffizient

Beispiel für ein ordinales Skalenniveau

Zwei Merkmale eines ordinalen Skalenniveaus liegen vor, beispielsweise die Zufriedenheit mit einem Produkt und die Häufigkeit des Kaufs des betreffenden Produktes. Im ersten Schritt wird der Rang der Beobachtungen bestimmt. Die Werte werden hierzu sortiert, dann werden die Ränge vergeben. Liegen gleiche Werte vor, dann wird der Mittelwert gebildet. Anschließend werden die für die Anwendung der Formel erforderlichen Größen bestimmt und die Formel kann angewandt werden. 10

1 10,00 8,04
2 8,00 6,95
3 13,00 7,58
4 9,00 8,81
5 11,00 8,33
6 14,00 9,96
7 6,00 7,24
8 4,00 4,26
9 12,00 10,84
10 7,00 4,82
11 5,00 5,68

Der Korrelationskoeffizient beträgt:

r = 55,01 / (sqrt(110) * sqrt(41,27) = 0,816

Ein starker Zusammenhang liegt vor. Der Zusammenhang ist positiv. 13

Übersicht der Zusammenhangsmaße

Skalenniveau: Nominal
Zusammenhangsmaße: Chi-Quadrat, Cramer`s V, Kontingenzkoeffizient

Skalenniveau: Ordinal
Zusammenhangsmaße: Rangkorrelationskoeffizient

Skalenniveau: Metrisch
Zusammenhangsmaße: Kovarianz, Korrelationskoeffizient nach Pearson (r)

Drucke deine Arbeit mit BachelorPrint
Bei BachelorPrint kannst du deine Arbeit ganz bequem online konfigurieren und anschließend drucken und binden lassen. Und das Ganze schon ab 7,90 €. Bestelle jetzt und erhalte deine Arbeit schon morgen mit unserem kostenlosen Express-Versand.

Häufig gestellte Fragen

Zusammenhangsmaße geben an, ob und wie stark zwei Variablen miteinander assoziiert sind.

Für die einzelnen Zusammenhangsmaße stehen Formeln zur Verfügung, die für die manuelle Berechnung genutzt werden. Programme wie SPSS bieten Funktionen zur einfachen Berechnung der Zusammenhangsmaße an.

Zusammenhangsmaße sind jeweils für bestimmte Skalenniveaus geeignet.

Einige Zusammenhangsmaße geben die Richtung und die Stärke des Zusammenhangs an.

Hängt Variable y von Variable x ab, dann verändert sich y wenn sich x verändert.

Quellen

1Scholz F.: Assoziationsmaß, in: Spektrum.de, 2023, [online] https://www.spektrum.de/lexikon/mathematik/assoziationsmass/303 (abgerufen am 24.01.2023)

2Arzheimer K.: Was sind Zusammenhangsmaße?, in: Kai-arzheimer.com, o.D., [online] https://www.kai-arzheimer.com/Lehre-ESF/Kurs/Zusammenhangsmasse-1/Zusammenhangsmasse-1.pdf (abgerufen am 24.01.2023)

3Bookdown.org: Zusammenhangsmaße, in: Bookdown.org, o.D., [online] https://bookdown.org/lechnerlima/notes/zusammenhangsma%C3%9Fe.html (abgerufen am 24.01.2023)

4Universität Würzburg: Deskriptive Statistik, in: rz.uni-wuerzburg.de, o.D., [online] https://www.rz.uni-wuerzburg.de/fileadmin/10040800/_temp_/kapsoz_2.pdf (abgerufen am 24.01.2023)

5Pearson K.: On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling, in: The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science Volume 50, 1900, [online] https://www.tandfonline.com/doi/abs/10.1080/14786440009463897 (abgerufen am 24.01.2023)

6Statologie.de: Chi-Quadrat-Unabhängigkeitstest, in: Statologie.de, 25.08.2020, [online] https://statologie.de/chi-quadrat-unabhaengigkeitstest/#:~:text=X%202%20%3D%20%CE%A3%20(OE),O%3A%20beobachteter%20Wert (abgerufen am 24.01.2023)

7Universität Köln: Cramers V, in: Eswf.uni-koeln.de, 01.10.2001, [online] http://eswf.uni-koeln.de/glossar/node97.html (abgerufen am 24.01.2023)

8Heller D. et al.: Kontingenzkoeffizient, in: Statistik.econ.kit.edu, o.D., [online] https://statistik.econ.kit.edu/download/Deskriptive9.pdf (abgerufen am 24.01.2023)

9Ibm.com: Messniveau einer Variablen, in: Ibm.com, 22.03.2021, [online] https://www.ibm.com/docs/de/spss-statistics/25.0.0?topic=view-variable-measurement-level (abgerufen am 24.01.2023)

10Timischt W.: Angewandte Statistik. Eine Einführung für Biologen und Mediziner, in: Books.google.de, 2013, [online] https://books.google.de/books?hl=de&lr=&id=NNUiBgAAQBAJ&oi=fnd&pg=PA2&dq=Werner+Timischl:+Angewandte+Statistik.+Eine+Einf%C3%BChrung+f%C3%BCr+Biologen+und+Mediziner.&ots=fxNmIksyg6&sig=dAfJQWUc0g8NkjCvlB02fvQnGbQ#v=onepage&q=Werner%20Timischl%3A%20Angewandte%20Statistik.%20Eine%20Einf%C3%BChrung%20f%C3%BCr%20Biologen%20und%20Mediziner.&f=false (abgerufen am 24.01.2023)

11Statista: Definition Metrisch, in: De.statista.com, o.D., [online] https://de.statista.com/statistik/lexikon/definition/89/metrisch/#:~:text=Als%20metrische%20Werte%20werden%20numerische,wie%20zwischen%2087%20und%2088. (abgerufen am 24.01.2023)

12Diaz-Bone R.: Statistik für Soziologen, in: Utb.de, 25.03.2019, [online] https://www.utb.de/doi/book/10.36198/9783838552101 (abgerufen am 24.01.2023)

13Universität Tübingen: Statistik, in: Homepages.uni-tuebingen.de, o.D., [online] https://homepages.uni-tuebingen.de/stefan.klotz/seiten/Statistik/StatistikKorrelation.pdf (abgerufen am 24.01.2023)