Inhaltsverzeichnis
- 1 Zusammenhangsmaße „einfach erklärt“
- 2 Definition: Zusammenhangsmaße
- 3 Relevanz der Zusammenhangsmaße
- 4 Zusammenhangsmaße richtig anwenden
- 5 Zusammenhangsmaße bei nominalen Daten
- 6 Zusammenhangsmaße bei ordinalen Daten
- 7 Zusammenhangsmaße bei metrischen Daten
- 8 Übersicht der Zusammenhangsmaße
- 9 Häufig gestellte Fragen
- 10 Quellen
Um Daten in deiner wissenschaftlichen Arbeit auswerten zu können, ist es relevant zu wissen, wie diese korrelieren. Zusammenhangsmaße verstehen und berechnen zu können ist hierfür notwendig, um mehrere Variablen in einen Kontext bringen zu können.
In diesem Beitrag erhältst du einen Überblick über die Zusammenhangsmaße, deren Formeln und Beispiele für ihre Anwendung.
Definition: Zusammenhangsmaße
Zusammenhangsmaße sind Größen, die angeben, wie stark der Zusammenhang zwischen zwei Variablen ist. Es existieren in der Statistik unterschiedliche Zusammenhangsmaße, die jeweils für ein bestimmtes oder für bestimmte Skalenniveaus geeignet sind. Liegen dir metrische Daten vor, dann kannst du unter anderem den Korrelationskoeffizienten nach Pearson verwenden. Für nominale Daten ist Chi-Quadrat eines der im Studium am häufigsten angewandten Zusammenhangsmaße.2
Relevanz der Zusammenhangsmaße
Zusammenhangsmaße verwendest du, um Abhängigkeiten zwischen den Variablen deiner empirischen Daten zu erkennen. Beispielsweise untersuchst du, ob die Wahrscheinlichkeit für das Auftreten der Krankheit X vom Alter der Menschen abhängig ist. Du erkennst Einflussfaktoren auf die von dir definierten Variablen. Zunächst stellst du Hypothesen auf, die du mittels der Zusammenhangsmaße untersuchst.3
In der Wissenschaft werden Zusammenhangsmaße für statistische Auswertungen verwendet. Im Studium ist die Anwendung vor allem im Rahmen von Hausarbeiten und Abschlussarbeiten notwendig. Entscheidest du dich für eine empirische Untersuchung im praktischen Teil der Bachelorarbeit oder der Masterarbeit und fokussierst du dich dabei auf quantitative Forschungsmethoden, dann wendest du statistische Methoden an. Du wertest die Datensätze zunächst mittels deskriptiver Statistiken – wie dem Mittelwert und der Häufigkeitsverteilung – aus. Anschließend nutzt du die Daten zur Überprüfung von Hypothesen – beispielsweise dem Ermitteln von Einflussfaktoren auf Beobachtungen.
Empirische Studien, die auf statistische Methoden zurückgreifen, finden unter anderem in folgenden Studiengängen statt:
- Wirtschaftswissenschaften
- Psychologie
- Medizin
- Sozialwissenschaften
- Pädagogik
Die Ergebnisse der empirischen Studien dienen der Erkenntnisgewinnung für die zugehörigen Professionen und sind daher für Theorie und Praxis von Belangen.
Zusammenhangsmaße richtig anwenden
In diesem Abschnitt erfährst du, wie du Zusammenhangsmaße richtig anwendest. Du lernst, unter welchen Bedingungen du welche Zusammenhangsmaße einsetzen kannst und auf welche Aspekte du bei der Anwendung achten musst.
Im ersten Schritt überprüfst du, welches Skalenniveau die Daten aufweisen. Für jedes Skalenniveau stehen bestimmte Zusammenhangsmaße zur Auswahl, die du nutzen kannst. Wähle das passende Zusammenhangsmaß aus und folge dem Algorithmus des betreffenden Maßes.
Zusammenhangsmaße bei nominalen Daten
Ein nominal skaliertes Merkmal weist unterscheidbare Ausprägungen auf, die jedoch in keine natürliche Ordnung gebracht werden können. Ein Beispiel ist das Merkmal „Farbe“ mit den Ausprägungen „Rot“, „Blau“ und „Gelb“. Die Merkmale sind eindeutig unterscheidbar, allerdings ist keine Farbe höher oder niedriger als eine andere Farbe. Werden Zusammenhangsmaße bei nominal skalierten Daten bestimmt, dann berechnest du die Häufigkeiten für die einzelnen Ausprägungen und die Kombination aus den verschiedenen Ausprägungen. 4
Chi-Quadrat
Mittels des Chi-Quadrat-Unabhängigkeitstests überprüfst du die Unabhängigkeit zweier Merkmale. Es handelt sich um einen Hypothesentest der stochastischen Mathematik. Für die Durchführung des Chi-Quadrat-Tests berechnest du den Chi-Quadrat-Wert. Du stellst wie oben beschrieben die Kontingenztafel auf und führst den Signifikanztest durch. Das Ergebnis beantwortet die Frage, ob die beiden Variablen signifikant unabhängig voneinander sind.
Die Nullhypothese lautet:
H0: Die beiden Variablen sind stochastisch unabhängig voneinander.
Wird die Nullhypothese abgelehnt, dann ist Abhängigkeit anzunehmen. 5
Die Formel zur Berechnung von Chi-Quadrat lautet:6
X² = Σ (OE) 2 / E.
In der vereinfachten Formel sieht die Formel so aus:
X² = Summe ((beobachtete Häufigkeit – erwartete Häufigkeit)² : erwartete Häufigkeit)
Für jedes Feld der Kontingenztafel existiert ein erwarteter Häufigkeitswert. Die einzelnen Summanden berechnen den relativen Wert der quadratischen Abweichung von beobachteter und erwarteter Häufigkeit. In der ersten Formel sorgen die beiden Summenzeichen dafür, dass für jedes Feld der Kontingenztafel diese relative quadratische Abweichung bestimmt wird.
Im Rahmen des Chi-Quadrat-Tests überprüfst du, ob der berechnete X²-Wert größer oder kleiner dem aus der Chi-Quadrat-Tabelle abgelesenem Wert ist. Ist X² größer als der kritische Wert der Testprüfgröße, dann wird die Hypothese bei Vorliegen von Signifikanz abgelehnt.
Cramers V
Cramers V ist ein Zusammenhangsmaß für nominalskalierte Variablen. Der Wert liegt stets zwischen 0 und 1. Je dichter der Wert an 1 liegt, desto stärker ist der Zusammenhang zwischen den beiden Variablen. Die folgende Übersicht dient als Orientierung zur Interpretation des Cramers V:
- 0 bis 0,2: Schwacher Zusammenhang
- 0,2 bis 0,6: Mittlerer Zusammenhang
- 0,6 bis 1: Starker Zusammenhang
Die Berechnung des Cramers V erfolgt ausgehend vom Chi Quadrat Wert mit der Formel:
V = sqrt(X² / (N * n(k-1; m-1))
- mit V als Cramers V
- N als Stichprobenumfang
- k als Anzahl der Zeilen und m als Anzahl der Spalten.7
Kontingenzkoeffizient
Der Kontingenzkoeffizient nach Pearson gehört der Gruppe der Zusammenhangsmaße an. Er drückt die Stärke des Zusammenhangs zweier Variablen aus. Anwendbar ist der Kontingenzkoeffizient bei nominalen und ordinalen Merkmalen. Berechnungsgrundlage ist der Vergleich zwischen den beobachteten Häufigkeiten zweier Merkmale und den Häufigkeiten, welche bei Unabhängigkeit der Merkmale erwartet hätte dürfen. Die quadratische Kontingenz stimmt in ihrer Berechnung mit X² überein.
Sie wird für den Chi-Quadrat-Test genutzt. Der Kontingenzkoeffizient nach Karl Pearson bildet X² auf das Intervall [0;1] ab. Die Umrechnung erfolgt über die Formel:
C = sqrt(X² / (X² + n)
mit C als Kontingenzkoeffizienten nach Pearson, X² als Chi Quadrat und n als Stichprobenumfang. 8
Beispiel für ein nominales Skalenniveau
Für das oben beschriebene Beispiel der Frage nach dem Zusammenhang zwischen der Sportart und dem Geschlecht wurde bereits die Kontingenztafel aufgestellt. Als Zusammenhangsmaß berechne ich X² mit Hilfe der Formel:
X² = Summe ((beobachtete Häufigkeit – erwartete Häufigkeit)² : erwartete Häufigkeit)
Die erwarteten Häufigkeiten werden für die einzelnen Felder nach folgendem Schema bestimmt:
nkj = nj * nk / n
mit nj als Zeilenhäufigkeitssumme und nk als Spaltenhäufigkeitssumme. Für die einzelnen Zellen werden die Quotienten bestimmt, die anschließend zum X²-Wert aufsummiert werden.
Zusammenhangsmaße bei ordinalen Daten
Ordinale Daten weisen eine natürliche Reihenfolge auf. Es ist eindeutig ersichtbar, in welcher Reihenfolge sich die Daten befinden. Ein Beispiel ist die Messung der Zufriedenheit. Die Befragten einer Umfrage geben an, ob sie nicht zufrieden, zufrieden oder sehr zufrieden sind. Die Antworten lassen sich sortieren.9
Rangkorrelationskoeffizient
Rangkorrelationskoeffizienten sind Zusammenhangsmaße, die die Korrelation zwischen zwei Variablen angeben. Die bekanntesten diesbezüglichen Zusammenhangsmaße sind der Spearman’sche Rangkorrelationskoeffizienten (Spearman’sches Rho) und der Kendall’sche Rangkorrelationskoeffizienten (Kendall’sches Tau).
Den empirischen Spearman’schen Rangkorrelationskoeffizient berechnest du über folgende Formel:10
r = Stichprobenkovarianz von R(x) und R(y) / (Standardabweichung der Ränge von x * Standardabweichung der Ränge von y)
Zusammenhangsmaße bei metrischen Daten
Intervallskalierte Merkmale gelten als metrische Daten. Der Abstand zwischen ganzzahligen Werten ist immer gleichgroß.11
Kovarianz
Die Kovarianz ist gehört der Kategorie der nichtstandardisierten Zusammenhangsmaße an. Aus dem Ergebnis liest du ab, ob hohe Werte tendenziell mit hohen oder niedrigen Werten der jeweils anderen Variable assoziiert sind. Die Formel für die Kovarianz lautet:
COV (X,Y) = E [(X – E(X)) * (Y- E(Y))]
mit E(X) als Erwartungswert von X und E(Y) als Erwartungswert von Y. Die Berechnung der Erwartungswerte erfolgt in der Statistik als Abweichung vom arithmetischen Mittelwert.12
Korrelationskoeffizient nach Pearson (r)
Der Korrelationskoeffizient gibt den Grad des linearen Zusammenhangs wieder. Sein Betrag liegt zwischen 0 und 1, wobei 1 den größten Zusammenhang darstellt. Ein negativer Wert weist auf eine fallende Regressionsgerade hin, ein positiver Wert zeigt eine steigende Regressionsgerade an.
Die Berechnung erfolgt nach folgender Formel:
Übersicht der Zusammenhangsmaße
Skalenniveau: Nominal
Zusammenhangsmaße: Chi-Quadrat, Cramer`s V, Kontingenzkoeffizient
Skalenniveau: Ordinal
Zusammenhangsmaße: Rangkorrelationskoeffizient
Skalenniveau: Metrisch
Zusammenhangsmaße: Kovarianz, Korrelationskoeffizient nach Pearson (r)
Häufig gestellte Fragen
Zusammenhangsmaße geben an, ob und wie stark zwei Variablen miteinander assoziiert sind.
Für die einzelnen Zusammenhangsmaße stehen Formeln zur Verfügung, die für die manuelle Berechnung genutzt werden. Programme wie SPSS bieten Funktionen zur einfachen Berechnung der Zusammenhangsmaße an.
Zusammenhangsmaße sind jeweils für bestimmte Skalenniveaus geeignet.
Einige Zusammenhangsmaße geben die Richtung und die Stärke des Zusammenhangs an.
Hängt Variable y von Variable x ab, dann verändert sich y wenn sich x verändert.
Quellen
1Scholz F.: Assoziationsmaß, in: Spektrum.de, 2023, [online] https://www.spektrum.de/lexikon/mathematik/assoziationsmass/303 (abgerufen am 24.01.2023)
2Arzheimer K.: Was sind Zusammenhangsmaße?, in: Kai-arzheimer.com, o.D., [online] https://www.kai-arzheimer.com/Lehre-ESF/Kurs/Zusammenhangsmasse-1/Zusammenhangsmasse-1.pdf (abgerufen am 24.01.2023)
3Bookdown.org: Zusammenhangsmaße, in: Bookdown.org, o.D., [online] https://bookdown.org/lechnerlima/notes/zusammenhangsma%C3%9Fe.html (abgerufen am 24.01.2023)
4Universität Würzburg: Deskriptive Statistik, in: rz.uni-wuerzburg.de, o.D., [online] https://www.rz.uni-wuerzburg.de/fileadmin/10040800/_temp_/kapsoz_2.pdf (abgerufen am 24.01.2023)
5Pearson K.: On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling, in: The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science Volume 50, 1900, [online] https://www.tandfonline.com/doi/abs/10.1080/14786440009463897 (abgerufen am 24.01.2023)
6Statologie.de: Chi-Quadrat-Unabhängigkeitstest, in: Statologie.de, 25.08.2020, [online] https://statologie.de/chi-quadrat-unabhaengigkeitstest/#:~:text=X%202%20%3D%20%CE%A3%20(OE),O%3A%20beobachteter%20Wert (abgerufen am 24.01.2023)
7Universität Köln: Cramers V, in: Eswf.uni-koeln.de, 01.10.2001, [online] http://eswf.uni-koeln.de/glossar/node97.html (abgerufen am 24.01.2023)
8Heller D. et al.: Kontingenzkoeffizient, in: Statistik.econ.kit.edu, o.D., [online] https://statistik.econ.kit.edu/download/Deskriptive9.pdf (abgerufen am 24.01.2023)
9Ibm.com: Messniveau einer Variablen, in: Ibm.com, 22.03.2021, [online] https://www.ibm.com/docs/de/spss-statistics/25.0.0?topic=view-variable-measurement-level (abgerufen am 24.01.2023)
10Timischt W.: Angewandte Statistik. Eine Einführung für Biologen und Mediziner, in: Books.google.de, 2013, [online] https://books.google.de/books?hl=de&lr=&id=NNUiBgAAQBAJ&oi=fnd&pg=PA2&dq=Werner+Timischl:+Angewandte+Statistik.+Eine+Einf%C3%BChrung+f%C3%BCr+Biologen+und+Mediziner.&ots=fxNmIksyg6&sig=dAfJQWUc0g8NkjCvlB02fvQnGbQ#v=onepage&q=Werner%20Timischl%3A%20Angewandte%20Statistik.%20Eine%20Einf%C3%BChrung%20f%C3%BCr%20Biologen%20und%20Mediziner.&f=false (abgerufen am 24.01.2023)
11Statista: Definition Metrisch, in: De.statista.com, o.D., [online] https://de.statista.com/statistik/lexikon/definition/89/metrisch/#:~:text=Als%20metrische%20Werte%20werden%20numerische,wie%20zwischen%2087%20und%2088. (abgerufen am 24.01.2023)
12Diaz-Bone R.: Statistik für Soziologen, in: Utb.de, 25.03.2019, [online] https://www.utb.de/doi/book/10.36198/9783838552101 (abgerufen am 24.01.2023)
13Universität Tübingen: Statistik, in: Homepages.uni-tuebingen.de, o.D., [online] https://homepages.uni-tuebingen.de/stefan.klotz/seiten/Statistik/StatistikKorrelation.pdf (abgerufen am 24.01.2023)