Inhaltsverzeichnis
- 1 Statistik „einfach erklärt“
- 2 Definition: Statistik
- 3 Relevanz und Notwendigkeit
- 4 Statistische Methoden im Überblick
- 5 Deskriptive Statistik vs. Inferenzstatistik
- 6 Annahmen in der Statistik
- 7 Statistik: Hypothesentest und Nullhypothese
- 8 Signifikanzniveau in der Statistik
- 9 Skalenniveaus in der Statistik
- 10 Statistik: Lageparameter
- 11 Statistik: Streuungsmaße
- 12 Statistik: Zusammenhangsmaße
- 13 Weitere Statistik-Methoden
- 14 Ergebnisse aus der Statistik richtig formulieren
- 15 Tipps für die Statistik Klausur
- 16 Häufig gestellte Fragen
- 17 Quellen
Statistik wird an manchen Universitäten als eigenständiges Studienfach angeboten1, stellt aber darüber hinaus in zahlreichen Studiengängen ein Teilgebiet des Curriculums dar. Über die unterschiedlichsten Fachgebiete hinweg gilt die Vertrautheit mit statistischen Verfahren als wichtige Qualifikation2. In diesem Artikel geben wir dir einen ersten Einblick in die Bedeutung der Statistik für dein Studium.
Definition: Statistik
Eine mögliche Definition von Statistik (früher auch Sammelforschung genannt3) lautet wie folgt: methodisch-quantitative Methoden zur Einordnung und Auswertung empirischer Werte und Daten. Solange mit Zahlen und respektiven Bewertungen gearbeitet wird, sind die Einsatzmöglichkeiten von statistischen Verfahren nahezu universell und erstrecken sich auf die unterschiedlichsten Bereiche (Natur-, Sozial- und Geisteswissenschaften, Technik, Medizin, Politik, Wirtschaft usw.)4. Schwerpunktmäßig sind vor allem die Bereiche Medizin, Biometrie sowie Ökonomie/Ökonometrie zu nennen, ferner auch Psychologie, Soziologie sowie viele weitere Fachgebiete2.
Vereinfacht gesagt meint Statistik die Gesamtheit aller Methoden zur Darstellung und Analyse quantitativer empirischer Daten3;5. Unabhängig vom konkreten Fachgebiet ist es also recht wahrscheinlich, dass du in deinem Studium mit diesem Thema in Berührung kommen wirst.
Relevanz und Notwendigkeit
Für Studenten sind statistische Verfahren bei der Durchführung empirisch ausgerichteter Arbeiten häufig unverzichtbar. Doch auch auf einer alltäglich-allgemeineren Ebene sind sie stark präsent (etwa in Form amtlicher Statistiken6).
Die umfassende Bedeutung der Statistik ergibt sich aus ihrer Brückenfunktion zwischen Theorie und Empirie. Sie fungiert als Hilfswissenschaft aller empirischen oder naturwissenschaftlichen Disziplinen (Medizin/medizinische Statistik; Psychologie/Psychometrie; Biologie/Biometrie usw.). Da die Menge an verfügbaren Daten rundum rasch zunimmt, wird der Stellenwert der Statistik zunehmend relevanter.3
Als wichtigste Ziele statistischer Methoden lassen sich die Entdeckung möglicher Zusammenhänge und die Überprüfung bestehender theoretischer Annahmen nennen7. Sie werden entweder zur unmittelbaren Beschreibung einer vollständigen Grundgesamtheit (Beispiel: Gesamtbevölkerung) angewendet oder um induktive Rückschlüsse auf Basis einer Teilmenge (Stichprobe) zu ziehen4.
Statistische Methoden im Überblick
Welche statistischen Verfahren du im Einzelfall anwenden solltest, hängt unter anderem von Fragestellung und Datenmaterial ab8. Grundsätzlich lässt sich zwischen statistischen Darstellungsverfahren, Kennwerten und Prüfverfahren unterscheiden7. Im Folgenden haben wir die gängigsten statistischen Techniken und Methoden für dich aufgelistet:
- darstellbare Mittel (Kreuztabellen, Grafiken)6
- Deskriptive Statistik und Inferenzstatistik
- Annahmen in der Statistik
- Hypothesentests
- Skalenniveaus9
- Verteilungsparameter (Lage- und Streuungsparameter)10
- Zusammenhangsmaße (Korrelationskoeffizient, Regressionsanalyse, Pearson Chi-Quadrat)11
- weitere statistische Tests (Korrelationsanalyse, Regressionsanalyse12, Faktoranalyse13 )
Deskriptive Statistik vs. Inferenzstatistik
Im Folgenden wollen wir dir einerseits die Inhalte der deskriptiven Statistik und andererseits die der Inferenzstatistik erläutern.
Deskriptive statistische Verfahren dienen der übersichtlichen Zusammenfassung und Aufbereitung von Daten auf der Basis von aussagekräftigen Kriterien (unter Verwendung von Häufigkeitstabellen, Kenngrößen usw.). Die Inferenzstatistik hingegen will Rückschlüsse von der Stichprobe auf die Grundgesamtheit ermöglichen (insbesondere durch Hypothesentests).7 14
Deskriptive Statistik
Durch die Methoden der deskriptiven Statistik lassen sich Daten beschreiben, nämlich in Form von Kennwerten, die sich auf Variablen (zum Beispiel Alter) beziehen6 15. Es können allerdings nur Aussagen zur Stichprobe beziehungsweise zum Datensatz getroffen werden (keine Rückschlüsse auf die Grundgesamtheit!)16. Folgende Verfahren sind der Deskriptivstatistik zuzurechnen14:
- Modalwert (Modus)
- Median
- arithmetisches Mittel (Durchschnitt)
- Varianz
- Standardabweichung
- Korrelationskoeffizient
Inferenzstatistik
Die Inferenzstatistik verfolgt das Ziel aus stichprobenbezogenen Kennwerten auf die Verhältnisse in der Grundgesamtheit zu schließen17. Somit steht die Inferenzstatistik im Gegensatz zur deskriptiven Statistik. Die Inferenzstatistik basiert auf der Wahrscheinlichkeitsrechnung4und bedient sich verschiedener Verfahren: der Parameterschätzung als auch der Hypothesenprüfung6:
- Punktschätzung
- Intervallschätzung (auch Konfidenzschätzung18)
- Hypothesentest (zum Beispiel durch T-Test, Varianzanalyse, Regressionsanalyse usw.)
Annahmen in der Statistik
Als Annahmen bezeichnet man einerseits Hypothesen in Bezug auf Grundgesamtheiten19, andererseits aber auch bestimmte Voraussetzungen, die vor der Durchführung eines statistischen Tests geprüft werden müssen, um eine sinnvolle Interpretation zu ermöglichen20. Derartige Voraussetzungen existieren für die meisten dieser Verfahren20, darunter:
- T-Test20
- lineare Regression21
- Varianzanalyse22
Statistik: Hypothesentest und Nullhypothese
Statistische Hypothesentests werden durchgeführt, um die Gültigkeit einer Hypothese zu überprüfen23.
Zu diesem Zweck formuliert man zunächst ein Hypothesenpaar, bestehend aus einer Alternativhypothese (vermuteter Effekt) sowie Nullhypothese (kein Effekt). Ein signifikantes Testergebnis erlaubt es dir, die Nullhypothese zu verwerfen und die Alternative abzüglich einer verbleibenden Irrtumswahrscheinlichkeit zu bestätigen. In diesem Zusammenhang wirst du auch auf die Begriffe „beidseitige“ und „einseitige“ Hypothesentests stoßen: Der Unterschied liegt darin, dass ein einseitiger Hypothesentest davon ausgeht, dass eine Abweichung von der Nullhypothese nur in eine Richtung möglich ist (besser/schlechter, positiv/negativ usw.).24
Signifikanzniveau in der Statistik
Mit dem Signifikanzniveau bezeichnet man das Ausmaß der Wahrscheinlichkeit, mit der die Nullhypothese im Rahmen eines Hypothesentests ungerechtfertigterweise verworfen wird. Das Signifikanzniveau wird in Prozent ausgedrückt (zum Beispiel 10 %, 5 %, 1 %) – je niedriger es angesetzt wird, desto deutlicher müssen die Ergebnisse ausfallen, um die Nullhypothese zu widerlegen. In statistischen Computerprogrammen wird die Signifikanz häufig durch den sogenannten P-Wert angezeigt.25
Skalenniveaus in der Statistik
Skalen ermöglichen die Zuordnung von Zahlen zu bestimmten Ereignissen oder Merkmalen und können auf unterschiedlichen Niveaus angesiedelt sein. Diese Skalenniveaus unterscheiden sich wiederum durch Zuordnungsregeln, qualitative oder quantitative Beschaffenheit sowie Informationsgehalt. Man unterscheidet in aufsteigender Reihenfolge die Nominal-, Ordinal-, Intervall- sowie Verhältnisskala. Je nachdem, wie Daten skaliert sind, kommen unterschiedliche Analyseverfahren in Frage.9
Skalenniveau | Merkmale | Beispiel |
Nominalskala | Häufigkeit der Merkmale | Augenfarbe |
Ordinalskala | Häufigkeit und Rangfolge der Merkmale | Schulnoten |
Intervallskala | Häufigkeit, Rangfolge und Abstand der Merkmale | Temperatur in Celsius |
Verhältnisskala | Häufigkeit, Rangfolge und Abstand der Merkmale + natürlicher Nullpunkt | Alter |
Statistik: Lageparameter
Lageparameter zählen zu den statistischen Kenngrößen und umfassen folgende Elemente10:
- arithmetisches Mittel
- Median
- Modus
Lageparameter dienen zur möglichst repräsentativen Charakterisierung einer Verteilung im Hinblick auf ein bestimmtes Merkmal durch einen einzigen Wert. Als bekanntestes Beispiel darf der Mittelwert gelten (dieser entspricht dem arithmetischen Mittel). Durch den Median lässt sich die Verteilung eines Merkmals in zwei gleich große Hälften (50/50) teilen. Der Modus gibt jenen Wert an, der in der Verteilung am häufigsten vorkommt.10
Ebenfalls von Bedeutung ist in diesem Kontext der Standardfehler: Durch ihn wird die Streuung von Kennwerten zwischen verschiedenen gleich großen Stichproben aus derselben Population angegeben.26
Statistik: Streuungsmaße
Auch die Streuungsmaße zählen du den statistischen Kenngrößen; sie umfassen die folgenden Elemente10:
- Varianz
- Standardabweichung
- Spannweite
- Quantile
- Quartile
- Quartilsabstand
Durch Streuungsmaße kannst du nachvollziehen, wie sehr die einzelnen Messergebnisse um den Mittelwert streuen (Variabilität). Während die Varianz in der Praxis eher selten herangezogen wird, gilt die Standardabweichung als weitaus gebräuchlicher: Ein kleiner Wert zeugt von einer eng an den Mittelwert angelehnten Streuung, ein hoher von starken Abweichungen. Die Spannbreite ergibt sich aus den beiden Extremwerten einer Verteilung.10
Statistik: Zusammenhangsmaße
Zusammenhangsmaße dienen der Analyse von Zusammenhängen zwischen zwei oder mehreren Variablen12. Man unterscheidet unter anderem folgende Varianten12:
- Korrelationskoeffizient r nach Pearson
- einfache lineare Regression
- Rangkorrelationskoeffizient rs nach Spearman
- Pearson Chi-Quadrat-Test (Koeffizienten Phi, Kontingenzkoeffizient und Cramers V)
- multiple Regression
- logistische Regression
Je nach Skalenniveau und Anzahl der Variablen kommen verschiedene Verfahren und Zusammenhangsmaße in Frage. Der Pearson Chi-Quadrat-Test kann zum Beispiel eingesetzt werden, wenn die betreffenden Variablen nominal- bis ordinalskaliert sind. Hierbei lassen sich verschiedene Koeffizienten berechnen, wobei Cramers V am häufigsten vorkommt (als Alternativen stehen Phi und der Kontingenzkoeffizient zur Verfügung). Als bekanntestes Zusammenhangsmaß darf wohl der Korrelationskoeffizient r nach Pearson gelten, welcher der standardisierten Kovarianz entspricht.12
Weitere Statistik-Methoden
Abseits der bereits genannten Beispiele gibt es zahlreiche weitere wichtige Statistik-Begriffe und -methoden, auf die auch im Studium häufig Bezug genommen wird:
- T-Test
- Bei Untersuchungen auf Mittelwertunterschiede kannst du den T-Test zur Anwendung bringen.11 Konkret geht es darum, ob diese Unterschiede zufälliger Natur oder statistisch signifikant sind27.
- Normalverteilung
- Bei Normalverteilungen handelt es sich um theoretische Verteilungen in Form der „Gauß’schen Glockenkurve“, die bei vielen Analyseverfahren als Voraussetzung vorliegen müssen. Durch Standardisierung können Normalverteilungen in eine Standardnormalverteilung umgewandelt werden, was für verschiedene Verfahren und Variablenvergleiche ebenfalls notwendig ist.28
- Standardnormalverteilung
- Die Standardnormalverteilung ist eine spezielle Art der Normalverteilung, bei der der Erwartungswert bei 0 liegt und die Standardabweichung bei 1.
- Cronbachs Alpha
- Cronbachs Alpha leistet dir gute Dienste als Reliabilitätsmaß, wenn du beispielsweise die interne Konsistenz einer Skala oder eines Tests überprüfen möchtest29.
- Regressionsanalyse
- Die Regressionsanalyse als Instrument der Statistik im Allgemeinen wird genutzt, um die Ausprägungen einer unabhängigen Variable (Y) mithilfe von abhängigen Variablen (X) vorherzusagen30.
- Anova (Varianzanalyse)
- Die Varianzanalyse (ANOVA) kommt anstelle des T-Tests zum Einsatz, wenn über mehr als zwei Stichproben hinweg Mittelwerte verglichen werden sollen.31
- Faktoranalyse
- Die Faktoranalyse dient dazu aus der Vielzahl an Variablen die latenten Variablen herauszuarbeiten.
Ergebnisse aus der Statistik richtig formulieren
Wenn du im Rahmen deines Studiums mit statistischen Verfahren arbeitest, gilt es diese nicht nur richtig einzusetzen, sondern die Ergebnisse auch in korrekter Form auszuformulieren. Spezifische Vorgaben existieren unter anderem für die Verwendung von Zeichen, die Angabe von Zahlen oder die Ausformulierung von Kennwerten. Hierbei kannst du dich beispielsweise an den geltenden APA-Richtlinien orientieren32.
Tipps für die Statistik Klausur
Statistikklausuren sorgen unter Studenten für gemischte Gefühle – manch einer tut sich mit dem Format schwer, andere wiederum sehen darin ein persönliches Steckenpferd. Unabhängig von deiner persönlichen Affinität zur Materie ist mit sorgfältiger Vorbereitung viel gewonnen. Hierzu wollen wir dir abschließend einige Ratschläge mitgeben:
- recherchiere im Internet nach Altklausuren33;34 deiner Universität und übe mit diesen
- lerne statistische Formeln nicht nur auswendig, sondern stelle sicher, dass du auch sattelfest bei der Anwendung bist
- mach dich mit den wichtigsten Grundbegriffen vertraut (Mittelwert, Verteilung, Streuung usw.)
- tausche dich mit anderen Prüfungskandidaten aus und gründe Lerngruppen
Häufig gestellte Fragen
Unter Statistik versteht man das wissenschaftliche Vorgehen zur zahlenmäßigen Erfassung, Untersuchung und Auswertung von Daten. Außerdem werden auch die Ergebnisse statistischer Analysen mit diesem Begriff bezeichnet.4
Das Einsatzgebiet von statistischen Verfahren ist universell. Sie werden beispielsweise im Rahmen von empirischen Erhebungen, Experimenten oder mathematischen Forschungen durchgeführt.2
Auch in dieser Hinsicht gilt: Statistik kann universell eingesetzt werden. In welchen Fachgebieten sie eine besonders prominente Rolle einnimmt, erfährst du im Beitrag.
Bei statistischen Verfahren handelt es sich um methodische Instrumente quantitativer Natur, die zum Zwecke des empirischen Erkenntnisgewinns auf Massenphänomene angewandt werden.4
Im Gegenteil: Statistische Verfahren haben sich längst auch abseits der Mathematik und der Naturwissenschaft als Bestandteil des methodischen Repertoires etabliert (Details im Beitrag).
Quellen
1 Universität Wien: Statistik (Bachelor), in: Universität Wien, o.D., [online] https://studieren.univie.ac.at/studienangebot/bachelor-und-diplomstudien/statistik-bachelor/ (abgerufen am 10.08.2022)
2 Universität Bielefeld: Zentrum für Statistik, in: Universität Bielefeld, o.D., [online] https://www.uni-bielefeld.de/einrichtungen/zest/ (abgerufen am 10.08.2022)
3 DBpedia: About: Statistik, in: DBpedia.de, o.D., [online] http://de.dbpedia.org/page/Statistik (abgerufen am 10.08.2022)
4 Kamps, Udo: Statistik, in: Gabler Wirtschaftslexikon, o.D., [online] https://wirtschaftslexikon.gabler.de/definition/statistik-45267 (abgerufen am 10.08.2022)
5 Döring, Nicola: Statistik, in: Dorsch Lexikon der Psychologie, 05.05.2019, [online] https://dorsch.hogrefe.com/stichwort/statistik (abgerufen am 10.08.2022)
6 Duden: Statistik, in: Duden, o.D., [online] https://www.duden.de/rechtschreibung/Statistik (abgerufen am 10.08.2022)
7 Bedenbecker, Christoph: Forschungsmethodik: Grundbegriffe der Statistik, in: Universität Innsbruck, 2004, [online] https://www.uibk.ac.at/iezw/mitarbeiterinnen/senior-lecturer/bernd_lederer/downloads/forschungsmethodik_statistik_bedenbecker.pdf (abgerufen am 10.08.2022)
8 Universität Leipzig: Statistische Auswertung, in: Universität Leipzig Methodenportal, o.D., [online] https://home.uni-leipzig.de/methodenportal/statistische_auswertung/ (abgerufen am 10.08.2022)
9 Universität Leipzig: Skalenniveaus, in: Universität Leipzig Methodenportal, o.D., [online] https://home.uni-leipzig.de/methodenportal/skalenniveaus/ (abgerufen am 10.08.2022)
10 Universität Leipzig: Kenngrößen, in: Universität Leipzig Methodenportal, o.D., [online] https://home.uni-leipzig.de/methodenportal/deskriptive-statistik/ (abgerufen am 10.08.2022)
11 Universität Leipzig: Unterschiede, in: Universität Leipzig Methodenportal, o.D., [online] https://home.uni-leipzig.de/methodenportal/unterschiede-2/ (abgerufen am 10.08.2022)
12 Universität Leipzig: Zusammenhänge, in: Universität Leipzig Methodenportal, o.D., [online] https://home.uni-leipzig.de/methodenportal/zusammenhaenge/ (abgerufen am 10.08.2022)
13 Universität Leipzig: Faktoranalyse, in: Universität Leipzig Methodenportal, o.D., [online] https://home.uni-leipzig.de/methodenportal/faktoranalyse/ (abgerufen am 10.08.2022)
14 Lederer, Bernd: Quantitative Auswertungsmethoden, in: Universität Innsbruck, o.D., [online] https://www.uibk.ac.at/iezw/mitarbeiterinnen/senior-lecturer/bernd_lederer/downloads/quantitative-auswertungsmethoden_201412.pdf (abgerufen am 10.08.2022)
15 Häcker, Hartmut O.: Deskriptivstatistik, in: Dorsch Lexikon der Psychologie, 06.05.2019, [online] https://dorsch.hogrefe.com/stichwort/deskriptivstatistik (abgerufen am 10.08.2022)
16 Statista: Definition Deskriptive Statistik, in: Statista, o.D., [online] https://de.statista.com/statistik/lexikon/definition/49/deskriptive_statistik/#:~:text=Deskriptive%20statistische%20Parameter%20beschreiben%20bei,der%20induktiven%20Statistik%20zum%20Einsatz (abgerufen am 10.08.2022)
17 Dorsch: Inferenzstatistik, in: Dorsch Lexikon der Psychologie, 14.06.2016, [online] https://dorsch.hogrefe.com/stichwort/inferenzstatistik (abgerufen am 10.08.2022)
18 Kamps, Udo: Inferenzstatistik, in: Gabler Wirtschaftslexikon, o.D., [online] https://wirtschaftslexikon.gabler.de/definition/inferenzstatistik-40284 (abgerufen am 10.08.2022)
19 Technische Universität Wien: Statistische Tests, in: Technische Universität Wien, o.D., [online] http://www.algebra.tuwien.ac.at/tm/Stat_2.pdf (abgerufen am 10.08.2022)
20 StatistikGuru: Gepaarter t-Test in SPSS: Voraussetzungen und Annahmen, in: StatistikGuru, o.D., [online] https://statistikguru.de/spss/gepaarter-t-test/voraussetzungen-und-annahmen.html (abgerufen am 10.08.2022)
21 Technische Universität Dresden: Modellannahmen der linearen Regression, in: Technische Universität Dresden, o.D., [online] https://tu-dresden.de/gsw/phil/iso/mes/ressourcen/dateien/prof/lehre/Forschs/Referate/regression_R6.pdf?lang=de (abgerufen am 10.08.2022)
22 StatistikGuru: Einfaktorielle ANOVA: Voraussetzungen, in: StatistikGuru, o.D., [online] https://statistikguru.de/spss/einfaktorielle-anova/voraussetzungen-5.html (abgerufen am 10.08.2022)
23 Medistat: Statistischer Hypothesentest, in: Medistat Medizinische Statistik, o.D., [online] https://www.medistat.de/glossar/prinzip-statistischer-hypothesentests/statistischer-hypothesentest/ (abgerufen am 10.08.2022)
24 Medistat: Nullhypothese, in: Medistat Medizinische Statistik, o.D., [online] https://www.medistat.de/glossar/prinzip-statistischer-hypothesentests/nullhypothese/ (abgerufen am 10.08.2022)
25 Universität Köln: Signifikanzniveau (Irrtumswahrscheinlichkeit), in: Universität Köln, o.D., [online] http://eswf.uni-koeln.de/glossar/node151.html (abgerufen am 10.08.2022)
26 Bergmann, Bärbel: Standardfehler, in: Technische Universität Dresden, o.D., [online] https://versuch.file2.wcms.tu-dresden.de/w/index.php/Standardfehler#:~:text=Der%20Stichprobenfehler%20oder%20Standardfehler%20bezeichnet,einem%20gegebenen%20Stichprobenumfang%20sein%20k%C3%B6nnen (abgerufen am 10.08.2022)
27 Kappelhoff: T-Test, in: Bergische Universität Wuppertal, o.D., [online] https://temme.wiwi.uni-wuppertal.de/fileadmin/kappelhoff/Downloads/Vorlesung/t-test.pdf (abgerufen am 10.08.2022)
28 Universität Zürich: Deskriptive, univariate Analyse (Verteilungen), in: Universität Zürich, o.D., [online] https://www.methodenberatung.uzh.ch/de/datenanalyse_spss/deskuniv.html (abgerufen am 10.08.2022)
29 Hossiep, Rüdiger: Cronbachs Alpha, in: Dorsch Lexikon der Psychologie, 28.04.2021, [online] https://dorsch.hogrefe.com/stichwort/cronbachs-alpha (abgerufen am 10.08.2022)
30 Universität Köln: Regressionsanalyse, in: Universität Köln, o.D., [online] http://eswf.uni-koeln.de/glossar/node99.html (abgerufen am 10.08.2022)
31 Hain, Johannes: Varianzanalyse, in: Universität Wüzburg, o.D., [online] https://www.uni-wuerzburg.de/fileadmin/10040800/user_upload/hain/SPSS/ANOVA.pdf (abgerufen am 10.08.2022)
32 Schott, Nadja: Angabe statistischer Werte nach APA-Richtlinien, in: Universität Stuttgart, o.D., [online] https://www.inspo.uni-stuttgart.de/institut/aii/dokumente/Angabe_statistischer_Werte_und_Literatur.pdf (abgerufen am 10.08.2022)
33 Friedrich-Alexander-Universität Lehrstuhl für Statistik und Ökonometrie: Altklausuren zu Statistikgrundlagen, in: Friedrich-Alexander-Universität, o.D., [online] https://www.statistik.rw.fau.de/klausuren/ (abgerufen am 10.08.2022)
34 Martin-Luther-Universität Halle-Wittenberg: Statistik 1, in: Martin-Luther-Universität Halle-Wittenberg, 20.01.2022, [online] https://statistik.wiwi.uni-halle.de/lehre/203701_3339407/#anchor3339472 (abgerufen am 10.08.2022)