M24 Statistik 1: Wintersemester 23/24
Prof. Matthias Guggenmos
Health and Medical University Potsdam
Eine rätselhafte Erkrankung hat seit geraumer Zeit die Bundesrepublik Deutschland heimgesucht. Die Betroffenen zeigen ein paradoxes emotionales Verhalten: sie reagieren allem Anschein nach traurig auf fröhliche Ereignisse und fröhlich auf traurige Ereignisse – als wären zwei Hirndrähte vertauscht worden!
Aufgrund ihres Erscheinungsbilds wird die neuartige Krankheit Paradoxia genannt.
Noch ist wenig bekannt über die Erkrankung. Eine weitere Auffälligkeit ist, dass viele der Betroffenen eine Neigung haben, ihre Haare blau zu färben. Warum das so ist, ist unklar, auch wenn gemutmaßt wird, dass hierfür ein viral gegangenes Tik-Tok-Video einer Betroffenen verantwortlich ist.
Durch die rapide Verbreitung der Erkrankung sind das Bundeskanzleramt und die Geheimdienste alarmiert. Schnell wird der Beschluss gefasst, eine Task Force bestehend aus Psycholog:innen, Mediziner:innen und Sozialforscher:innen ins Leben zu rufen, um die Erkrankung besser zu verstehen.
Sie sind Teil dieser Task Force im Team Psychologie.
Ihre erste Aufgabe besteht darin, Hypothesen zu bilden, wie es zum Auftreten der Erkrankung gekommen sein könnte. Vermutet wird entweder ein sozialpsychologisches Ansteckungsphänomen oder eine neuartige Viruserkrankung, die das zentrale Nervensystem befällt.
Statistik für Psychologie | https://www.statistikpsychologie.de/blog/ | Einige nützliche Blogeinträge zu statistischen Themen der Psychologie |
DATAtab | https://datatab.de/tutorial/ | Online-Kalkulator mit einigen guten Tutorials |
StatistikGuru | https://statistikguru.de/ | Fokus auf SPSS und R, aber viele Tutorials in allgemeinem Stil geschrieben |
Statistics Supreme with JASP | https://www.youtube.com/@StatisticsSupreme | YouTube-Kanal zu JASP des Kollegen Thomas Langkamp (MSH) |
Statistik 1 Vorlesungen auf YouTube | https://www.youtube.com/playlist?list=PLu-U4gWcFfPxmKviyopGSmOY2EaKLVYxF | Prof. Jonas Obleser (Uni Lübeck) |
Trainex | ![]() |
Format: pdf | trainex25.de/hmu-trainex |
Webseite | ![]() |
Format: html & pdf | m-guggenmos.github.io oder cutt.ly/risch |
![]() |
Jürgen Bortz & Christof Schuster. Statistik für Human- und Sozialwissenschaftler. Springer, 7. Auflage (2010). | Standardwerk. Umfassend, gute Erklärungen, viele Übungen. |
![]() |
Thomas Schäfer. Methodenlehre und Statistik. Springer, 1. Auflage (2016). | Nah an der Vorlesung, Inhalte auf das Wesentliche heruntergebrochen. |
![]() |
Michael Eid, Mario Gollwitzer & Manfred Schmitt. Statistik und Forschungsmethoden. Beltz, 5. Auflage (2017). | Umfassend, vergleichsweise mathematisch, eher für Fortgeschrittene und weitergehend Interessierte. Enthält nützliche Übungen. |
![]() |
Ron Larson & Betsy Farber. Elementary Statistics: Picturing the World. Pearson, 7. Auflage (2019). | Unterhaltsamer intuitiver Stil, kurz & bündig, viele Übungen, auf Englisch! |
Das Wort Statistik stammt von lateinisch statisticum „den Staat betreffend“ und italienisch statista Staatsmann oder Politiker […]
Quelle: Wikipedia
In diesem Sinne beschrieb der Ausdruck Statistik ursprünglich die Lehre von den Daten über den Staat. Heute ist der Begriff wesentlich breiter gefasst:
Statistik ist ein angewandter Zweig der Mathematik, der sich mit der Erhebung, Analyse und Interpretation empirischer Daten befasst.
Erhebung | Wie groß sollte meine Stichprobe sein? |
Analyse | Was ist der Mittelwert meiner Variable? |
Interpretation | Unterscheiden sich zwei Gruppen systematisch? |
Auch ohne Statistik sind Menschen sehr gut darin, Muster oder Zusammenhänge in ihrer Umwelt zu erkennen. Man könnte diese Fähigkeit als intuitive Empirie bezeichnen. Wozu also Statistik?
Probleme intuitiver Empirie (kleiner Ausschnitt)
Ein neuentwickelter Coronatest wird damit beworben, dass er anhand einer Speichelprobe in 100% der Fälle eine bestehende Coronaerkrankung erkennt. Im Kleingedruckten findet sich der Hinweis, dass die Spezifität 90% beträgt, d.h. der Test weist in 10% der Fälle eine gesunde Person fälschlicherweise als krank aus.
Nehmen Sie an, die Prävalenz von Corona ist 1%, d.h. eine von hundert Personen ist mit Corona infiziert.
Schätzen Sie: Angenommen Ihr Test ist positiv, in wie viel Prozent der Fälle sind Sie dann auch tatsächlich positiv?
Auflösung:
Unsere empirische Intuition versagt in diesem Fall häufig. Im konkreten Beispiel spricht man auch vom Prävalenzfehler oder der Base rate fallacy.
Meditonsin ist das meistverkaufte homöopathische Erkältungsmittel in Deutschland, mit einem Jahresumsatz von deutlich über zwanzig Millionen Euro.
Jedenfalls entwickelte ein Chemieprofessor für Medice eine Apparatur, die alle Zutaten von Meditonsin bis heute in 250-Liter-Fässern vermischt und am Ende zehnmal kräftig in Richtung Erdmittelpunkt schüttelt.
Meditonsin enthält laut Beipackzettel Tollkirsche und Eisenhut in D5-Auflösung [0,00001%] sowie Quecksilber in D8-Auflösung [0,00000001%].
Quelle: Sueddetsche Zeitung 7
Woher kommt das große Vertrauten in ein Medikament, bei dem eine Flasche im Schnitt kaum ein Molekül der vorgeblichen Wirksubstanzen enthält?
Warum entsteht bei vielen Menschen subjektiv der Eindruck, Medikamente wie Meditonsin würden wirken?
Eine Erklärung ist mangelndes Bewusstsein für einen Effekt, der auch als Regression zur Mitte bezeichnet wird.
Statistische Methoden ermöglichen hier in Kombination mit einem adäquaten Studiendesign (Interventions- und Placebogruppe) eine objektivere Einschätzung.
Empfehlung: Quarks Science Podcast “Meditonsin, Umckaloabo, Grippostad: Die Akte Erkältungsmittel” 10
In Statistik 1 und 2 werden wir Methoden aus der deskriptiven Statistik und Inferenzstatistik behandeln.
Das Ziel der deskriptiven Statistik ist die Beschreibung und Zusammenfassung von Daten innerhalb einer Stichprobe.
Beispielfragen: Wie hoch ist der Mittelwert einer Variable in der Stichprobe? Wie hoch ist die Korrelation zwischen Variable X und Variable Y in der Stichprobe?
Das Ziel der Inferenzstatistik sind Schlussfolgerungen über eine Population auf der Grundlage von Stichproben.
Beispielfragen: Wie groß ist die durchschnittliche Körpergröße der Bevölkerung, basierend auf einer Stichprobe von 500 Personen? Gibt es einen signifikanten Unterschied im durchschnittlichen Einkommen zwischen zwei verschiedenen Berufsgruppen?
Ein alternativer Ausdruck für Inferenzstastistik ist Induktive Statistik.
Hypthesen: in Form einer logischen Aussage formulierte Annahme zur Erklärung empirischer Phänomene.
Beispiele
Eine wissenschaftliche Hypothese muss drei Grundvoraussetzungen erfüllen: Widerspruchsfreiheit, Widerlegbarkeit, Operationalisierbarkeit.
Beispiele
Beachte: Hypothese, die nicht widerspruchsfrei oder nicht operationalisierbar sind, sind auch nicht widerlegbar (die umgekehrte Aussage gilt nicht in allen Fällen).
Eine gute wissenschaftliche Hypothese erfüllt darüber hinaus weitere Kriterien:
Prädiktivität | Hypothesen sollten präzise Vorhersagen ermöglichen Negativbeispiel: Das Selbst ist in ein Es, Ich, Über-Ich aufgeteilt. Positivbeispiel: Eine tägliche morgendliche Meditationsübung verringert das subjektive und objektive Stresslevel. |
Spezifität | Hypothesen sollten spezifisch und konkret sein Negativbeispiel: Frühe Kindheitstraumata wirken sich nachteilig auf spätere Beziehungen aus. Positivbeispiel: Kindheitstraumata in einem vorsprachlichen Alter, verursacht durch wichtige Bezugspersonen, erhöhen die Wahrscheinlichkeit von Bindungsangst in engen romantischen Beziehungen. |
Sparsamkeit | Hypothesen sollten keine unnötige Komplexität beinhalten Negativbeispiel: Die Coronapandemie verstärkt das Gefühl der Vereinsamung in älteren Bevölkerungsschichten, falls diese an einem Dienstag befragt wurden. Positivbeispiel: Die Coronapandemie verstärkt das Gefühl der Vereinsamung in älteren Bevölkerungsschichten |
Relevanz | Hypothesen sollten von theoretischer oder gesellschaftlicher Relevanz sein Negativbeispiel: Menschen mit roten Autos bevorzugen rote Gemüsesorten. Positivbeispiel: Nach persönlichen Erfolgserlebnissen neigen Menschen zu riskantem Fahrverhalten. |
Ungerichtete Hypothesen geben keine Richtung des Effektes an:
Gerichtete Hypothesen geben die Richtung des Effektes an:
In der Psychologie sind Hypothesen in aller Regel nicht deterministisch, sondern probabilistisch, d.h. sie machen Aussagen über Wahrscheinlichkeiten und Mittelwerte.
Beispiel deterministische Hypothese: Menschen mit Alkoholabhängigkeit entwickeln eine Depression.
Beispiel probabilistische Hypothese: Menschen mit Alkoholabhängigkeit haben im Mittel eine höhere Ausprägung depressiver Symptome.
Ok, Task Force: wie lauten eure (Arbeits-)Hypothesen zu den Hintergründen von Paradoxia?
Hypothese 1: Die Blaufärbung der Haare ist ein reines Tik-Tok-Phänomen. Betroffene sollten daher mehr Zeit auf der Social-Media-Plattform TikTok verbringen als Nicht-Betroffene.
Hypothese 2: Paradoxia wird durch eine virale Infektion verursacht. Die Blutproben von Betroffenen sollten daher eine höhere Konzentration von Entzündungsmarkern aufweisen als von Nicht-Betroffenen.
Vorlesung 01: Intro
Allgemeine Universitätsordnung der HMU
https://languagelog.ldc.upenn.edu/nll/?p=52581
https://www.analyticsinsight.net/importance-of-statistics-how-is-statistics-related-to-data-science/
https://www.livescience.com/roman-republic
https://www.arte.tv/de/videos/093029-022-A/flick-flack/
https://thedecisionlab.com/biases/base-rate-fallacy
https://sz-magazin.sueddeutsche.de/gesundheit/meditonsin-wirkung-erkaeltung-globuli-81941
https://www.astronomy.com/science/in-praise-of-nothing/
https://www.alamy.de/stockfoto-cartoon-geist-in-der-flasche-72046687.html
https://www.quarks.de/podcast/quarks-science-cops-folge-48-erkaeltungsmittel-wissenschaft-oder-kruemeltee/
https://theconversation.com/regression-to-the-mean-or-why-perfection-rarely-lasts-74694
https://datatab.net/tutorial/descriptive-inferential-statistics
https://pub.towardsai.net/hypotheses-testing-with-scipy-b5ba86430d74
https://datatab.de/tutorial/hypothesen
https://www.toolsgroup.com/blog/what-is-probabilistic-forecasting/