M24 Statistik 1: Sommersemester 2025
Prof. Matthias Guggenmos
Health and Medical University Potsdam
In der letzten Vorlesung haben wir erarbeitet, dass sich die Stichprobenverteilung durch eine Normalverteilung der Form
\[ f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} \]
beschreiben lässt (wobei die Variable \(x\) im Fall der Stichprobenverteilung der Stichprobenkennwert \(\hat{\theta}\) ist).
Da Häufigkeitsverteilungen \(f(x)\) von kontinuierlichen Variablen \(X\) die Häufigkeit für beliebige Werte von \(x\) angeben, ergibt sich ein Problem, denn die relative oder absolute Häufigkeit für jeden möglichen Wert von \(x\) ist \(0\).
Warum? Beispiel: wie viele Menschen gibt es mit einer Körpergröße von exakt \(170\,cm\) (d.h. auf unendlich viele Nachkommastellen \(170,000...000\,cm\) genau)? Vermutlich \(0\). Damit hat die Häufigkeit \(f(x=170cm)\) den Wert \(0\). Diese Überlegung lässt sich auf jedes beliebige \(x\) übertragen.
Häufigkeitsfunktionen \(f(x)\) für kontinuierliche Variablen \(X\) geben daher keine relative Häufigkeiten bzw. Wahrscheinlichkeiten an.
Wir stellen zwei Punkte fest:
→ Theoretische Häufigkeitsverteilungen \(f(x)\) geben Wahrscheinlichkeitsdichten an, mit \(d\rightarrow 0\) und der Einheit Wahrscheinlichkeit pro Maßeinheit (z.B. Wahrscheinlichkeit pro cm).
Wir halten fest:
Ist das Merkmal \(X\) eine kontinuierliche Variable (z.B. Nasenlänge in \(cm\)), so geben theoretische Häufigkeitsverteilungen \(f(x)\) eine Wahrscheinlichkeitsdichte an.
\(\text{Wahrscheinlichkeitsdichte} = \text{Wahrscheinlichkeit }pro\text{ Maßeinheit}\) | |
Wie kann man sich “Wahrscheinlichkeitsdichte” vorstellen?
Beispiel Normalverteilung: \[ f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} \]
Der Normalisierungsfaktor \(\frac{1}{\sigma\sqrt{2\pi}}\) sorgt in diesem Fall dafür, dass die Fläche unter der Normalverteilung gleich 1 ist: \[ \int_{-\infty}^{\infty} f(x) dx = 1 \]
\[ P(x_0<x<x_1) = \int_{x_0}^{x_1} f(x) dx \]
Nehmen wir an, dass Nasenlängen in der Population normalverteilt sind, mit Mittelwert \(\mu=5\) und Standardabweichung \(\sigma=1.5\).
Frage: wie hoch ist die Wahrscheinlichkeit, dass eine zufällig gezogene Nase aus der Population eine Länge zwischen \(2cm\) und \(4cm\) hat?
\[ P(2\le x\le 4) = \int_2^4 f(x)dx = \frac{1}{\sigma\sqrt{2\pi}}\int_2^4\text{exp}\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)dx = \\ = \frac{1}{1.5\sqrt{2\pi}}\int_2^4\text{exp}\left(-\frac{(x-5)^2}{2\cdot1.5^2}\right)dx \overset{(Computer!)}{\approx} 0.23 \]
Nehmen wir nun an, dass Nasenlängen in der Population uniform zwischen 0 und 10 cm verteilt sind.
Gleiche Frage: wie hoch ist die Wahrscheinlichkeit, dass eine zufällig gezogene Nase aus der Population eine Länge zwischen \(2cm\) und \(4cm\) hat?
Wir wissen: die Fläche unter der Verteilung muss 1 sein. Daher muss die Wahrscheinlichkeitsdichte für jeden Wert zwischen \(0cm\) und \(10cm\) gleich \(0.1cm^{-1}\) betragen (\(10cm\cdot 0.1cm^{-1} = 1\)).
Die Berechnung des Flächeninhalts im Intervall \([2cm; 4cm]\) geht in diesem Fall ohne Integration, denn er entspricht einfach der Fläche eines Rechteckes mit Breite \(2cm\) und Höhe \(0.1cm^{-1}\). Es gilt:
\[ \begin{aligned} Wahrscheinlichkeit&=Intervallbreite \cdot Wahrscheinlichkeitsdichte =\\ &= 2cm \cdot 0.1cm^{-1} = 0.2 \end{aligned} \]
Die Integration einer Wahrscheinlichkeitsdichte bis zu einem bestimmten Wert \(x\) ist ein sehr häufiger Fall im Umgang mit Wahrscheinlichkeitsdichten. Daher definieren wir dafür eine eigene Funktion, die Verteilungsfunktion \(F(x)\):
\[ F(x) = \int_{-\infty}^{x} f(x') dx' \]
Die Verteilungsfunktion \(F\) gibt uns den Flächeninhalt der Dichtefunktion \(f\) “links von \(x\)” an.
Nehmen wir wieder die normalverteilte Nasenlängen-Population an mit Mittelwert \(\mu=5\) und Standardabweichung \(\sigma=1{,}5\). Die Wahrscheinlichkeit, dass eine zufällig gezogene Nase eine Länge kleiner \(4cm\) hat, ist gegeben durch den Wert \(F(4)\) der Verteilungsfunktion dieser Normalverteilung:
\[ F(4) = \int_{-\infty}^{4} f(x') dx' = \\ =\frac{1}{1{,}5\sqrt{2\pi}}\int_{-\infty}^4\text{exp}\left(-\frac{(x'-5)^2}{2\cdot1{,}5^2}\right)dx' \overset{(Computer!)}{\approx} 0{,}25 \]
Mithilfe der Verteilungsfunktion, lässt sich nun das Integral
\[ P(x_0<x<x_1) = \int_{x_0}^{x_1} f(x) dx \]
mit dem wir die Fläche zwischen einer Untergrenz \(x_0\) und Obergrenze \(x_1\) berechnen, auch folgendermaßen aufstellen:\[ P(x_0<x<x_1) = F(x_1) - F(x_0) \]
Die eingezeichnete Fläche aus unserem vorherigen Beispiel lässt sich berechnen als:
\[ P(2<x<4) = F(4) - F(2) \overset{(Computer!)}{\approx} 0{,}23 \]
Mithilfe der Verteilungsfunktion lassen sich charakteristische Flächeninhalte der Normalverteilung berechnen. Als Faustregel ergibt sich die 68-95-99.7-Prozentregel:
\[ f(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} \]
\[ f(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}\quad\underset{\sigma=1}{\overset{\mu=0}{=}}\quad\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}} \]
Aufgrund ihrer Bedeutung in der Statistik, haben sich für die (Standard)Normalverteilung bestimmte Bezeichnung eingebürgert, auf die wir ab jetzt zugreifen werden.
Normalverteilung mit Angabe des Mittelwertes \(\mu\) und der Varianz \(\sigma^2\) | \(\mathcal{N}(\mu, \sigma^2)\) |
Standardnormalverteilung (Mittelwert 0, Varianz 1) | \(\mathcal{N}(0, 1)\) |
Dichtefunktion der Normalverteilung | \(f(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}\) |
Dichtefunktion der Standardnormalverteilung | \(\varphi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}x^2}\) (sprich “Klein Phi”) Es gilt: \(\quad f(x) = \frac{1}{\sigma}\varphi\left(\frac{x-\mu}{\sigma}\right)\) |
Verteilungsfunktion der Normalverteilung | \(F(x)=\frac{1}{\sigma\sqrt{2\pi}}\int_{-\infty}^x e^{-\frac{1}{2}\left(\frac{x'-\mu}{\sigma}\right)^2}dx\qquad\) |
Verteilungsfunktion der Standardnormalverteilung | \(\Phi(x)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^x e^{-\frac{1}{2}x'^2}dx\qquad\) (sprich “Groß Phi”) Es gilt: \(\quad F(x) = \Phi\left(\frac{x-\mu}{\sigma}\right)\) |
Im nächsten Schritt kehren wir zurück zur theoretischen Stichprobenverteilung. Die Erkenntnisse zur Wahrscheinlichkeitsdichte und Verteilungsfunktion lassen sich auf die theoretische Stichprobenverteilung übertragen und eröffnen so zwei wesentliche Methoden der Inferenzstatistik:
Wir verwenden den Begriff relative Häufigkeiten bei empirischen Daten und meinen damit den Anteil einer Merkmalsausprägung relativ zu allen Datenpunkten. Beispiel: in einer Stichprobe von 100 Würfelversuchen lag die relative Häufigkeit von Zahlen größer 3 bei \(0.48\) oder \(48 \%\). | |
Wir verwenden den Begriff Wahrscheinlichkeit, wenn die theoretische Häufigkeitsverteilung eines Merkmals bekannt ist, und meinen damit den Anteil einer Merkmalsausprägung laut Theorie. Beispiel: bei einem perfekten Würfel ist die Wahrscheinlichkeit einer Zahl größer 3 exakt \(0.5\). | |
Vorlesung 07: Wahrscheinlichkeitsdichte