Übungsblatt 05
Wahrscheinlichkeitsdichtefunktion, Verteilungsfunktion, Erwartungswert, Varianz, z-Standardisierung von Zufallsvariablen und Binomialverteilung
Was versteht man unter Inferenzstatistik? Denken Sie sich eine psychologische Fragestellung aus, zu deren Beantwortung Sie inferenzstatistische Methoden verwenden müssten. Welche Rolle spielt die Wahrscheinlichkeitstheorie in der Inferenzstatistik?
LösungDie Inferenzstatistik umfasst alle statistischen Verfahren, die es erlauben, trotz der
Informationsunvollständigkeit der Stichprobendaten Aussagen über eine Population zu treffen.Beispiel: Wir wollen wissen, wie groß der Anteil der Personen in der Population der an Depression erkrankten Personen ist, bei dem unsere Psychotherapie zu einem Rückgang an Symptomen führt. Da wir nicht alle Depressiven mit unserer Therapie behandeln können, behandeln wir nur eine Stichprobe von Depressiven und schließen mithilfe inferenzstatistischer Verfahren auf die Population aller Depressiven.
Um eine Stichprobe zu erhalten, ziehen wir Personen zufällig aus der Population. Die Wahrscheinlichkeitstheorie erlaubt es uns, diesen Zufallsprozess mathematisch zu beschreiben. Hieraus lassen sich dann die Methoden der Inferenzstatistik ableiten.
Sei X eine stetige Zufallsvariable mit Träger \(T_{X}\mathbb{= R}\) und folgender Wahrscheinlichkeitsdichtefunktion:
\(f(x) = \frac{1}{\sqrt{2\pi}}\exp\left( - \frac{x^{2}}{2} \right)\)
Schraffieren Sie jeweils die Fläche unter der Wahrscheinlichkeitsdichtefunktion, die Sie berechnen müssten, um die folgenden Wahrscheinlichkeiten zu bestimmen:
\(P(X > 2) = P_{X}\left( \left\rbrack 2,\ \infty \right\lbrack \right)\)
Lösung\(P(X \leq 0) = P_{X}\left( \left\rbrack - \infty,\ 0 \right\rbrack \right)\)
Lösung\(P( - 1 < X \leq 2) = P_{X}\left( \left\rbrack - 1,\ 2 \right\rbrack \right)\)
Lösung\(P\left( |X| \geq 2 \right) = P_{X}\left( \left\rbrack - \infty,\ - 2 \right\rbrack \cup \left\lbrack 2,\ \infty \right\lbrack \right)\)
Lösung
Sie kennen für einige Realisationen den Wert der Verteilungsfunktion von X:
\[x\] -2 -1 0 1 2 \[F(x)\] 0.02 0.16 0.5 0.84 0.98 Berechnen Sie mithilfe dieser Werte die Wahrscheinlichkeiten aus Teilaufgabe a
Hinweis: Für stetige Zufallsvariablen ist \(P(X < x) = P(X \leq x)\)
Lösung\[P(X > 2) = 1 - P(X \leq 2) = 1 - F(2) = 1 - 0.98 = 0.02\]
\[P(X \leq 0) = F(0) = 0.5\]
\[P( - 1 < X \leq 2) = P(X \leq 2) - P(X \leq - 1) = F(2) - F( - 1) = 0.98 - 0.16 = 0.82\]
\[ \begin{align*} P\left( |X| \geq 2 \right) &= P(X \leq - 2) + P(X \geq 2) \\ &= F( - 2) + 1 - P(X < 2) \\ &= 0.02 + 1 - P(X \leq 2) \\ &= 0.02 + 1 - 0.98 = 0.04 \end{align*} \]
Sei X eine diskrete Zufallsvariable mit folgender Wahrscheinlichkeitsfunktion:
\[x_{j}\] -10 0 1 2 99 \[f\left( x_{j} \right)\] 0.1 0.4 0.1 0.3 0.1 Geben Sie die Verteilungsfunktion von X in Form einer Tabelle an.
Lösung\[x_{j}\] -10 0 1 2 99 \[F\left( x_{j} \right)\] 0.1 0.5 0.6 0.9 1 Sei X eine diskrete Zufallsvariable mit folgender Verteilungsfunktion:
\[x_{j}\] 1 2 3 4 5 \[F\left( x_{j} \right)\] 0.1 0.4 0.5 0.9 1 Geben Sie die Wahrscheinlichkeitsfunktion von X in Form einer Tabelle an.
Lösung\[x_{j}\] 1 2 3 4 5 \[f\left( x_{j} \right)\] 0.1 0.3 0.1 0.4 0.1 Sei X eine diskrete Zufallsvariable mit folgender Wahrscheinlichkeitsfunktion:
\[x_{j}\] -2 -1 0 1 2 \[f\left( x_{j} \right)\] 0.1 0.3 0.4 0 0.2 Berechnen Sie den Erwartungswert von X.
Lösung\[\begin{align*} E(X) &= \sum_{j = 1}^{m}{x_{j} \cdot f( x_{j} )} \\ &= (-2 \cdot 0.1) + (-1 \cdot 0.3) + (0 \cdot 0.4) + (1 \cdot 0) + (2 \cdot 0.2) \\ &= - 0.1 \end{align*}\]
Berechnen Sie die Varianz von X.
Lösung\[\begin{align*} Var(X) &= \sum_{j = 1}^{m}{( x_{j} - E(X) )^{2} \cdot f( x_{j} )} \\ &= (-2 + 0.1)^2 \cdot 0.1 + (-1 + 0.1)^2 \cdot 0.3 + (0 + 0.1)^2 \cdot 0.4 + (1 + 0.1)^2 \cdot 0 + (2 + 0.1)^2 \cdot 0.2 \\ &= 1.49 \end{align*}\]
Berechnen Sie die Standardabweichung von X.
Lösung\[SD(X) = \sqrt{Var(X)} = \sqrt{1.49} = 1.22\]
Sie werfen einen fairen sechsseitigen Würfel dreimal. Hierbei nehmen die Bernoulli-Variablen \(X_{i}\) für i = 1, 2, 3 jeweils den Wert 1 an, falls Sie im i-ten Wurf eine 6 würfeln, und den Wert 0, falls nicht. Sie können davon ausgehen, dass diese drei Zufallsvariablen unabhängig sind. Die Zufallsvariable \(X\) steht für die Anzahl an gewürfelten Sechsern, also \(X = X_{1} + X_{2} + X_{3}\)
Geben Sie den Träger \(T_{X_{1}}\) von \(X_{1}\) an.
Lösung\[T_{X_{1}} = \left\{ 0,\ 1 \right\}\]
Welcher Wahrscheinlichkeitsverteilung folgt \(X_{1}\)? Geben Sie diese in Form einer Tabelle an.
Lösung\(X_{1}\) folgt einer Bernoulli-Verteilung mit \(\pi = \frac{1}{6}\) , also
\[X_{1}\ \sim\ Be\left( \frac{1}{6} \right)\]
\[A_{X_{1}}\] \[\{\}\] \[\left\{ 0 \right\}\] \[\left\{ 1 \right\}\] \[T_{X_{1}}\] \[P_{X_{1}}\left( A_{X_{1}} \right)\] 0 \[\frac{5}{6}\] \[\frac{1}{6}\] 1 Geben Sie die Wahrscheinlichkeitsfunktion von \(X_{1}\) in Form einer Gleichung an.
Lösung\[f\left( x_{j} \right) = \pi^{x_{j}}(1 - \pi)^{1 - x_{j}} = \left( \frac{1}{6} \right)^{x_{j}}\left( \frac{5}{6} \right)^{1 - x_{j}}\]
Berechnen Sie den Erwartungswert, die Varianz und die Standardabweichung von \(X_{1}\).
Lösung\[E\left( X_{1} \right) = \pi = \frac{1}{6}\]
\[Var\left( X_{1} \right) = \pi(1 - \pi) = \frac{1}{6} \cdot \frac{5}{6} = \frac{5}{36} \approx 0.14\]
\[SD\left( X_{1} \right) = \sqrt{Var\left( X_{1} \right)} = \sqrt{\frac{5}{36}} \approx 0.37\]
Geben Sie den Träger von \(X\) an.
Lösung\[T_{X} = \left\{ 0,\ 1,\ 2,\ 3 \right\}\]
Welcher Wahrscheinlichkeitsverteilung folgt \(X\)?
LösungX folgt einer Binomialverteilung mit \(n = 3\) und \(\pi = \frac{1}{6}\) , also
\[X\ \sim\ B\left( 3,\ \frac{1}{6} \right)\]
Geben Sie die Wahrscheinlichkeitsfunktion von \(X\) in Form einer Gleichung an.
Lösung\[f\left( x_{j} \right) = \binom{n}{x_{j}}\pi^{x_{j}}(1 - \pi)^{n - x_{j}} = \binom{3}{x_{j}}\left( \frac{1}{6} \right)^{x_{j}}\left( \frac{5}{6} \right)^{3 - x_{j}}\]
Geben Sie die Verteilungsfunktion von \(X\) in Form einer Gleichung an.
Lösung\[F\left( x_{k} \right) = \sum_{j = 1}^{k}{f\left( x_{j} \right) =}\sum_{j = 1}^{k}{\binom{n}{x_{j}}\pi^{x_{j}}(1 - \pi)^{n - x_{j}}} = \sum_{j = 1}^{k}{\binom{3}{x_{j}}\left( \frac{1}{6} \right)^{x_{j}}\left( \frac{5}{6} \right)^{3 - x_{j}}}\]
Berechnen Sie den Erwartungswert, die Varianz und die Standardabweichung von \(X\).
Lösung\[E(X) = n\pi = 3 \cdot \frac{1}{6} = 0.5\]
\[Var(X) = n\pi(1 - \pi) = 3 \cdot \frac{1}{6} \cdot \frac{5}{6} = \frac{15}{36} \approx 0.42\]
\[SD(X) = \sqrt{Var(X)} = \sqrt{\frac{15}{36}} \approx 0.65\]
Berechnen Sie die Wahrscheinlichkeiten für die folgenden Ereignisse:
Ereignis 1: Sie würfeln drei Sechser
Lösung\[P(X = 3) = f(3) = \binom{3}{3}\left( \frac{1}{6} \right)^{3}\left( \frac{5}{6} \right)^{3 - 3} = \frac{1}{216} \approx 0.005\]
Ereignis 2: Sie würfeln keine Sechs
Lösung\[P(X = 0) = f(0) = \binom{3}{0}\left( \frac{1}{6} \right)^{0}\left( \frac{5}{6} \right)^{3 - 0} = \frac{125}{216} \approx 0.58\]
Ereignis 3: Sie würfeln mindestens zwei Sechser
Lösung\[ \begin{align*} P(X \geq 2) &= f(2) + f(3) \\ &= \binom{3}{2}\left( \frac{1}{6} \right)^{2}\left( \frac{5}{6} \right)^{3 - 2} + \frac{1}{216} \\ &= 3 \cdot \frac{1}{36} \cdot \frac{5}{6} + \frac{1}{216} \\ &= \frac{15}{216} + \frac{1}{216} = \frac{16}{216} \approx 0.07 \end{align*} \]
Stellen Sie die Wahrscheinlichkeitsfunktion von \(X\) graphisch dar. Beschriften Sie hierbei die Achsen und veranschaulichen Sie den Erwartungswert.
Lösung\(f(0) \approx 0.58\) (siehe Teilaufgabe j ii)
\(f(1) = \binom{3}{1}\left( \frac{1}{6} \right)^{1}\left( \frac{5}{6} \right)^{3 - 1} = 3 \cdot \frac{1}{6} \cdot \left( \frac{5}{6} \right)^{2} = \frac{75}{216} \approx 0.35\)
\(f(2) = \frac{15}{216} \approx 0.07\) (siehe Teilaufgabe j iii)
\(f(3) \approx 0.005\) (siehe Teilaufgabe j i)
In R können Sie sich die Werte der Wahrscheinlichkeitsfunktion und der Verteilungsfunktion beliebiger binomialverteilter Zufallsvariablen ausgeben lassen.
Wahrscheinlichkeitsfunktion:
dbinom(x, n, pi)
Verteilungsfunktion:
pbinom(x, n , pi)
Berechnen Sie die Wahrscheinlichkeiten aus Teilaufgabe j mithilfe dieser Funktionen in R.
Lösung## Wahrscheinlichkeitsfunktion der Binomialverteilung mit n=3 und p=1/6: <- 3 n <- 1 / 6 p dbinom(0, n, p)
[1] 0.5787037
dbinom(1, n, p)
[1] 0.3472222
dbinom(2, n, p)
[1] 0.06944444
dbinom(3, n, p)
[1] 0.00462963
## Alle Werte der Wahrscheinlichkeitsfunktion als Vektor: <- 0:3 x_j dbinom(x_j, n, p)
[1] 0.57870370 0.34722222 0.06944444 0.00462963
## Verteilungsfunktion der Binomialvereilung mit n=3 und p=1/6: <- 3 n <- 1 / 6 p pbinom(0, n, p)
[1] 0.5787037
pbinom(1, n, p)
[1] 0.9259259
pbinom(2, n, p)
[1] 0.9953704
pbinom(3, n, p)
[1] 1
## Alle Werte der Verteilungsfunktion als Vektor: <- 0:3 x_j pbinom(x_j, n, p)
[1] 0.5787037 0.9259259 0.9953704 1.0000000
## Berechnung der Wahrscheinlichkeiten aus Teilaufgabe j: <- 3 n <- 1 / 6 p dbinom(3, n, p)
[1] 0.00462963
dbinom(0, n, p)
[1] 0.5787037
dbinom(2, n, p) + dbinom(3, n, p)
[1] 0.07407407
Mithilfe der Funktion
rbinom()
können Sie unabhängige Realisationen von Zufallsvariablen mit beliebiger Binomialverteilung zufällig in R erzeugen:rbinom(Anzahl der unabhängigen Realisationen, n, pi)
Erzeugen Sie 1 Million Realisationen von \(X\), speichern Sie diese in einem Vektor mit dem Namen
x
ab:x <- rbinom(1000000, 3, 1/6)
Berechnen Sie den Mittelwert \(\bar{x}\), die Varianz \(s^2\) und die Standardabweichung \(s\) der zufällig gezogenen Realisationen. Was fällt Ihnen auf?
Lösung## einzelne zufällige Realisationen: <- 3 n <- 1 / 6 p rbinom(1, n, p)
[1] 0
rbinom(1, n, p)
[1] 0
rbinom(1, n, p)
[1] 0
## 1 Million zufällige Realisationen: <- rbinom(1000000, n, p) x mean(x)
[1] 0.49916
var(x)
[1] 0.4158997
sd(x)
[1] 0.6449029
## Erwartungswert, Varianz und Standardabweichung: * p n
[1] 0.5
* p * (1 - p) n
[1] 0.4166667
sqrt(n * p * (1 - p))
[1] 0.6454972
Der Wert \(\bar{x}\) liegt sehr nahe an dem in Teilaufgabe i berechneten Erwartungswert. Der Wert \(s^2\) liegt sehr nahe an der in Teilaufgabe i berechneten Varianz. Der Wert \(s\) liegt sehr nahe an der in Teilaufgabe i berechneten Standardabweichung.
Dies veranschaulicht die Interpretation von Erwartungswert, Varianz und Standardabweichung als Mittelwert, empirische Varianz und empirische Standardabweichung der Realisationen bei unendlicher Wiederholung des zugrundeliegenden Zufallsexperiments.
Bonusaufgabe: Sei \(X\) eine diskrete Zufallsvariable mit Träger \(T_X = \{-2, -1, 0, 1, 2\}\) und Erwartungswert \(E(X) = 1\).
Welche der folgenden Aussagen können Sie auf Basis dieser Information treffen?
Es ist wahrscheinlicher, dass sich die Zufallsvariable in einem positiven Wert realisiert, als in einem Wert gleich oder kleiner 0.
LösungFalsch, diese Aussage kann nur getroffen werden, wenn man die genaue Wahrscheinlichkeitsfunktion von X kennt. Gegenbeispiel:
\[E(X) = \sum_{j = 1}^{m}{x_{j} \cdot f\left( x_{j} \right) = ( - 2) \cdot 0 + ( - 1) \cdot 0 + 0 \cdot 0,5 + 1 \cdot 0 + 2 \cdot 0,5 = 1}\]
aber \(P(X > 0) = P(X \leq 0) = 0.5\)
Es ist am wahrscheinlichsten, dass die Zufallsvariable den Wert 1 annimmt.
LösungFalsch, auch diese Aussage kann nur getroffen werden, wenn man die genaue Wahrscheinlichkeitssfunktion von X kennt. Gegenbeispiel:
\(E(X) = 1\) aber \(P(X = 1) = 0\)
Würde man den durch die Zufallsvariable repräsentierten Zufallsvorgang unendlich oft wiederholen, wäre die durchschnittliche Realisation gleich 1.
LösungRichtig, dies ist die Interpretation des Erwartungswerts.
Bonusaufgabe:
Sei X eine stetige Zufallsvariable mit Träger \(T_{X} = \lbrack 0,\ 1\rbrack\) und folgender Wahrscheinlichkeitsdichtefunktion:
\(f(x) = 1\) für alle \(x \in T_{X}\)
Dies ist die Dichtefunktion der stetigen Gleichverteilung auf dem Intervall \(\lbrack 0,\ 1\rbrack\).
Veranschaulichen Sie diese Wahrscheinlichkeitsdichtefunktion graphisch.
LösungBerechnen Sie die folgenden Wahrscheinlichkeiten (Hinweis: Sie benötigen das Wissen aus der Schule, wie Sie eine Stammfunktion bilden):
\(P_{X}\left( \lbrack 0.5,\ 1\rbrack \right)\)
Lösung\[P_{X}\left( \lbrack 0.5,\ 1\rbrack \right) = \int_{0.5}^{1}{f(x)dx} = \int_{0.5}^{1}{1dx} = \lbrack x\rbrack_{0.5}^{1} = 1 - 0.5 = 0.5\]
\(P_{X}\left( \lbrack 0.4,\ 0.6\rbrack \right)\)
Lösung\[P_{X}\left( \lbrack 0.4,\ 0.6\rbrack \right) = \int_{0.4}^{0.6}{f(x)dx} = \int_{0.4}^{0.6}{1dx} = \lbrack x\rbrack_{0.4}^{0.6} = 0.6 - 0.4 = 0.2\]
\(P_{X}\left( \lbrack 0,\ 0.1\rbrack \cup \lbrack 0.9,\ 1\rbrack \right)\)
Lösung\[ \begin{align*} P_{X}\left( \lbrack 0,\ 0.1\rbrack \cup \lbrack 0.9,\ 1\rbrack \right) &= P_{X}\left( \lbrack 0,\ 0.1\rbrack \right) + P_{X}\left( \lbrack 0.9,\ 1\rbrack \right) \\ &= \int_{0}^{0.1}{f(x)dx} + \int_{0.9}^{1}{f(x)dx} \\ &= \int_{0}^{0.1}{1dx} + \int_{0.9}^{1}{1dx} \\ &= \lbrack x\rbrack_{0}^{0.1} + \lbrack x\rbrack_{0.9}^{1} \\ &= 0.1 - 0 + 1 - 0.9 = 0.2 \end{align*} \]
Bestimmen Sie die Verteilungsfunktion von X und veranschaulichen Sie diese graphisch.
Lösung\[F(x) = \int_{0}^{x}{f(y)dy} = \int_{0}^{x}{f(y)dy} = \lbrack y\rbrack_{0}^{x} = x - 0 = x\]
Berechnen Sie den Erwartungswert von X.
Lösung\[E(X) = \int_{0}^{1}{x \cdot f(x)dx} = \int_{0}^{1}{x \cdot 1dx} = \int_{0}^{1}{xdx} = \left\lbrack \frac{1}{2}x^{2} \right\rbrack_{0}^{1} = \frac{1}{2} - 0 = \frac{1}{2}\]
Berechnen Sie die Varianz von X.
Lösung\[ \begin{align*} Var(X) &= \int_{0}^{1}{\left( x - E(X) \right)^{2} \cdot f(x)dx} \\ &= \int_{0}^{1}{\left( x - \frac{1}{2} \right)^{2} \cdot 1dx} \\ &= \int_{0}^{1}{\left( x^{2} - x + \frac{1}{4} \right)dx} \\ &= \int_{0}^{1}{x^{2}dx} - \int_{0}^{1}{xdx} + \int_{0}^{1}{\frac{1}{4}dx} \\ &= \left\lbrack \frac{1}{3}x^{3} \right\rbrack_{0}^{1} - \left\lbrack \frac{1}{2}x^{2} \right\rbrack_{0}^{1} + \left\lbrack \frac{1}{4}x \right\rbrack_{0}^{1} \\ &= \frac{1}{3} - 0 - \frac{1}{2} + 0 + \frac{1}{4} - 0 \\ &= \frac{1}{3} - \frac{1}{2} + \frac{1}{4} = \frac{1}{12} \end{align*} \]
Bonusaufgabe:
Zeigen Sie, dass Varianz und Standardabweichung einer z-standardisierten Zufallsvariable Z jeweils gleich 1 sind. Hinweis: Verwenden Sie die Rechenregeln für Varianzen.
Lösung\[Var(Z) = Var\left( \frac{X - E(X)}{SD(X)} \right) = \frac{1}{{SD(X)}^{2}}Var\left( X - E(X) \right) = \frac{1}{Var(X)}Var(X) = 1\]
\[SD(Z) = \sqrt{Var(Z)} = \sqrt{1} = 1\]