Weitere Übungsaufgaben 8

Intervallschätzung

Hinweis

Die hier veröffentlichten Übungsaufgaben sind brandneu und deshalb noch nicht auf Herz und Nieren überprüft. Sollten Sie Fehler entdecken, geben Sie uns bitte unbedingt eine Rückmeldung an philipp.sckopke(at)psy.lmu.de, damit wir so bald wie möglich eine verbesserte Version online stellen können.

  1. Sie interessieren sich für den Mittelwert des Stresslevels in einer Population. Hierfür ziehen Sie eine einfache Zufallsstichprobe der Größe n = 6 und bestimmen bei allen gezogenen Personen das Stresslevel:

    Person Wert
    1 40
    2 36
    3 28
    4 29
    5 36
    6 26

    Berechnen Sie ein Konfidenzintervall für den Parameter \(\mu\) mit Konfidenzniveau 0.98 und interpretieren Sie dieses.
    Wählen Sie hierfür den richtigen R-Code aus:

    qt(0.98, df = 5)
    [1] 2.756509
    qt(0.99, df = 6)
    [1] 3.142668
    pt(0.98, df = 5)
    [1] 0.8139536


    qnorm(0.01)
    [1] -2.326348
    qnorm(0.99)
    [1] 2.326348
    qnorm(0.98)
    [1] 2.053749


    qt(0.99, df = 5)
    [1] 3.36493
    pt(0.99, df = 5)
    [1] 0.8161835
    pnorm(0.99)
    [1] 0.8389129

    Formel für das konkrete Konfidenzintervall für \(\mu\):

    \[I\left( x_{1},\ x_{2},\ \ldots,\ x_{n} \right) = \left\lbrack \overline{x} - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s^{2}}{n}},\overline{x} + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s^{2}}{n}} \right\rbrack\]

    Um dieses zu berechnen, benötigen wir \(n\), \(\overline{x}\), \(s^{2}\) und \(t_{1 - \frac{\alpha}{2}}\).

    \(n\) ist die Größe der Stichprobe, daher: \(n = 6\).

    \[\overline{x} = \frac{1}{n}\sum_{i = 1}^{n}x_{i} = \frac{40 + 36 + 28 + 29 + 36 + 26}{6} = 32.5\]

    \[s^{2} = \frac{1}{n - 1}\sum_{i = 1}^{n}\left( x_{i} - \overline{x} \right)^{2} = \frac{1}{5}\left( (40 - 32.5)^{2} + (36 - 32.5)^{2} + \ldots + (26 - 32.5)^{2} \right) = 31.1\] \(1 - \alpha = 0.98\)

    \(\alpha = 1 - 0.98 = 0.02\)

    \[\frac{\alpha}{2} = \frac{0.02}{2} = 0.01\] \[t_{1 - \frac{\alpha}{2}} = t_{1 - 0.01} = t_{0.99}\] \(t_{0.99}\) ist der Wert, für den \(F\left( t_{0.99} \right) = 0.99\) ist.

    Da die Zufallsvariable einer t-Verteilung mit Freiheitsgrad \(\nu = n - 1 = 6 - 1 = 5\) folgt, benötigen wir die Funktion

    qt(0.99, df = 5)


    Das richtige Quantil ist somit 3.36493. Wir runden auf zwei Nachkommastellen und erhalten den Wert 3.36.

    Einsetzen aller Werte in die Formel für das konkrete Konfidenzintervall:

    \[\begin{align*} I\left( x_{1},\ x_{2},\ \ldots,\ x_{6} \right) &= \left\lbrack \overline{x} - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s^{2}}{n}},\overline{x} + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s^{2}}{n}} \right\rbrack \\ &= \left\lbrack 32.5 - 3.36 \cdot \sqrt{\frac{31.1}{6}},32.5 + 3.36 \cdot \sqrt{\frac{31.1}{6}} \right\rbrack \\ &= \lbrack 24.85,\ 40.15 \rbrack \end{align*}\]

    Die plausiblen Werte für den Parameter \(\mu\) und somit für das durchschnittliche Stresslevel in der Population liegen zwischen 24.85 und 40.15.

  1. Sie interessieren sich für den Mittelwert des Einkommens in einer Population. Hierfür ziehen Sie eine einfache Zufallsstichprobe der Größe n = 4 und bestimmen bei allen gezogenen Personen das Einkommen:

    Person Wert
    1 3868
    2 3680
    3 2927
    4 3967

    Berechnen Sie ein Konfidenzintervall für den Parameter \(\mu\) mit Konfidenzniveau 0.96 und interpretieren Sie dieses.
    Wählen Sie hierfür den richtigen R-Code aus:

    qnorm(0.02)
    [1] -2.053749
    qnorm(0.96)
    [1] 1.750686
    qnorm(0.98)
    [1] 2.053749


    qt(0.98, df = 4)
    [1] 2.998528
    qt(0.98, df = 3)
    [1] 3.481909
    pnorm(0.98)
    [1] 0.8364569


    pt(0.98, df = 3)
    [1] 0.8003224
    pt(0.96, df = 3)
    [1] 0.7960625
    qt(0.96, df = 3)
    [1] 2.605427

    Formel für das konkrete Konfidenzintervall für \(\mu\):

    \[I\left( x_{1},\ x_{2},\ \ldots,\ x_{n} \right) = \left\lbrack \overline{x} - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s^{2}}{n}},\overline{x} + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s^{2}}{n}} \right\rbrack\]

    Um dieses zu berechnen, benötigen wir \(n\), \(\overline{x}\), \(s^{2}\) und \(t_{1 - \frac{\alpha}{2}}\).

    \(n\) ist die Größe der Stichprobe, daher: \(n = 4\).

    \[\overline{x} = \frac{1}{n}\sum_{i = 1}^{n}x_{i} = \frac{3868 + 3680 + 2927 + 3967 }{4} = 3610.5\]

    \[s^{2} = \frac{1}{n - 1}\sum_{i = 1}^{n}\left( x_{i} - \overline{x} \right)^{2} = \frac{1}{3}\left( (3868 - 3610.5)^{2} + (3680 - 3610.5)^{2} + \ldots + (3967 - 3610.5)^{2} \right) = 2.2180033\times 10^{5}\] \(1 - \alpha = 0.96\)

    \(\alpha = 1 - 0.96 = 0.04\)

    \[\frac{\alpha}{2} = \frac{0.04}{2} = 0.02\] \[t_{1 - \frac{\alpha}{2}} = t_{1 - 0.02} = t_{0.98}\] \(t_{0.98}\) ist der Wert, für den \(F\left( t_{0.98} \right) = 0.98\) ist.

    Da die Zufallsvariable einer t-Verteilung mit Freiheitsgrad \(\nu = n - 1 = 4 - 1 = 3\) folgt, benötigen wir die Funktion

    qt(0.98, df = 3)


    Das richtige Quantil ist somit 3.4819088. Wir runden auf zwei Nachkommastellen und erhalten den Wert 3.48.

    Einsetzen aller Werte in die Formel für das konkrete Konfidenzintervall:

    \[\begin{align*} I\left( x_{1},\ x_{2},\ \ldots,\ x_{4} \right) &= \left\lbrack \overline{x} - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s^{2}}{n}},\overline{x} + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s^{2}}{n}} \right\rbrack \\ &= \left\lbrack 3610.5 - 3.48 \cdot \sqrt{\frac{2.2180033\times 10^{5}}{4}},3610.5 + 3.48 \cdot \sqrt{\frac{2.2180033\times 10^{5}}{4}} \right\rbrack \\ &= \lbrack 2791.035,\ 4429.965 \rbrack \end{align*}\]

    Die plausiblen Werte für den Parameter \(\mu\) und somit für das durchschnittliche Einkommen in der Population liegen zwischen 2791.035 und 4429.965.

  1. Sie interessieren sich für den Mittelwert des Alters in einer Population. Hierfür ziehen Sie eine einfache Zufallsstichprobe der Größe n = 5 und bestimmen bei allen gezogenen Personen das Alter:

    Person Wert
    1 36
    2 49
    3 22
    4 20
    5 43

    Berechnen Sie ein Konfidenzintervall für den Parameter \(\mu\) mit Konfidenzniveau 0.96 und interpretieren Sie dieses.
    Wählen Sie hierfür den richtigen R-Code aus:

    pnorm(0.98)
    [1] 0.8364569
    qt(0.98, df = 4)
    [1] 2.998528
    pt(0.96, df = 4)
    [1] 0.8042904


    pt(0.98, df = 4)
    [1] 0.8087132
    qt(0.98, df = 5)
    [1] 2.756509
    qnorm(0.98)
    [1] 2.053749


    qnorm(0.02)
    [1] -2.053749
    qt(0.96, df = 4)
    [1] 2.332873
    qnorm(0.96)
    [1] 1.750686

    Formel für das konkrete Konfidenzintervall für \(\mu\):

    \[I\left( x_{1},\ x_{2},\ \ldots,\ x_{n} \right) = \left\lbrack \overline{x} - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s^{2}}{n}},\overline{x} + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s^{2}}{n}} \right\rbrack\]

    Um dieses zu berechnen, benötigen wir \(n\), \(\overline{x}\), \(s^{2}\) und \(t_{1 - \frac{\alpha}{2}}\).

    \(n\) ist die Größe der Stichprobe, daher: \(n = 5\).

    \[\overline{x} = \frac{1}{n}\sum_{i = 1}^{n}x_{i} = \frac{36 + 49 + 22 + 20 + 43 }{5} = 34\]

    \[s^{2} = \frac{1}{n - 1}\sum_{i = 1}^{n}\left( x_{i} - \overline{x} \right)^{2} = \frac{1}{4}\left( (36 - 34)^{2} + (49 - 34)^{2} + \ldots + (43 - 34)^{2} \right) = 162.5\] \(1 - \alpha = 0.96\)

    \(\alpha = 1 - 0.96 = 0.04\)

    \[\frac{\alpha}{2} = \frac{0.04}{2} = 0.02\] \[t_{1 - \frac{\alpha}{2}} = t_{1 - 0.02} = t_{0.98}\] \(t_{0.98}\) ist der Wert, für den \(F\left( t_{0.98} \right) = 0.98\) ist.

    Da die Zufallsvariable einer t-Verteilung mit Freiheitsgrad \(\nu = n - 1 = 5 - 1 = 4\) folgt, benötigen wir die Funktion

    qt(0.98, df = 4)


    Das richtige Quantil ist somit 2.9985279. Wir runden auf zwei Nachkommastellen und erhalten den Wert 3.

    Einsetzen aller Werte in die Formel für das konkrete Konfidenzintervall:

    \[\begin{align*} I\left( x_{1},\ x_{2},\ \ldots,\ x_{5} \right) &= \left\lbrack \overline{x} - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s^{2}}{n}},\overline{x} + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s^{2}}{n}} \right\rbrack \\ &= \left\lbrack 34 - 3 \cdot \sqrt{\frac{162.5}{5}},34 + 3 \cdot \sqrt{\frac{162.5}{5}} \right\rbrack \\ &= \lbrack 16.897,\ 51.103 \rbrack \end{align*}\]

    Die plausiblen Werte für den Parameter \(\mu\) und somit für das durchschnittliche Alter in der Population liegen zwischen 16.897 und 51.103.

  1. Sie interessieren sich für den Mittelwert des Gewichts in einer Population. Hierfür ziehen Sie eine einfache Zufallsstichprobe der Größe n = 5 und bestimmen bei allen gezogenen Personen das Gewicht:

    Person Wert
    1 64
    2 70
    3 62
    4 73
    5 60

    Berechnen Sie ein Konfidenzintervall für den Parameter \(\mu\) mit Konfidenzniveau 0.97 und interpretieren Sie dieses.
    Wählen Sie hierfür den richtigen R-Code aus:

    qt(0.985, df = 4)
    [1] 3.29763
    qt(0.97, df = 4)
    [1] 2.600762
    pt(0.97, df = 4)
    [1] 0.8065127


    pnorm(0.985)
    [1] 0.837688
    pt(0.985, df = 4)
    [1] 0.8098054
    qnorm(0.97)
    [1] 1.880794


    qnorm(0.985)
    [1] 2.17009
    qt(0.985, df = 5)
    [1] 3.002875
    qnorm(0.015)
    [1] -2.17009

    Formel für das konkrete Konfidenzintervall für \(\mu\):

    \[I\left( x_{1},\ x_{2},\ \ldots,\ x_{n} \right) = \left\lbrack \overline{x} - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s^{2}}{n}},\overline{x} + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s^{2}}{n}} \right\rbrack\]

    Um dieses zu berechnen, benötigen wir \(n\), \(\overline{x}\), \(s^{2}\) und \(t_{1 - \frac{\alpha}{2}}\).

    \(n\) ist die Größe der Stichprobe, daher: \(n = 5\).

    \[\overline{x} = \frac{1}{n}\sum_{i = 1}^{n}x_{i} = \frac{64 + 70 + 62 + 73 + 60 }{5} = 65.8\]

    \[s^{2} = \frac{1}{n - 1}\sum_{i = 1}^{n}\left( x_{i} - \overline{x} \right)^{2} = \frac{1}{4}\left( (64 - 65.8)^{2} + (70 - 65.8)^{2} + \ldots + (60 - 65.8)^{2} \right) = 30.2\] \(1 - \alpha = 0.97\)

    \(\alpha = 1 - 0.97 = 0.03\)

    \[\frac{\alpha}{2} = \frac{0.03}{2} = 0.015\] \[t_{1 - \frac{\alpha}{2}} = t_{1 - 0.015} = t_{0.985}\] \(t_{0.985}\) ist der Wert, für den \(F\left( t_{0.985} \right) = 0.985\) ist.

    Da die Zufallsvariable einer t-Verteilung mit Freiheitsgrad \(\nu = n - 1 = 5 - 1 = 4\) folgt, benötigen wir die Funktion

    qt(0.985, df = 4)


    Das richtige Quantil ist somit 3.2976297. Wir runden auf zwei Nachkommastellen und erhalten den Wert 3.3.

    Einsetzen aller Werte in die Formel für das konkrete Konfidenzintervall:

    \[\begin{align*} I\left( x_{1},\ x_{2},\ \ldots,\ x_{5} \right) &= \left\lbrack \overline{x} - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s^{2}}{n}},\overline{x} + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s^{2}}{n}} \right\rbrack \\ &= \left\lbrack 65.8 - 3.3 \cdot \sqrt{\frac{30.2}{5}},65.8 + 3.3 \cdot \sqrt{\frac{30.2}{5}} \right\rbrack \\ &= \lbrack 57.69,\ 73.91 \rbrack \end{align*}\]

    Die plausiblen Werte für den Parameter \(\mu\) und somit für das durchschnittliche Gewicht in der Population liegen zwischen 57.69 und 73.91.

  1. Sie interessieren sich für die relative Häufigkeit von Depressionen in einer Population. Hierfür ziehen Sie eine einfache Zufallsstichprobe der Größe n = 311. In dieser Stichprobe leiden 43 Personen an einer Depression. Berechnen Sie ein Konfidenzintervall für den Parameter \(\pi\) mit Konfidenzniveau 0.95 und interpretieren Sie dieses.  Wählen Sie hierfür den richtigen R-Code aus:

    qnorm(0.95)
    [1] 1.644854
    pnorm(0.95)
    [1] 0.8289439
    qnorm(0.025)
    [1] -1.959964


    qt(0.975, df = 310)
    [1] 1.967646
    pnorm(0.975)
    [1] 0.8352199
    qt(0.975, df = 311)
    [1] 1.967621


    pnorm(0.025)
    [1] 0.5099725
    qnorm(0.975)
    [1] 1.959964
    qt(0.95, df = 310)
    [1] 1.649784

    Formel für das konkrete Konfidenzintervall für \(\pi\):

    \[I\left( x_{1},\ x_{2},\ \ldots,\ x_{n} \right) = \left\lbrack \overline{x} - z_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{\overline{x}\left( 1 - \overline{x} \right)}{n}},\overline{x} + z_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{\overline{x}\left( 1 - \overline{x} \right)}{n}} \right\rbrack\]

    Um dieses zu berechnen, benötigen wir \(n\), \(\overline{x}\), und \(z_{1 - \frac{\alpha}{2}}\).

    \(n\) ist die Größe der Stichprobe, daher: \(n = 311\).

    \[\overline{x} = h(1) = \frac{43}{311} = 0.138\]

    \(1 - \alpha = 0.95\)

    \(\alpha = 1 - 0.95 = 0.05\)

    \[\frac{\alpha}{2} = \frac{0.05}{2} = 0.025\]

    \[z_{1 - \frac{\alpha}{2}} = z_{1 - 0.025} = z_{0.975}\]

    \(z_{0.975}\) ist der Wert, für den \(F\left( z_{0.975} \right) = 0.975\) ist.

    Da z approximativ einer Standardnormalverteilung folgt, benötigen wir den Output der Funktion

    qnorm(0.975)


    Das richtige Quantil ist somit 1.959964. Wir runden auf zwei Nachkommastellen und erhalten den Wert 1.96.

    Einsetzen aller Werte in die Formel für das konkrete Konfidenzintervall:

    \[\begin{align*} I\left( x_{1},\ x_{2},\ \ldots,\ x_{311} \right) &= \left\lbrack \overline{x} - z_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{\overline{x}\left( 1 - \overline{x} \right)}{n}},\overline{x} + z_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{\overline{x}\left( 1 - \overline{x} \right)}{n}} \right\rbrack \\ &= \left\lbrack 0.138 - 1.96 \cdot \sqrt{\frac{0.138(1 - 0.138)}{311}},0.138 + 1.96 \cdot \sqrt{\frac{0.138(1 - 0.138)}{311}} \right\rbrack \\ &= \lbrack 0.1,\ 0.176\rbrack \end{align*}\]

    Die plausiblen Werte für den Parameter \(\pi\) und somit für die relative Häufigkeit von Depressionen in der Population liegen zwischen 10% und 17.6%.

  1. Sie interessieren sich für die relative Häufigkeit von Angststörungen in einer Population. Hierfür ziehen Sie eine einfache Zufallsstichprobe der Größe n = 292. In dieser Stichprobe leiden 28 Personen an einer Angststörung. Berechnen Sie ein Konfidenzintervall für den Parameter \(\pi\) mit Konfidenzniveau 0.95 und interpretieren Sie dieses.  Wählen Sie hierfür den richtigen R-Code aus:

    qnorm(0.95)
    [1] 1.644854
    qnorm(0.025)
    [1] -1.959964
    qt(0.975, df = 291)
    [1] 1.96815


    qt(0.95, df = 291)
    [1] 1.650107
    qt(0.975, df = 292)
    [1] 1.968121
    qnorm(0.975)
    [1] 1.959964


    pnorm(0.025)
    [1] 0.5099725
    pnorm(0.95)
    [1] 0.8289439
    pnorm(0.975)
    [1] 0.8352199

    Formel für das konkrete Konfidenzintervall für \(\pi\):

    \[I\left( x_{1},\ x_{2},\ \ldots,\ x_{n} \right) = \left\lbrack \overline{x} - z_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{\overline{x}\left( 1 - \overline{x} \right)}{n}},\overline{x} + z_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{\overline{x}\left( 1 - \overline{x} \right)}{n}} \right\rbrack\]

    Um dieses zu berechnen, benötigen wir \(n\), \(\overline{x}\), und \(z_{1 - \frac{\alpha}{2}}\).

    \(n\) ist die Größe der Stichprobe, daher: \(n = 292\).

    \[\overline{x} = h(1) = \frac{28}{292} = 0.096\]

    \(1 - \alpha = 0.95\)

    \(\alpha = 1 - 0.95 = 0.05\)

    \[\frac{\alpha}{2} = \frac{0.05}{2} = 0.025\]

    \[z_{1 - \frac{\alpha}{2}} = z_{1 - 0.025} = z_{0.975}\]

    \(z_{0.975}\) ist der Wert, für den \(F\left( z_{0.975} \right) = 0.975\) ist.

    Da z approximativ einer Standardnormalverteilung folgt, benötigen wir den Output der Funktion

    qnorm(0.975)


    Das richtige Quantil ist somit 1.959964. Wir runden auf zwei Nachkommastellen und erhalten den Wert 1.96.

    Einsetzen aller Werte in die Formel für das konkrete Konfidenzintervall:

    \[\begin{align*} I\left( x_{1},\ x_{2},\ \ldots,\ x_{292} \right) &= \left\lbrack \overline{x} - z_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{\overline{x}\left( 1 - \overline{x} \right)}{n}},\overline{x} + z_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{\overline{x}\left( 1 - \overline{x} \right)}{n}} \right\rbrack \\ &= \left\lbrack 0.096 - 1.96 \cdot \sqrt{\frac{0.096(1 - 0.096)}{292}},0.096 + 1.96 \cdot \sqrt{\frac{0.096(1 - 0.096)}{292}} \right\rbrack \\ &= \lbrack 0.062,\ 0.13\rbrack \end{align*}\]

    Die plausiblen Werte für den Parameter \(\pi\) und somit für die relative Häufigkeit von Angststörungen in der Population liegen zwischen 6.2% und 13%.

  1. Sie interessieren sich für die relative Häufigkeit von Herzerkrankungen in einer Population. Hierfür ziehen Sie eine einfache Zufallsstichprobe der Größe n = 276. In dieser Stichprobe leiden 59 Personen an einer Herzerkrankung. Berechnen Sie ein Konfidenzintervall für den Parameter \(\pi\) mit Konfidenzniveau 0.9 und interpretieren Sie dieses.  Wählen Sie hierfür den richtigen R-Code aus:

    pnorm(0.95)
    [1] 0.8289439
    qt(0.95, df = 275)
    [1] 1.650413
    qnorm(0.05)
    [1] -1.644854


    qt(0.9, df = 275)
    [1] 1.284638
    pnorm(0.9)
    [1] 0.8159399
    pnorm(0.05)
    [1] 0.5199388


    qnorm(0.95)
    [1] 1.644854
    qnorm(0.9)
    [1] 1.281552
    qt(0.95, df = 276)
    [1] 1.650393

    Formel für das konkrete Konfidenzintervall für \(\pi\):

    \[I\left( x_{1},\ x_{2},\ \ldots,\ x_{n} \right) = \left\lbrack \overline{x} - z_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{\overline{x}\left( 1 - \overline{x} \right)}{n}},\overline{x} + z_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{\overline{x}\left( 1 - \overline{x} \right)}{n}} \right\rbrack\]

    Um dieses zu berechnen, benötigen wir \(n\), \(\overline{x}\), und \(z_{1 - \frac{\alpha}{2}}\).

    \(n\) ist die Größe der Stichprobe, daher: \(n = 276\).

    \[\overline{x} = h(1) = \frac{59}{276} = 0.214\]

    \(1 - \alpha = 0.9\)

    \(\alpha = 1 - 0.9 = 0.1\)

    \[\frac{\alpha}{2} = \frac{0.1}{2} = 0.05\]

    \[z_{1 - \frac{\alpha}{2}} = z_{1 - 0.05} = z_{0.95}\]

    \(z_{0.95}\) ist der Wert, für den \(F\left( z_{0.95} \right) = 0.95\) ist.

    Da z approximativ einer Standardnormalverteilung folgt, benötigen wir den Output der Funktion

    qnorm(0.95)


    Das richtige Quantil ist somit 1.6448536. Wir runden auf zwei Nachkommastellen und erhalten den Wert 1.64.

    Einsetzen aller Werte in die Formel für das konkrete Konfidenzintervall:

    \[\begin{align*} I\left( x_{1},\ x_{2},\ \ldots,\ x_{276} \right) &= \left\lbrack \overline{x} - z_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{\overline{x}\left( 1 - \overline{x} \right)}{n}},\overline{x} + z_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{\overline{x}\left( 1 - \overline{x} \right)}{n}} \right\rbrack \\ &= \left\lbrack 0.214 - 1.64 \cdot \sqrt{\frac{0.214(1 - 0.214)}{276}},0.214 + 1.64 \cdot \sqrt{\frac{0.214(1 - 0.214)}{276}} \right\rbrack \\ &= \lbrack 0.174,\ 0.254\rbrack \end{align*}\]

    Die plausiblen Werte für den Parameter \(\pi\) und somit für die relative Häufigkeit von Herzerkrankungen in der Population liegen zwischen 17.4% und 25.4%.

  1. Sie interessieren sich für die relative Häufigkeit von Alkoholvergiftungen in einer Population. Hierfür ziehen Sie eine einfache Zufallsstichprobe der Größe n = 206. In dieser Stichprobe leiden 67 Personen an einer Alkoholvergiftung. Berechnen Sie ein Konfidenzintervall für den Parameter \(\pi\) mit Konfidenzniveau 0.95 und interpretieren Sie dieses.  Wählen Sie hierfür den richtigen R-Code aus:

    qnorm(0.025)
    [1] -1.959964
    qnorm(0.975)
    [1] 1.959964
    qt(0.95, df = 205)
    [1] 1.652321


    pnorm(0.95)
    [1] 0.8289439
    qnorm(0.95)
    [1] 1.644854
    qt(0.975, df = 206)
    [1] 1.971547


    qt(0.975, df = 205)
    [1] 1.971603
    pnorm(0.975)
    [1] 0.8352199
    pnorm(0.025)
    [1] 0.5099725

    Formel für das konkrete Konfidenzintervall für \(\pi\):

    \[I\left( x_{1},\ x_{2},\ \ldots,\ x_{n} \right) = \left\lbrack \overline{x} - z_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{\overline{x}\left( 1 - \overline{x} \right)}{n}},\overline{x} + z_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{\overline{x}\left( 1 - \overline{x} \right)}{n}} \right\rbrack\]

    Um dieses zu berechnen, benötigen wir \(n\), \(\overline{x}\), und \(z_{1 - \frac{\alpha}{2}}\).

    \(n\) ist die Größe der Stichprobe, daher: \(n = 206\).

    \[\overline{x} = h(1) = \frac{67}{206} = 0.325\]

    \(1 - \alpha = 0.95\)

    \(\alpha = 1 - 0.95 = 0.05\)

    \[\frac{\alpha}{2} = \frac{0.05}{2} = 0.025\]

    \[z_{1 - \frac{\alpha}{2}} = z_{1 - 0.025} = z_{0.975}\]

    \(z_{0.975}\) ist der Wert, für den \(F\left( z_{0.975} \right) = 0.975\) ist.

    Da z approximativ einer Standardnormalverteilung folgt, benötigen wir den Output der Funktion

    qnorm(0.975)


    Das richtige Quantil ist somit 1.959964. Wir runden auf zwei Nachkommastellen und erhalten den Wert 1.96.

    Einsetzen aller Werte in die Formel für das konkrete Konfidenzintervall:

    \[\begin{align*} I\left( x_{1},\ x_{2},\ \ldots,\ x_{206} \right) &= \left\lbrack \overline{x} - z_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{\overline{x}\left( 1 - \overline{x} \right)}{n}},\overline{x} + z_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{\overline{x}\left( 1 - \overline{x} \right)}{n}} \right\rbrack \\ &= \left\lbrack 0.325 - 1.96 \cdot \sqrt{\frac{0.325(1 - 0.325)}{206}},0.325 + 1.96 \cdot \sqrt{\frac{0.325(1 - 0.325)}{206}} \right\rbrack \\ &= \lbrack 0.261,\ 0.389\rbrack \end{align*}\]

    Die plausiblen Werte für den Parameter \(\pi\) und somit für die relative Häufigkeit von Alkoholvergiftungen in der Population liegen zwischen 26.1% und 38.9%.