Übungsaufgaben

Unterschiede zwischen Populationen - Parameterschätzung

Hinweis

Die hier veröffentlichten Übungsaufgaben sind brandneu und deshalb noch nicht auf Herz und Nieren überprüft. Sollten Sie Fehler entdecken, geben Sie uns bitte unbedingt eine Rückmeldung an philipp.sckopke(at)psy.lmu.de, damit wir so bald wie möglich eine verbesserte Version online stellen können.

  1. Sie interessieren sich dafür, welchen Einfluss Nachhilfe auf die durchschnittliche Schulleistung von Gymnasiasten hat. Hierfür ziehen Sie eine einfache Zufallsstichprobe von 4 Gymnasiasten und messen die (stetige) Schulleistung (in Noten) einmal vor und einmal nach der Nachhilfe. Vor der Nachhilfe messen Sie die Werte 5, 5, 3 und 6 und nach der Nachhilfe die Werte 1, 1, 1 und 4.

    Berechnen Sie ein 0.95-Konfidenzintervall für die Differenz der durchschnittlichen Schulleistung der Gymnasiasten vor und nach der Nachhilfe und interpretieren Sie dieses.

    Verwenden Sie für die Berechnung des Quantils \(t_{1 - \frac{\alpha}{2}}\) die Funktion qt in R.

    Aufgrund der Messwiederholung liegen abhängige Stichproben vor. Wir müssen also das konkrete Konfidenzintervall für \(\mu_{1} - \mu_{2}\) bei abhängigen Stichproben berechnen.

    Formel:

    \[I\left( x_{1},\ldots,x_{n} \right) = \left\lbrack {(\overline{x}}_{1} - {\overline{x}}_{2}) - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{Diff}^2}{n}},{(\overline{x}}_{1} - {\overline{x}}_{2}) + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{Diff}^2}{n}} \right\rbrack\]

    Wir benötigen also \({\overline{x}}_{1}\), \({\overline{x}}_{2}\), \(s_{Diff}^{2}\), \(t_{1 - \frac{\alpha}{2}}\) und \(n\).

    \(n\) entspricht der Anzahl an Gymnasiasten in der Stichprobe, daher ist \(n=\) 4

    \({\overline{x}}_{1}\) ist der Mittelwert der Schulleistung vor der Nachhilfe:

    \[{\overline{x}}_{1} = \frac{5 + 5 + 3 + 6 }{4} = 4.75\]

    \({\overline{x}}_{2}\) ist der Mittelwert der Schulleistung nach der Nachhilfe:

    \[{\overline{x}}_{2} = \frac{1 + 1 + 1 + 4 }{4} = 1.75\]

    \(s_{Diff}^{2}\) ist die korrigierte empirische Varianz der Differenzen \(x_{i Diff} = x_{1i} - x_{2i}\), d.h. der Differenzen der Gymnasiasten in der Schulleistung vor und nach der Nachhilfe:

    \[\begin{align*} &x_{1\ Diff} = x_{11} - x_{21} = 5 - 1 = 4 \\ &x_{2\ Diff} = x_{12} - x_{22} = 5 - 1 = 4 \\ &x_{3\ Diff} = x_{13} - x_{23} = 3 - 1 = 2 \\ &x_{4\ Diff} = x_{14} - x_{24} = 6 - 4 = 2 \end{align*}\]

    Der Mittelwert dieser Differenzen ist:

    \[{\overline{x}}_{Diff} = \frac{ 4 + 4 + 2 + 2 }{ 4 } = 3 \]

    Damit ist:

    \[\begin{align*} s_{Diff}^{2} &= \frac{1}{4 - 1}\sum_{i = 1}^{4}{\left( x_{i\ Diff} - {\overline{x}}_{Diff} \right)^{2}} \\&= \frac{1}{4 - 1}\left\lbrack (4 - 3)^2 + (4 - 3)^2 + (2 - 3)^2 + (2 - 3)^2 \right\rbrack \\ &\approx 1.33 \end{align*}\]

    Da unser Konfidenzniveau \(1 - \alpha = 0.95\) sein soll, suchen wir \(t_{1 - \frac{\alpha}{2}} = t_{1 - \frac{0.05}{2}} = t_{0.975}\).

    Dies ist der Wert für den unter einer t-Verteilung mit \(\nu = n - 1 = 4 - 1 = 3\) gilt, dass \(F\left( t_{0.975} \right) = 0.975\).

    Berechnung von \(t_{0.975}\) in R:

    qt(0.975, 3)
    [1] 3.182446

    Also ist \(t_{0.975} \approx 3.18\).

    Nun können wir in die Formel für das konkrete KI einsetzen:

    \[\begin{align*} I\left( x_{1},\ldots,x_{n} \right) &= \left\lbrack {(\overline{x}}_{1} - {\overline{x}}_{2}) - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{Diff}^2}{n}},{(\overline{x}}_{1} - {\overline{x}}_{2}) + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{Diff}^2}{n}} \right\rbrack \\ &= \left\lbrack (4.75 - 1.75) - 3.18 \cdot \sqrt{\frac{1.33}{4}},(4.75 - 1.75) + 3.18 \cdot \sqrt{\frac{1.33}{4}} \right\rbrack \\ &\approx \lbrack 1.17, 4.83 \rbrack \end{align*}\]

  1. Sie interessieren sich dafür, wie stark sich Gymnasiasten und Hauptschüler in ihrer durchschnittlichen Schulleistung unterscheiden. Sie ziehen hierfür eine einfache Zufallsstichprobe der Größe 4 aus der Population der Gymnasiasten und eine einfache Zufallsstichprobe der Größe 4 aus der Population der Hauptschülern. Die von Ihnen gezogenen Gymnasiasten weisen jeweils eine Schulleistung (in Noten) von 6, 4, 5 und 3 auf. Die von Ihnen gezogenen Hauptschüler weisen jeweils eine Schulleistung von 2, 1, 3 und 1 auf.

    Berechnen Sie ein 0.95-Konfidenzintervall für die Differenz der durchschnittlichen Schulleistung von Gymnasiasten und Hauptschülern und interpretieren Sie dieses.

    Verwenden Sie für die Berechnung des Quantils \(t_{1 - \frac{\alpha}{2}}\) die Funktion qt in R.

    Da sich in der Stichprobe der Gymnasiasten und in der Stichprobe der Hauptschülern unterschiedliche Personen befinden, liegen unabhängige Stichproben vor. Wir müssen also das konkrete Konfidenzintervall für \(\mu_{1} - \mu_{2}\) bei unabhängigen Stichproben berechnen.

    Formel:

    \[I\left( x_{1},\ldots,x_{n} \right) = \left\lbrack {(\overline{x}}_{1} - {\overline{x}}_{2}) - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{pool}^2}{n_1} + \frac{s_{pool}^2}{n_2}},{(\overline{x}}_{1} - {\overline{x}}_{2}) + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{pool}^2}{n_1} + \frac{s_{pool}^2}{n_2}} \right\rbrack\]

    Wir benötigen also \({\overline{x}}_{1}\), \({\overline{x}}_{2}\), \(s_{pool}^{2}\), \(t_{1 - \frac{\alpha}{2}}\), \(n_{1}\) und \(n_{2}\).

    \(n_{1}\) entspricht der Anzahl an Gymnasiasten in der Stichprobe der Gymnasiasten , daher ist \(n_{1}=\) 4

    \(n_{2}\) entspricht der Anzahl an Hauptschülern in der Stichprobe der Hauptschülern , daher ist \(n_{2}=\) 4

    \({\overline{x}}_{1}\) ist der Mittelwert der Schulleistung in der Population der Gymnasiasten:

    \[{\overline{x}}_{1} = \frac{6 + 4 + 5 + 3 }{4} = 4.5\]

    \({\overline{x}}_{2}\) ist der Mittelwert der Schulleistung in der Population der Hauptschüler:

    \[{\overline{x}}_{2} = \frac{2 + 1 + 3 + 1 }{4} = 1.75\]

    \[\begin{align*} \end{align*}\]

    Damit ist:

    \[\begin{align*} s_1^2 &= \frac{1}{4 - 1}\sum_{i = 1}^{4}{\left( x_{1i} - \overline{x}_{1} \right)^{2}} \\ &= \frac{1}{3}(6 - 4.5)^2 + (4 - 4.5)^2 + (5 - 4.5)^2 + (3 - 4.5)^2\\ &=1.67\\s_2^2 &= \frac{1}{4 - 1}\sum_{i = 1}^{4}{\left( x_{2i} - \overline{x}_{2} \right)^{2}} \\ &= \frac{1}{3}(2 - 1.75)^2 + (1 - 1.75)^2 + (3 - 1.75)^2 + (1 - 1.75)^2\\ &=0.92\\s_{pool}^{2} &= \frac{(n_1 - 1) \cdot s_1^2 + (n_2 - 1) \cdot s_2^2}{n_1 + n_2 - 2} \\&= \frac{3 * 1.67 + 3 * 0.92}{6} \\ &= 1.29 \end{align*}\]

    Da unser Konfidenzniveau \(1 - \alpha = 0.95\) sein soll, suchen wir \(t_{1 - \frac{\alpha}{2}} = t_{1 - \frac{0.05}{2}} = t_{0.975}\).

    Dies ist der Wert für den unter einer t-Verteilung mit \(\nu = n_1 + n_2 - 2 = 4 + 4 - 2 = 6\) gilt, dass \(F\left( t_{0.975} \right) = 0.975\).

    Berechnung von \(t_{0.975}\) in R:

    qt(0.975, 6)
    [1] 2.446912

    Also ist \(t_{0.975} \approx 2.45\).

    Nun können wir in die Formel für das konkrete KI einsetzen:

    \[\begin{align*} I\left( x_{1},\ldots,x_{n} \right) &= \left\lbrack {(\overline{x}}_{1} - {\overline{x}}_{2}) - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{pool}^2}{n_1} + \frac{s_{pool}^2}{n_2}},{(\overline{x}}_{1} - {\overline{x}}_{2}) + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{pool}^2}{n_1} + \frac{s_{pool}^2}{n_2}} \right\rbrack \\ &= \left\lbrack (4.5 - 1.75) - 2.45 \cdot \sqrt{\frac{1.29}{4} + \frac{1.29}{4}},(4.5 - 1.75) + 2.45 \cdot \sqrt{\frac{1.29}{4} + \frac{1.29}{4}} \right\rbrack \\ &\approx \lbrack 0.78, 4.72 \rbrack \end{align*}\]

  1. Sie interessieren sich dafür, welchen Einfluss Medikamenteinnahme auf die durchschnittliche Schlafdauer von Jugendlichen hat. Hierfür ziehen Sie eine einfache Zufallsstichprobe von 6 Jugendlichen und messen die (stetige) Schlafdauer (in Stunden) einmal vor und einmal nach der Medikamenteinnahme. Vor der Medikamenteinnahme messen Sie die Werte 6, 9, 6, 6, 5 und 7 und nach der Medikamenteinnahme die Werte 9, 8, 8, 6, 6 und 7.

    Berechnen Sie ein 0.95-Konfidenzintervall für die Differenz der durchschnittlichen Schlafdauer der Jugendlichen vor und nach der Medikamenteinnahme und interpretieren Sie dieses.

    Verwenden Sie für die Berechnung des Quantils \(t_{1 - \frac{\alpha}{2}}\) die Funktion qt in R.

    Aufgrund der Messwiederholung liegen abhängige Stichproben vor. Wir müssen also das konkrete Konfidenzintervall für \(\mu_{1} - \mu_{2}\) bei abhängigen Stichproben berechnen.

    Formel:

    \[I\left( x_{1},\ldots,x_{n} \right) = \left\lbrack {(\overline{x}}_{1} - {\overline{x}}_{2}) - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{Diff}^2}{n}},{(\overline{x}}_{1} - {\overline{x}}_{2}) + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{Diff}^2}{n}} \right\rbrack\]

    Wir benötigen also \({\overline{x}}_{1}\), \({\overline{x}}_{2}\), \(s_{Diff}^{2}\), \(t_{1 - \frac{\alpha}{2}}\) und \(n\).

    \(n\) entspricht der Anzahl an Jugendlichen in der Stichprobe, daher ist \(n=\) 6

    \({\overline{x}}_{1}\) ist der Mittelwert der Schlafdauer vor der Medikamenteinnahme:

    \[{\overline{x}}_{1} = \frac{6 + 9 + 6 + 6 + 5 + 7}{6} = 6.5\]

    \({\overline{x}}_{2}\) ist der Mittelwert der Schlafdauer nach der Medikamenteinnahme:

    \[{\overline{x}}_{2} = \frac{9 + 8 + 8 + 6 + 6 + 7}{6} = 7.333\]

    \(s_{Diff}^{2}\) ist die korrigierte empirische Varianz der Differenzen \(x_{i Diff} = x_{1i} - x_{2i}\), d.h. der Differenzen der Jugendliche in der Schlafdauer vor und nach der Medikamenteinnahme:

    \[\begin{align*} &x_{1\ Diff} = x_{11} - x_{21} = 6 - 9 = -3 \\ &x_{2\ Diff} = x_{12} - x_{22} = 9 - 8 = 1 \\ &x_{3\ Diff} = x_{13} - x_{23} = 6 - 8 = -2 \\ &x_{4\ Diff} = x_{14} - x_{24} = 6 - 6 = 0 \\ &x_{5\ Diff} = x_{15} - x_{25} = 5 - 6 = -1 \\ &x_{6\ Diff} = x_{16} - x_{26} = 7 - 7 = 0 \end{align*}\]

    Der Mittelwert dieser Differenzen ist:

    \[{\overline{x}}_{Diff} = \frac{ -3 + 1 -2 + 0 -1 + 0 }{ 6 } = -0.83 \]

    Damit ist:

    \[\begin{align*} s_{Diff}^{2} &= \frac{1}{6 - 1}\sum_{i = 1}^{6}{\left( x_{i\ Diff} - {\overline{x}}_{Diff} \right)^{2}} \\&= \frac{1}{6 - 1}\left\lbrack (-3 + 0.83)^2 + (1 + 0.83)^2 + (-2 + 0.83)^2 + (0 + 0.83)^2 + (-1 + 0.83)^2 + (0 + 0.83)^2 \right\rbrack \\ &\approx 2.17 \end{align*}\]

    Da unser Konfidenzniveau \(1 - \alpha = 0.95\) sein soll, suchen wir \(t_{1 - \frac{\alpha}{2}} = t_{1 - \frac{0.05}{2}} = t_{0.975}\).

    Dies ist der Wert für den unter einer t-Verteilung mit \(\nu = n - 1 = 6 - 1 = 5\) gilt, dass \(F\left( t_{0.975} \right) = 0.975\).

    Berechnung von \(t_{0.975}\) in R:

    qt(0.975, 5)
    [1] 2.570582

    Also ist \(t_{0.975} \approx 2.57\).

    Nun können wir in die Formel für das konkrete KI einsetzen:

    \[\begin{align*} I\left( x_{1},\ldots,x_{n} \right) &= \left\lbrack {(\overline{x}}_{1} - {\overline{x}}_{2}) - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{Diff}^2}{n}},{(\overline{x}}_{1} - {\overline{x}}_{2}) + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{Diff}^2}{n}} \right\rbrack \\ &= \left\lbrack (6.5 - 7.333) - 2.57 \cdot \sqrt{\frac{2.17}{6}},(6.5 - 7.333) + 2.57 \cdot \sqrt{\frac{2.17}{6}} \right\rbrack \\ &\approx \lbrack -2.38, 0.71 \rbrack \end{align*}\]

  1. Sie interessieren sich dafür, wie stark sich Jugendliche und Erwachsene in ihrer durchschnittlichen Schlafdauer unterscheiden. Sie ziehen hierfür eine einfache Zufallsstichprobe der Größe 4 aus der Population der Jugendlichen und eine einfache Zufallsstichprobe der Größe 5 aus der Population der Erwachsenen. Die von Ihnen gezogenen Jugendlichen weisen jeweils eine Schlafdauer (in Stunden) von 9, 6, 6 und 7 auf. Die von Ihnen gezogenen Erwachsenen weisen jeweils eine Schlafdauer von 6, 9, 7, 9 und 9 auf.

    Berechnen Sie ein 0.95-Konfidenzintervall für die Differenz der durchschnittlichen Schlafdauer von Jugendlichen und Erwachsenen und interpretieren Sie dieses.

    Verwenden Sie für die Berechnung des Quantils \(t_{1 - \frac{\alpha}{2}}\) die Funktion qt in R.

    Da sich in der Stichprobe der Jugendlichen und in der Stichprobe der Erwachsenen unterschiedliche Personen befinden, liegen unabhängige Stichproben vor. Wir müssen also das konkrete Konfidenzintervall für \(\mu_{1} - \mu_{2}\) bei unabhängigen Stichproben berechnen.

    Formel:

    \[I\left( x_{1},\ldots,x_{n} \right) = \left\lbrack {(\overline{x}}_{1} - {\overline{x}}_{2}) - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{pool}^2}{n_1} + \frac{s_{pool}^2}{n_2}},{(\overline{x}}_{1} - {\overline{x}}_{2}) + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{pool}^2}{n_1} + \frac{s_{pool}^2}{n_2}} \right\rbrack\]

    Wir benötigen also \({\overline{x}}_{1}\), \({\overline{x}}_{2}\), \(s_{pool}^{2}\), \(t_{1 - \frac{\alpha}{2}}\), \(n_{1}\) und \(n_{2}\).

    \(n_{1}\) entspricht der Anzahl an Jugendlichen in der Stichprobe der Jugendlichen , daher ist \(n_{1}=\) 4

    \(n_{2}\) entspricht der Anzahl an Erwachsenen in der Stichprobe der Erwachsenen , daher ist \(n_{2}=\) 5

    \({\overline{x}}_{1}\) ist der Mittelwert der Schlafdauer in der Population der Jugendliche:

    \[{\overline{x}}_{1} = \frac{9 + 6 + 6 + 7 }{4} = 7\]

    \({\overline{x}}_{2}\) ist der Mittelwert der Schlafdauer in der Population der Erwachsene:

    \[{\overline{x}}_{2} = \frac{6 + 9 + 7 + 9 + 9 }{5} = 8\]

    \[\begin{align*} \end{align*}\]

    Damit ist:

    \[\begin{align*} s_1^2 &= \frac{1}{4 - 1}\sum_{i = 1}^{4}{\left( x_{1i} - \overline{x}_{1} \right)^{2}} \\ &= \frac{1}{3}(9 - 7)^2 + (6 - 7)^2 + (6 - 7)^2 + (7 - 7)^2\\ &=2\\s_2^2 &= \frac{1}{5 - 1}\sum_{i = 1}^{5}{\left( x_{2i} - \overline{x}_{2} \right)^{2}} \\ &= \frac{1}{4}(6 - 8)^2 + (9 - 8)^2 + (7 - 8)^2 + (9 - 8)^2 + (9 - 8)^2\\ &=2\\s_{pool}^{2} &= \frac{(n_1 - 1) \cdot s_1^2 + (n_2 - 1) \cdot s_2^2}{n_1 + n_2 - 2} \\&= \frac{3 * 2 + 4 * 2}{7} \\ &= 2 \end{align*}\]

    Da unser Konfidenzniveau \(1 - \alpha = 0.95\) sein soll, suchen wir \(t_{1 - \frac{\alpha}{2}} = t_{1 - \frac{0.05}{2}} = t_{0.975}\).

    Dies ist der Wert für den unter einer t-Verteilung mit \(\nu = n_1 + n_2 - 2 = 4 + 5 - 2 = 7\) gilt, dass \(F\left( t_{0.975} \right) = 0.975\).

    Berechnung von \(t_{0.975}\) in R:

    qt(0.975, 7)
    [1] 2.364624

    Also ist \(t_{0.975} \approx 2.36\).

    Nun können wir in die Formel für das konkrete KI einsetzen:

    \[\begin{align*} I\left( x_{1},\ldots,x_{n} \right) &= \left\lbrack {(\overline{x}}_{1} - {\overline{x}}_{2}) - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{pool}^2}{n_1} + \frac{s_{pool}^2}{n_2}},{(\overline{x}}_{1} - {\overline{x}}_{2}) + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{pool}^2}{n_1} + \frac{s_{pool}^2}{n_2}} \right\rbrack \\ &= \left\lbrack (7 - 8) - 2.36 \cdot \sqrt{\frac{2}{4} + \frac{2}{5}},(7 - 8) + 2.36 \cdot \sqrt{\frac{2}{4} + \frac{2}{5}} \right\rbrack \\ &\approx \lbrack -3.24, 1.24 \rbrack \end{align*}\]

  1. Sie interessieren sich dafür, welchen Einfluss Meditation auf die durchschnittliche Konzentrationsfähigkeit von Studenten hat. Hierfür ziehen Sie eine einfache Zufallsstichprobe von 6 Studenten und messen die (stetige) Konzentrationsfähigkeit (in Punkten) einmal vor und einmal nach der Meditation. Vor der Meditation messen Sie die Werte 25, 39, 27, 31, 20 und 24 und nach der Meditation die Werte 59, 55, 42, 52, 44 und 50.

    Berechnen Sie ein 0.95-Konfidenzintervall für die Differenz der durchschnittlichen Konzentrationsfähigkeit der Studenten vor und nach der Meditation und interpretieren Sie dieses.

    Verwenden Sie für die Berechnung des Quantils \(t_{1 - \frac{\alpha}{2}}\) die Funktion qt in R.

    Aufgrund der Messwiederholung liegen abhängige Stichproben vor. Wir müssen also das konkrete Konfidenzintervall für \(\mu_{1} - \mu_{2}\) bei abhängigen Stichproben berechnen.

    Formel:

    \[I\left( x_{1},\ldots,x_{n} \right) = \left\lbrack {(\overline{x}}_{1} - {\overline{x}}_{2}) - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{Diff}^2}{n}},{(\overline{x}}_{1} - {\overline{x}}_{2}) + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{Diff}^2}{n}} \right\rbrack\]

    Wir benötigen also \({\overline{x}}_{1}\), \({\overline{x}}_{2}\), \(s_{Diff}^{2}\), \(t_{1 - \frac{\alpha}{2}}\) und \(n\).

    \(n\) entspricht der Anzahl an Studenten in der Stichprobe, daher ist \(n=\) 6

    \({\overline{x}}_{1}\) ist der Mittelwert der Konzentrationsfähigkeit vor der Meditation:

    \[{\overline{x}}_{1} = \frac{25 + 39 + 27 + 31 + 20 + 24}{6} = 27.667\]

    \({\overline{x}}_{2}\) ist der Mittelwert der Konzentrationsfähigkeit nach der Meditation:

    \[{\overline{x}}_{2} = \frac{59 + 55 + 42 + 52 + 44 + 50}{6} = 50.333\]

    \(s_{Diff}^{2}\) ist die korrigierte empirische Varianz der Differenzen \(x_{i Diff} = x_{1i} - x_{2i}\), d.h. der Differenzen der Studenten in der Konzentrationsfähigkeit vor und nach der Meditation:

    \[\begin{align*} &x_{1\ Diff} = x_{11} - x_{21} = 25 - 59 = -34 \\ &x_{2\ Diff} = x_{12} - x_{22} = 39 - 55 = -16 \\ &x_{3\ Diff} = x_{13} - x_{23} = 27 - 42 = -15 \\ &x_{4\ Diff} = x_{14} - x_{24} = 31 - 52 = -21 \\ &x_{5\ Diff} = x_{15} - x_{25} = 20 - 44 = -24 \\ &x_{6\ Diff} = x_{16} - x_{26} = 24 - 50 = -26 \end{align*}\]

    Der Mittelwert dieser Differenzen ist:

    \[{\overline{x}}_{Diff} = \frac{ -34 -16 -15 -21 -24 -26 }{ 6 } = -22.67 \]

    Damit ist:

    \[\begin{align*} s_{Diff}^{2} &= \frac{1}{6 - 1}\sum_{i = 1}^{6}{\left( x_{i\ Diff} - {\overline{x}}_{Diff} \right)^{2}} \\&= \frac{1}{6 - 1}\left\lbrack (-34 + 22.67)^2 + (-16 + 22.67)^2 + (-15 + 22.67)^2 + (-21 + 22.67)^2 + (-24 + 22.67)^2 + (-26 + 22.67)^2 \right\rbrack \\ &\approx 49.47 \end{align*}\]

    Da unser Konfidenzniveau \(1 - \alpha = 0.95\) sein soll, suchen wir \(t_{1 - \frac{\alpha}{2}} = t_{1 - \frac{0.05}{2}} = t_{0.975}\).

    Dies ist der Wert für den unter einer t-Verteilung mit \(\nu = n - 1 = 6 - 1 = 5\) gilt, dass \(F\left( t_{0.975} \right) = 0.975\).

    Berechnung von \(t_{0.975}\) in R:

    qt(0.975, 5)
    [1] 2.570582

    Also ist \(t_{0.975} \approx 2.57\).

    Nun können wir in die Formel für das konkrete KI einsetzen:

    \[\begin{align*} I\left( x_{1},\ldots,x_{n} \right) &= \left\lbrack {(\overline{x}}_{1} - {\overline{x}}_{2}) - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{Diff}^2}{n}},{(\overline{x}}_{1} - {\overline{x}}_{2}) + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{Diff}^2}{n}} \right\rbrack \\ &= \left\lbrack (27.667 - 50.333) - 2.57 \cdot \sqrt{\frac{49.47}{6}},(27.667 - 50.333) + 2.57 \cdot \sqrt{\frac{49.47}{6}} \right\rbrack \\ &\approx \lbrack -30.05, -15.29 \rbrack \end{align*}\]

  1. Sie interessieren sich dafür, wie stark sich Studenten und Schüler in ihrer durchschnittlichen Konzentrationsfähigkeit unterscheiden. Sie ziehen hierfür eine einfache Zufallsstichprobe der Größe 5 aus der Population der Studenten und eine einfache Zufallsstichprobe der Größe 4 aus der Population der Schüler. Die von Ihnen gezogenen Studenten weisen jeweils eine Konzentrationsfähigkeit (in Punkten) von 23, 40, 33, 22 und 30 auf. Die von Ihnen gezogenen Schüler weisen jeweils eine Konzentrationsfähigkeit von 48, 45, 46 und 35 auf.

    Berechnen Sie ein 0.95-Konfidenzintervall für die Differenz der durchschnittlichen Konzentrationsfähigkeit von Studenten und Schüler und interpretieren Sie dieses.

    Verwenden Sie für die Berechnung des Quantils \(t_{1 - \frac{\alpha}{2}}\) die Funktion qt in R.

    Da sich in der Stichprobe der Studenten und in der Stichprobe der Schüler unterschiedliche Personen befinden, liegen unabhängige Stichproben vor. Wir müssen also das konkrete Konfidenzintervall für \(\mu_{1} - \mu_{2}\) bei unabhängigen Stichproben berechnen.

    Formel:

    \[I\left( x_{1},\ldots,x_{n} \right) = \left\lbrack {(\overline{x}}_{1} - {\overline{x}}_{2}) - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{pool}^2}{n_1} + \frac{s_{pool}^2}{n_2}},{(\overline{x}}_{1} - {\overline{x}}_{2}) + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{pool}^2}{n_1} + \frac{s_{pool}^2}{n_2}} \right\rbrack\]

    Wir benötigen also \({\overline{x}}_{1}\), \({\overline{x}}_{2}\), \(s_{pool}^{2}\), \(t_{1 - \frac{\alpha}{2}}\), \(n_{1}\) und \(n_{2}\).

    \(n_{1}\) entspricht der Anzahl an Studenten in der Stichprobe der Studenten , daher ist \(n_{1}=\) 5

    \(n_{2}\) entspricht der Anzahl an Schüler in der Stichprobe der Schüler , daher ist \(n_{2}=\) 4

    \({\overline{x}}_{1}\) ist der Mittelwert der Konzentrationsfähigkeit in der Population der Studenten:

    \[{\overline{x}}_{1} = \frac{23 + 40 + 33 + 22 + 30 }{5} = 29.6\]

    \({\overline{x}}_{2}\) ist der Mittelwert der Konzentrationsfähigkeit in der Population der Schüler:

    \[{\overline{x}}_{2} = \frac{48 + 45 + 46 + 35 }{4} = 43.5\]

    \[\begin{align*} \end{align*}\]

    Damit ist:

    \[\begin{align*} s_1^2 &= \frac{1}{5 - 1}\sum_{i = 1}^{5}{\left( x_{1i} - \overline{x}_{1} \right)^{2}} \\ &= \frac{1}{4}(23 - 29.6)^2 + (40 - 29.6)^2 + (33 - 29.6)^2 + (22 - 29.6)^2 + (30 - 29.6)^2\\ &=55.3\\s_2^2 &= \frac{1}{4 - 1}\sum_{i = 1}^{4}{\left( x_{2i} - \overline{x}_{2} \right)^{2}} \\ &= \frac{1}{3}(48 - 43.5)^2 + (45 - 43.5)^2 + (46 - 43.5)^2 + (35 - 43.5)^2\\ &=33.67\\s_{pool}^{2} &= \frac{(n_1 - 1) \cdot s_1^2 + (n_2 - 1) \cdot s_2^2}{n_1 + n_2 - 2} \\&= \frac{4 * 55.3 + 3 * 33.67}{7} \\ &= 46.03 \end{align*}\]

    Da unser Konfidenzniveau \(1 - \alpha = 0.95\) sein soll, suchen wir \(t_{1 - \frac{\alpha}{2}} = t_{1 - \frac{0.05}{2}} = t_{0.975}\).

    Dies ist der Wert für den unter einer t-Verteilung mit \(\nu = n_1 + n_2 - 2 = 5 + 4 - 2 = 7\) gilt, dass \(F\left( t_{0.975} \right) = 0.975\).

    Berechnung von \(t_{0.975}\) in R:

    qt(0.975, 7)
    [1] 2.364624

    Also ist \(t_{0.975} \approx 2.36\).

    Nun können wir in die Formel für das konkrete KI einsetzen:

    \[\begin{align*} I\left( x_{1},\ldots,x_{n} \right) &= \left\lbrack {(\overline{x}}_{1} - {\overline{x}}_{2}) - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{pool}^2}{n_1} + \frac{s_{pool}^2}{n_2}},{(\overline{x}}_{1} - {\overline{x}}_{2}) + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{pool}^2}{n_1} + \frac{s_{pool}^2}{n_2}} \right\rbrack \\ &= \left\lbrack (29.6 - 43.5) - 2.36 \cdot \sqrt{\frac{46.03}{5} + \frac{46.03}{4}},(29.6 - 43.5) + 2.36 \cdot \sqrt{\frac{46.03}{5} + \frac{46.03}{4}} \right\rbrack \\ &\approx \lbrack -24.64, -3.16 \rbrack \end{align*}\]

  1. Sie interessieren sich dafür, welchen Einfluss Lichttherapie auf die durchschnittliche Lebensqualität von Psychiatriepatienten hat. Hierfür ziehen Sie eine einfache Zufallsstichprobe von 5 Psychiatriepatienten und messen die (stetige) Lebensqualität (in Jahren) einmal vor und einmal nach der Lichttherapie. Vor der Lichttherapie messen Sie die Werte 23, 39, 22, 38 und 26 und nach der Lichttherapie die Werte 28, 26, 29, 24 und 20.

    Berechnen Sie ein 0.95-Konfidenzintervall für die Differenz der durchschnittlichen Lebensqualität der Psychiatriepatienten vor und nach der Lichttherapie und interpretieren Sie dieses.

    Verwenden Sie für die Berechnung des Quantils \(t_{1 - \frac{\alpha}{2}}\) die Funktion qt in R.

    Aufgrund der Messwiederholung liegen abhängige Stichproben vor. Wir müssen also das konkrete Konfidenzintervall für \(\mu_{1} - \mu_{2}\) bei abhängigen Stichproben berechnen.

    Formel:

    \[I\left( x_{1},\ldots,x_{n} \right) = \left\lbrack {(\overline{x}}_{1} - {\overline{x}}_{2}) - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{Diff}^2}{n}},{(\overline{x}}_{1} - {\overline{x}}_{2}) + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{Diff}^2}{n}} \right\rbrack\]

    Wir benötigen also \({\overline{x}}_{1}\), \({\overline{x}}_{2}\), \(s_{Diff}^{2}\), \(t_{1 - \frac{\alpha}{2}}\) und \(n\).

    \(n\) entspricht der Anzahl an Psychiatriepatienten in der Stichprobe, daher ist \(n=\) 5

    \({\overline{x}}_{1}\) ist der Mittelwert der Lebensqualität vor der Lichttherapie:

    \[{\overline{x}}_{1} = \frac{23 + 39 + 22 + 38 + 26 }{5} = 29.6\]

    \({\overline{x}}_{2}\) ist der Mittelwert der Lebensqualität nach der Lichttherapie:

    \[{\overline{x}}_{2} = \frac{28 + 26 + 29 + 24 + 20 }{5} = 25.4\]

    \(s_{Diff}^{2}\) ist die korrigierte empirische Varianz der Differenzen \(x_{i Diff} = x_{1i} - x_{2i}\), d.h. der Differenzen der Psychiatriepatienten in der Lebensqualität vor und nach der Lichttherapie:

    \[\begin{align*} &x_{1\ Diff} = x_{11} - x_{21} = 23 - 28 = -5 \\ &x_{2\ Diff} = x_{12} - x_{22} = 39 - 26 = 13 \\ &x_{3\ Diff} = x_{13} - x_{23} = 22 - 29 = -7 \\ &x_{4\ Diff} = x_{14} - x_{24} = 38 - 24 = 14 \\ &x_{5\ Diff} = x_{15} - x_{25} = 26 - 20 = 6 \end{align*}\]

    Der Mittelwert dieser Differenzen ist:

    \[{\overline{x}}_{Diff} = \frac{ -5 + 13 -7 + 14 + 6 }{ 5 } = 4.2 \]

    Damit ist:

    \[\begin{align*} s_{Diff}^{2} &= \frac{1}{5 - 1}\sum_{i = 1}^{5}{\left( x_{i\ Diff} - {\overline{x}}_{Diff} \right)^{2}} \\&= \frac{1}{5 - 1}\left\lbrack (-5 - 4.2)^2 + (13 - 4.2)^2 + (-7 - 4.2)^2 + (14 - 4.2)^2 + (6 - 4.2)^2 \right\rbrack \\ &\approx 96.7 \end{align*}\]

    Da unser Konfidenzniveau \(1 - \alpha = 0.95\) sein soll, suchen wir \(t_{1 - \frac{\alpha}{2}} = t_{1 - \frac{0.05}{2}} = t_{0.975}\).

    Dies ist der Wert für den unter einer t-Verteilung mit \(\nu = n - 1 = 5 - 1 = 4\) gilt, dass \(F\left( t_{0.975} \right) = 0.975\).

    Berechnung von \(t_{0.975}\) in R:

    qt(0.975, 4)
    [1] 2.776445

    Also ist \(t_{0.975} \approx 2.78\).

    Nun können wir in die Formel für das konkrete KI einsetzen:

    \[\begin{align*} I\left( x_{1},\ldots,x_{n} \right) &= \left\lbrack {(\overline{x}}_{1} - {\overline{x}}_{2}) - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{Diff}^2}{n}},{(\overline{x}}_{1} - {\overline{x}}_{2}) + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{Diff}^2}{n}} \right\rbrack \\ &= \left\lbrack (29.6 - 25.4) - 2.78 \cdot \sqrt{\frac{96.7}{5}},(29.6 - 25.4) + 2.78 \cdot \sqrt{\frac{96.7}{5}} \right\rbrack \\ &\approx \lbrack -8.03, 16.43 \rbrack \end{align*}\]

  1. Sie interessieren sich dafür, wie stark sich Psychiatriepatienten und Gesunde in ihrer durchschnittlichen Lebensqualität unterscheiden. Sie ziehen hierfür eine einfache Zufallsstichprobe der Größe 4 aus der Population der Psychiatriepatienten und eine einfache Zufallsstichprobe der Größe 5 aus der Population der Gesunden. Die von Ihnen gezogenen Psychiatriepatienten weisen jeweils eine Lebensqualität (in Jahren) von 31, 24, 20 und 33 auf. Die von Ihnen gezogenen Gesunden weisen jeweils eine Lebensqualität von 33, 35, 29, 33 und 30 auf.

    Berechnen Sie ein 0.95-Konfidenzintervall für die Differenz der durchschnittlichen Lebensqualität von Psychiatriepatienten und Gesunden und interpretieren Sie dieses.

    Verwenden Sie für die Berechnung des Quantils \(t_{1 - \frac{\alpha}{2}}\) die Funktion qt in R.

    Da sich in der Stichprobe der Psychiatriepatienten und in der Stichprobe der Gesunden unterschiedliche Personen befinden, liegen unabhängige Stichproben vor. Wir müssen also das konkrete Konfidenzintervall für \(\mu_{1} - \mu_{2}\) bei unabhängigen Stichproben berechnen.

    Formel:

    \[I\left( x_{1},\ldots,x_{n} \right) = \left\lbrack {(\overline{x}}_{1} - {\overline{x}}_{2}) - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{pool}^2}{n_1} + \frac{s_{pool}^2}{n_2}},{(\overline{x}}_{1} - {\overline{x}}_{2}) + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{pool}^2}{n_1} + \frac{s_{pool}^2}{n_2}} \right\rbrack\]

    Wir benötigen also \({\overline{x}}_{1}\), \({\overline{x}}_{2}\), \(s_{pool}^{2}\), \(t_{1 - \frac{\alpha}{2}}\), \(n_{1}\) und \(n_{2}\).

    \(n_{1}\) entspricht der Anzahl an Psychiatriepatienten in der Stichprobe der Psychiatriepatienten , daher ist \(n_{1}=\) 4

    \(n_{2}\) entspricht der Anzahl an Gesunden in der Stichprobe der Gesunden , daher ist \(n_{2}=\) 5

    \({\overline{x}}_{1}\) ist der Mittelwert der Lebensqualität in der Population der Psychiatriepatienten:

    \[{\overline{x}}_{1} = \frac{31 + 24 + 20 + 33 }{4} = 27\]

    \({\overline{x}}_{2}\) ist der Mittelwert der Lebensqualität in der Population der Gesunde:

    \[{\overline{x}}_{2} = \frac{33 + 35 + 29 + 33 + 30 }{5} = 32\]

    \[\begin{align*} \end{align*}\]

    Damit ist:

    \[\begin{align*} s_1^2 &= \frac{1}{4 - 1}\sum_{i = 1}^{4}{\left( x_{1i} - \overline{x}_{1} \right)^{2}} \\ &= \frac{1}{3}(31 - 27)^2 + (24 - 27)^2 + (20 - 27)^2 + (33 - 27)^2\\ &=36.67\\s_2^2 &= \frac{1}{5 - 1}\sum_{i = 1}^{5}{\left( x_{2i} - \overline{x}_{2} \right)^{2}} \\ &= \frac{1}{4}(33 - 32)^2 + (35 - 32)^2 + (29 - 32)^2 + (33 - 32)^2 + (30 - 32)^2\\ &=6\\s_{pool}^{2} &= \frac{(n_1 - 1) \cdot s_1^2 + (n_2 - 1) \cdot s_2^2}{n_1 + n_2 - 2} \\&= \frac{3 * 36.67 + 4 * 6}{7} \\ &= 19.14 \end{align*}\]

    Da unser Konfidenzniveau \(1 - \alpha = 0.95\) sein soll, suchen wir \(t_{1 - \frac{\alpha}{2}} = t_{1 - \frac{0.05}{2}} = t_{0.975}\).

    Dies ist der Wert für den unter einer t-Verteilung mit \(\nu = n_1 + n_2 - 2 = 4 + 5 - 2 = 7\) gilt, dass \(F\left( t_{0.975} \right) = 0.975\).

    Berechnung von \(t_{0.975}\) in R:

    qt(0.975, 7)
    [1] 2.364624

    Also ist \(t_{0.975} \approx 2.36\).

    Nun können wir in die Formel für das konkrete KI einsetzen:

    \[\begin{align*} I\left( x_{1},\ldots,x_{n} \right) &= \left\lbrack {(\overline{x}}_{1} - {\overline{x}}_{2}) - t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{pool}^2}{n_1} + \frac{s_{pool}^2}{n_2}},{(\overline{x}}_{1} - {\overline{x}}_{2}) + t_{1 - \frac{\alpha}{2}} \cdot \sqrt{\frac{s_{pool}^2}{n_1} + \frac{s_{pool}^2}{n_2}} \right\rbrack \\ &= \left\lbrack (27 - 32) - 2.36 \cdot \sqrt{\frac{19.14}{4} + \frac{19.14}{5}},(27 - 32) + 2.36 \cdot \sqrt{\frac{19.14}{4} + \frac{19.14}{5}} \right\rbrack \\ &\approx \lbrack -11.93, 1.93 \rbrack \end{align*}\]

  1. Sie interessieren sich für die durchschnittliche (stetige) Lerndauer von PsychologiestudentInnen und ChemiestudentInnen und ziehen hierfür je eine Stichprobe aus der Population der PsychologiestudentInnen und aus der Population der ChemiestudentInnen. Gehen Sie von folgender Ausgangssituation aus:

    Stichprobe der PsychologiestudentInnen: \(X_{1i} \overset{\mathrm{iid}}{\sim}\ N\left( \mu_{1},\sigma^{2} \right)\) mit \(i = 1,\ 2,\ \ldots,\ n_{1}\)

    Stichprobe der ChemiestudentInnen: \(X_{2i} \overset{\mathrm{iid}}{\sim}\ N\left( \mu_{2},\sigma^{2} \right)\) mit \(i = 1,\ 2,\ \ldots,\ n_{2}\)

    1. Welchen deskriptivstatistischen Größen in den Populationen entsprechen die Parameter \(\mu_{1}\), \(\mu_{2}\) und \(\sigma^{2}\) unter diesen Voraussetzungen jeweils?

      \(\mu_{1}\) entspricht der mittleren Lerndauer in der Population der PsychologiestudentInnen.

      \(\mu_{2}\) entspricht der mittleren Lerndauer in der Population der ChemiestudentInnen.

      \(\sigma^{2}\) entspricht der empirischen Varianz der Lerndauer sowohl in der Population der PsychologiestudentInnen als auch in der Population der ChemiestudentInnen.

    2. Wie können Sie die Realisationen \(x_{17}\) und \(x_{23}\) interpretieren?

      \(x_{17}\) ist die Lerndauer der 7. gezogenen Person aus der Population der PsychologiestudentInnen.

      \(x_{23}\) ist die Lerndauer der 3. gezogenen Person aus der Population der ChemiestudentInnen.

    3. Geben Sie die Wahrscheinlichkeitsverteilungen \(P_{\bar{X}_1}\), \(P_{\bar{X}_2}\) und \(P_{{\bar{X}}_{Diff}}\) an.

      \[\begin{align*} &\bar{X_1} \sim N(\mu_1, \frac{\sigma^2}{n_1}) \\ &\bar{X_2} \sim N(\mu_2, \frac{\sigma^2}{n_2}) \\ &\bar{X}_{Diff} \sim N(\mu_1 - \mu_2, \frac{\sigma^{2}}{n_{1}} + \frac{\sigma^{2}}{n_{2}}) \end{align*}\]

    4. Wie können Sie die Realisation \({\bar{x}}_{Diff}\) von \(\bar{X}_{Diff}\) interpretieren?

      \({\bar{x}}_{Diff}\) ist die Differenz zwischen dem Mittelwert der Lerndauer in der Stichprobe der PsychologiestudentInnen und dem Mittelwert der Lerndauer in der Stichprobe der ChemiestudentInnen.

      Damit ist \({\bar{x}}_{Diff}\) ein Schätzwert für \(\mu_{1} - \mu_{2}\), also für die Differenz zwischen dem Mittelwert der Lerndauer in der Population der PsychologiestudentInnen und dem Mittelwert der Lerndauer in der Population der ChemiestudentInnen.

    5. Geben Sie eine geeignete Schätzfunktion für die empirische Varianz der Lerndauer sowohl in der Population der PsychologiestudentInnen als auch in der Population der ChemiestudentInnen an.

      \[S_{pool}^{2} = \frac{(n_1 - 1) \cdot S_1^2 + (n_2 - 1) \cdot S_2^2}{n_1 + n_2 - 2}\]

  1. Sie interessieren sich für den durchschnittlichen (stetigen) Jahresumsatz von BMW CEOs und VW CEOs und ziehen hierfür je eine Stichprobe aus der Population der BMW CEOs und aus der Population der VW CEOs. Gehen Sie von folgender Ausgangssituation aus:

    Stichprobe der BMW CEOs: \(X_{1i} \overset{\mathrm{iid}}{\sim}\ N\left( \mu_{1},\sigma^{2} \right)\) mit \(i = 1,\ 2,\ \ldots,\ n_{1}\)

    Stichprobe der VW CEOs: \(X_{2i} \overset{\mathrm{iid}}{\sim}\ N\left( \mu_{2},\sigma^{2} \right)\) mit \(i = 1,\ 2,\ \ldots,\ n_{2}\)

    1. Welchen deskriptivstatistischen Größen in den Populationen entsprechen die Parameter \(\mu_{1}\), \(\mu_{2}\) und \(\sigma^{2}\) unter diesen Voraussetzungen jeweils?

      \(\mu_{1}\) entspricht dem mittleren Jahresumsatz in der Population der BMW CEOs.

      \(\mu_{2}\) entspricht dem mittleren Jahresumsatz in der Population der VW CEOs.

      \(\sigma^{2}\) entspricht der empirischen Varianz des Jahresumsatz sowohl in der Population der BMW CEOs als auch in der Population der VW CEOs.

    2. Wie können Sie die Realisationen \(x_{15}\) und \(x_{24}\) interpretieren?

      \(x_{15}\) ist der Jahresumsatz der 5. gezogenen Person aus der Population der BMW CEOs.

      \(x_{24}\) ist der Jahresumsatz der 4. gezogenen Person aus der Population der VW CEOs.

    3. Geben Sie die Wahrscheinlichkeitsverteilungen \(P_{\bar{X}_1}\), \(P_{\bar{X}_2}\) und \(P_{{\bar{X}}_{Diff}}\) an.

      \[\begin{align*} &\bar{X_1} \sim N(\mu_1, \frac{\sigma^2}{n_1}) \\ &\bar{X_2} \sim N(\mu_2, \frac{\sigma^2}{n_2}) \\ &\bar{X}_{Diff} \sim N(\mu_1 - \mu_2, \frac{\sigma^{2}}{n_{1}} + \frac{\sigma^{2}}{n_{2}}) \end{align*}\]

    4. Wie können Sie die Realisation \({\bar{x}}_{Diff}\) von \(\bar{X}_{Diff}\) interpretieren?

      \({\bar{x}}_{Diff}\) ist die Differenz zwischen dem Mittelwert des Jahresumsatz in der Stichprobe der BMW CEOs und dem Mittelwert des Jahresumsatz in der Stichprobe der VW CEOs.

      Damit ist \({\bar{x}}_{Diff}\) ein Schätzwert für \(\mu_{1} - \mu_{2}\), also für die Differenz zwischen dem Mittelwert des Jahresumsatz in der Population der BMW CEOs und dem Mittelwert des Jahresumsatz in der Population der VW CEOs.

    5. Geben Sie eine geeignete Schätzfunktion für die empirische Varianz des Jahresumsatz sowohl in der Population der BMW CEOs als auch in der Population der VW CEOs an.

      \[S_{pool}^{2} = \frac{(n_1 - 1) \cdot S_1^2 + (n_2 - 1) \cdot S_2^2}{n_1 + n_2 - 2}\]

  1. Sie interessieren sich für den durchschnittlichen (stetigen) Blutdruck von Rentnern und Berufstätigen und ziehen hierfür je eine Stichprobe aus der Population der Rentner und aus der Population der Berufstätigen. Gehen Sie von folgender Ausgangssituation aus:

    Stichprobe der Rentner: \(X_{1i} \overset{\mathrm{iid}}{\sim}\ N\left( \mu_{1},\sigma^{2} \right)\) mit \(i = 1,\ 2,\ \ldots,\ n_{1}\)

    Stichprobe der Berufstätigen: \(X_{2i} \overset{\mathrm{iid}}{\sim}\ N\left( \mu_{2},\sigma^{2} \right)\) mit \(i = 1,\ 2,\ \ldots,\ n_{2}\)

    1. Welchen deskriptivstatistischen Größen in den Populationen entsprechen die Parameter \(\mu_{1}\), \(\mu_{2}\) und \(\sigma^{2}\) unter diesen Voraussetzungen jeweils?

      \(\mu_{1}\) entspricht dem mittleren Blutdruck in der Population der Rentner.

      \(\mu_{2}\) entspricht dem mittleren Blutdruck in der Population der Berufstätigen.

      \(\sigma^{2}\) entspricht der empirischen Varianz des Blutdrucks sowohl in der Population der Rentner als auch in der Population der Berufstätigen.

    2. Wie können Sie die Realisationen \(x_{15}\) und \(x_{26}\) interpretieren?

      \(x_{15}\) ist der Blutdruck der 5. gezogenen Person aus der Population der Rentner.

      \(x_{26}\) ist der Blutdruck der 6. gezogenen Person aus der Population der Berufstätigen.

    3. Geben Sie die Wahrscheinlichkeitsverteilungen \(P_{\bar{X}_1}\), \(P_{\bar{X}_2}\) und \(P_{{\bar{X}}_{Diff}}\) an.

      \[\begin{align*} &\bar{X_1} \sim N(\mu_1, \frac{\sigma^2}{n_1}) \\ &\bar{X_2} \sim N(\mu_2, \frac{\sigma^2}{n_2}) \\ &\bar{X}_{Diff} \sim N(\mu_1 - \mu_2, \frac{\sigma^{2}}{n_{1}} + \frac{\sigma^{2}}{n_{2}}) \end{align*}\]

    4. Wie können Sie die Realisation \({\bar{x}}_{Diff}\) von \(\bar{X}_{Diff}\) interpretieren?

      \({\bar{x}}_{Diff}\) ist die Differenz zwischen dem Mittelwert des Blutdrucks in der Stichprobe der Rentner und dem Mittelwert des Blutdrucks in der Stichprobe der Berufstätigen.

      Damit ist \({\bar{x}}_{Diff}\) ein Schätzwert für \(\mu_{1} - \mu_{2}\), also für die Differenz zwischen dem Mittelwert des Blutdrucks in der Population der Rentner und dem Mittelwert des Blutdrucks in der Population der Berufstätigen.

    5. Geben Sie eine geeignete Schätzfunktion für die empirische Varianz des Blutdrucks sowohl in der Population der Rentner als auch in der Population der Berufstätigen an.

      \[S_{pool}^{2} = \frac{(n_1 - 1) \cdot S_1^2 + (n_2 - 1) \cdot S_2^2}{n_1 + n_2 - 2}\]

  1. Sie interessieren sich für die durchschnittliche (stetige) Arbeitszufriedenheit von Informatikern und Anwälten und ziehen hierfür je eine Stichprobe aus der Population der Informatiker und aus der Population der Anwälte. Gehen Sie von folgender Ausgangssituation aus:

    Stichprobe der Informatiker: \(X_{1i} \overset{\mathrm{iid}}{\sim}\ N\left( \mu_{1},\sigma^{2} \right)\) mit \(i = 1,\ 2,\ \ldots,\ n_{1}\)

    Stichprobe der Anwälte: \(X_{2i} \overset{\mathrm{iid}}{\sim}\ N\left( \mu_{2},\sigma^{2} \right)\) mit \(i = 1,\ 2,\ \ldots,\ n_{2}\)

    1. Welchen deskriptivstatistischen Größen in den Populationen entsprechen die Parameter \(\mu_{1}\), \(\mu_{2}\) und \(\sigma^{2}\) unter diesen Voraussetzungen jeweils?

      \(\mu_{1}\) entspricht der mittleren Arbeitszufriedenheit in der Population der Informatiker.

      \(\mu_{2}\) entspricht der mittleren Arbeitszufriedenheit in der Population der Anwälte.

      \(\sigma^{2}\) entspricht der empirischen Varianz der Arbeitszufriedenheit sowohl in der Population der Informatiker als auch in der Population der Anwälte.

    2. Wie können Sie die Realisationen \(x_{17}\) und \(x_{24}\) interpretieren?

      \(x_{17}\) ist die Arbeitszufriedenheit der 7. gezogenen Person aus der Population der Informatiker.

      \(x_{24}\) ist die Arbeitszufriedenheit der 4. gezogenen Person aus der Population der Anwälte.

    3. Geben Sie die Wahrscheinlichkeitsverteilungen \(P_{\bar{X}_1}\), \(P_{\bar{X}_2}\) und \(P_{{\bar{X}}_{Diff}}\) an.

      \[\begin{align*} &\bar{X_1} \sim N(\mu_1, \frac{\sigma^2}{n_1}) \\ &\bar{X_2} \sim N(\mu_2, \frac{\sigma^2}{n_2}) \\ &\bar{X}_{Diff} \sim N(\mu_1 - \mu_2, \frac{\sigma^{2}}{n_{1}} + \frac{\sigma^{2}}{n_{2}}) \end{align*}\]

    4. Wie können Sie die Realisation \({\bar{x}}_{Diff}\) von \(\bar{X}_{Diff}\) interpretieren?

      \({\bar{x}}_{Diff}\) ist die Differenz zwischen dem Mittelwert der Arbeitszufriedenheit in der Stichprobe der Informatiker und dem Mittelwert der Arbeitszufriedenheit in der Stichprobe der Anwälte.

      Damit ist \({\bar{x}}_{Diff}\) ein Schätzwert für \(\mu_{1} - \mu_{2}\), also für die Differenz zwischen dem Mittelwert der Arbeitszufriedenheit in der Population der Informatiker und dem Mittelwert der Arbeitszufriedenheit in der Population der Anwälte.

    5. Geben Sie eine geeignete Schätzfunktion für die empirische Varianz der Arbeitszufriedenheit sowohl in der Population der Informatiker als auch in der Population der Anwälte an.

      \[S_{pool}^{2} = \frac{(n_1 - 1) \cdot S_1^2 + (n_2 - 1) \cdot S_2^2}{n_1 + n_2 - 2}\]

  1. Sie interessieren sich für die durchschnittliche (stetige) Nutzerzufriedenheit von Windows-Nutzern und Mac-Nutzern und ziehen hierfür je eine Stichprobe aus der Population der Windows-Nutzer und aus der Population der Mac-Nutzer. Gehen Sie von folgender Ausgangssituation aus:

    Stichprobe der Windows-Nutzer: \(X_{1i} \overset{\mathrm{iid}}{\sim}\ N\left( \mu_{1},\sigma^{2} \right)\) mit \(i = 1,\ 2,\ \ldots,\ n_{1}\)

    Stichprobe der Mac-Nutzer: \(X_{2i} \overset{\mathrm{iid}}{\sim}\ N\left( \mu_{2},\sigma^{2} \right)\) mit \(i = 1,\ 2,\ \ldots,\ n_{2}\)

    1. Welchen deskriptivstatistischen Größen in den Populationen entsprechen die Parameter \(\mu_{1}\), \(\mu_{2}\) und \(\sigma^{2}\) unter diesen Voraussetzungen jeweils?

      \(\mu_{1}\) entspricht der mittleren Nutzerzufriedenheit in der Population der Windows-Nutzer.

      \(\mu_{2}\) entspricht der mittleren Nutzerzufriedenheit in der Population der Mac-Nutzer.

      \(\sigma^{2}\) entspricht der empirischen Varianz der Nutzerzufriedenheit sowohl in der Population der Windows-Nutzer als auch in der Population der Mac-Nutzer.

    2. Wie können Sie die Realisationen \(x_{14}\) und \(x_{28}\) interpretieren?

      \(x_{14}\) ist die Nutzerzufriedenheit der 4. gezogenen Person aus der Population der Windows-Nutzer.

      \(x_{28}\) ist die Nutzerzufriedenheit der 8. gezogenen Person aus der Population der Mac-Nutzer.

    3. Geben Sie die Wahrscheinlichkeitsverteilungen \(P_{\bar{X}_1}\), \(P_{\bar{X}_2}\) und \(P_{{\bar{X}}_{Diff}}\) an.

      \[\begin{align*} &\bar{X_1} \sim N(\mu_1, \frac{\sigma^2}{n_1}) \\ &\bar{X_2} \sim N(\mu_2, \frac{\sigma^2}{n_2}) \\ &\bar{X}_{Diff} \sim N(\mu_1 - \mu_2, \frac{\sigma^{2}}{n_{1}} + \frac{\sigma^{2}}{n_{2}}) \end{align*}\]

    4. Wie können Sie die Realisation \({\bar{x}}_{Diff}\) von \(\bar{X}_{Diff}\) interpretieren?

      \({\bar{x}}_{Diff}\) ist die Differenz zwischen dem Mittelwert der Nutzerzufriedenheit in der Stichprobe der Windows-Nutzer und dem Mittelwert der Nutzerzufriedenheit in der Stichprobe der Mac-Nutzer.

      Damit ist \({\bar{x}}_{Diff}\) ein Schätzwert für \(\mu_{1} - \mu_{2}\), also für die Differenz zwischen dem Mittelwert der Nutzerzufriedenheit in der Population der Windows-Nutzer und dem Mittelwert der Nutzerzufriedenheit in der Population der Mac-Nutzer.

    5. Geben Sie eine geeignete Schätzfunktion für die empirische Varianz der Nutzerzufriedenheit sowohl in der Population der Windows-Nutzer als auch in der Population der Mac-Nutzer an.

      \[S_{pool}^{2} = \frac{(n_1 - 1) \cdot S_1^2 + (n_2 - 1) \cdot S_2^2}{n_1 + n_2 - 2}\]