Übungsaufgaben

Einführung in statistische Hypothesentests II

Hinweis

Die hier veröffentlichten Übungsaufgaben sind brandneu und deshalb noch nicht auf Herz und Nieren überprüft. Sollten Sie Fehler entdecken, geben Sie uns bitte unbedingt eine Rückmeldung an philipp.sckopke(at)psy.lmu.de, damit wir so bald wie möglich eine verbesserte Version online stellen können.

  1. Sie vermuten, dass sich Frühaufsteher in der mittleren (stetigen) Konzentrationsleistung von Langschläfern unterscheiden. Sie können davon ausgehen, dass das Histogramm der Konzentrationsleistung in beiden Populationen jeweils durch die Dichte einer Normalverteilung approximiert werden kann und dass die empirische Varianz in beiden Populationen gleich ist. Sie haben die folgenden Daten aus zwei unabhängigen einfachen Zufallsstichproben vorliegen. Das Signifikanzniveau sei \(\alpha = 0.005\).

    Konzentrationsleistung bei den Frühaufstehern Konzentrationsleistung bei den Langschläfern
    46 49
    44 40
    52 23
    62 42
    38 45
    50 41
    57
    38


    Außerdem sind Ihnen die Mittelwerte: \({\overline{x}}_{1} = 48.67\), \({\overline{x}}_{2} = 41.88\) und die Schätzungen der Standardabweichung \(s_{1}^{2} = 66.67\), \(s_{2}^{2} = 94.98\) bekannt. Der Index 1 steht dabei für die Stichprobe der Frühaufsteher und der Index 2 für die Stichprobe der Langschläfer.

    1. Stellen Sie die inhaltlichen Hypothesen auf.

      \[H_{0}:\ {\overline{x}}_{Pop\_Frühaufsteher} - {\overline{x}}_{Pop\_Langschläfer} = 0\]

      \[H_{1}:\ {\overline{x}}_{Pop\_Frühaufsteher} - {\overline{x}}_{Pop\_Langschläfer} \neq 0\]

    2. Stellen Sie die statistischen Hypothesen auf.

      \[H_{0}:\ \mu_{Frühaufsteher} - \mu_{Langschläfer} = 0\]

      \[H_{1}:\ \mu_{Frühaufsteher} - \mu_{Langschläfer} \neq 0\]

    3. Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothesen?

      Zwei-Stichproben t-Test für ungerichtete Hypothesen und unabhängige Stichproben.

    4. Berechnen Sie die Realisation der Teststatistik per Hand.

      \[\begin{align*} &n_{1} = 6 \\ &n_{2} = 8 \\ &s_{pool}^{2} = \frac{\left( n_{1} - 1 \right) \cdot s_{1}^{2} + \left( n_{2} - 1 \right) \cdot s_{2}^{2}}{n_{1} + n_{2} - 2} = \frac{5 \cdot 66.67 + 7 \cdot 94.98}{12} = 83.18 \\ &t = \frac{{(\overline{x}}_{1} - {\overline{x}}_{2}) - \mu_{0}}{\sqrt{\frac{S_{pool}^{2}}{n_{1}} + \frac{S_{pool}^{2}}{n_{2}}}} = \frac{(48.67 - 41.88) - 0}{\sqrt{\frac{83.18}{6} + \frac{83.18}{8}}} = 1.38 \end{align*}\]

    5. Berechnen Sie den p-Wert mithilfe der pt Funktion.

      Da wir eine ungerichtete Alternativhypothese haben und \(t = 1.38 > 0\) ist, ist der p-Wert

      \[\begin{align*} P\left( T \leq - t\text{~oder~}T \geq t \right) &= P\left( T \leq - t\text{~} \right) + P(T \geq t) \\ &= P\left( T \leq - 1.38\text{~} \right) + P(T \geq 1.38) \\ &= 2 \cdot P(T \leq - 1.38) \\ &= 2 \cdot F(- 1.38) \end{align*}\]

      wobei \(P\) eine t-Verteilung mit \(\nu = n_{1} + n_{2} - 2 = 12\) und \(F\) deren Verteilungsfunktion ist.

      Berechnung mithilfe von pt in R:

      2 * pt(- 1.38,  12)
      [1] 0.1927556
    6. Überprüfen Sie Ihr Ergebnis, indem Sie die Daten als Vektoren x und y in R definieren und den Hypothesentest mit der Funktion t.test(x, y, alternative = "two.sided", paired = FALSE, var.equal = TRUE) durchführen.

      x <- c(46, 44, 52, 62, 38, 50)
      y <- c(49, 40, 23, 42, 45, 41, 57, 38)
      t.test(x, y, alternative = "two.sided", paired = FALSE, var.equal = TRUE)
      
          Two Sample t-test
      
      data:  x and y
      t = 1.3788, df = 12, p-value = 0.1931
      alternative hypothesis: true difference in means is not equal to 0
      95 percent confidence interval:
       -3.940398 17.523732
      sample estimates:
      mean of x mean of y 
       48.66667  41.87500 

      Hinweis: Dadurch, dass bei der Rechnung per Hand zwischendrin immer wieder gerundet wurde, ist es möglich, dass es Unterschiede der Ergebnisse auf den hinteren Nachkommastellen gibt. Das ist natürlich kein Fehler, denn ohne jegliche Rundung würden die Unterschiede verschwinden.

    7. Können Sie davon ausgehen, dass sich in der Population Frühaufsteher in ihrer mittleren Konzentrationsleistung von Langschläfern unterscheiden? Begründen Sie Ihre Entscheidung.

      Da \(p = 0.1927556 > 0.005 = \alpha\) ist, entscheiden wir uns für die Nullhypothese. Wir entscheiden uns also dafür, dass sich Frühaufsteher in der mittleren Konzentrationsleistung von Langschläfern nicht unterscheiden.

  1. Sie vermuten, dass der Anteil von Personen mit roten Haaren an den unter Depression leidenden Personen kleiner ist als 18%. Sie ziehen eine einfache Zufallsstichprobe der Größe \(n = 400\) aus der Population der Depressiven und erfassen von jeder Person die Haarfarbe, um diese Hypothese zu überprüfen. Sie wählen ein Signifikanzniveau von \(\alpha = 0.005\).

    1. Stellen Sie die inhaltlichen Hypothesen auf.

      \[H_{0}:\ h_{rote\_Haare} \geq 0.18\]

      \[H_{1}:\ h_{rote\_Haare} < 0.18\]

    2. Stellen Sie die statistischen Hypothesen auf.

      \[H_{0}:\ \pi \geq 0.18\]

      \[H_{1}:\ \pi < 0.18\]

    3. Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothesen?

      Binomialtest für linksgerichtete Hypothesen.

    4. In Ihrer Stichprobe befinden sich 56 Personen mit roten Haaren. Berechnen Sie den für die Testentscheidung nötigen p-Wert zunächst selbst mithilfe der pbinom Funktion. Überprüfen Sie Ihr Ergebnis dann, indem Sie den p-Wert mit der Funktion in R für den entsprechenden Hypothesentest berechnen.

      Die Realisation \(t\) der Teststatistik \(T\) entspricht der absoluten Häufigkeit der Personen mit roten Haaren in der Stichprobe, da sich die inhaltlichen Hypothesen auf die relative Häufigkeit der Personen mit roten Haaren in der Population beziehen.

      Die Realisation der Teststatistik \(T\) ist somit \(t = 56\).

      Da wir eine linksgerichtete Alternativhypothese haben, ist der p-Wert

      \(P(T \leq t) = P(T \leq 56) = F(56)\),

      wobei \(P\) eine Binomialverteilung mit \(n = 400\) und \(\pi = \pi_{0} = 0.18\) und \(F\) deren Verteilungsfunktion ist.

      Berechnung mithilfe von pbinom in R:

      pbinom(56, size = 400, prob = 0.18)
      [1] 0.01944413

      Überprüfung mit binom.test:

      binom.test(56, n = 400, p = 0.18, alternative = "less")
      
          Exact binomial test
      
      data:  n1 and 400
      number of successes = 56, number of trials = 400, p-value = 0.01944
      alternative hypothesis: true probability of success is less than 0.18
      95 percent confidence interval:
       0.000000 0.171777
      sample estimates:
      probability of success 
                        0.14 
    5. Welche Testentscheidung treffen Sie? Begründen und interpretieren Sie diese.

      Da \(p = 0.0194 > 0.005 = \alpha\) ist, entscheiden wir uns für die \(H_{0}\). Wir entscheiden uns also dafür, dass der Anteil der Personen mit roten Haaren an den unter einer Depression leidenden Personen der Population nicht kleiner ist als 18 %.

  1. Aus Ihrer Theorie ergibt sich, dass Studentinnen in ihrer (stetigen) Selbstwirksamkeit im Durchschnitt einen Wert von größer als 32 aufweisen sollten. Sie können davon ausgehen, dass das Histogramm der Werte der Selbstwirksamkeit in der Population durch die Dichte einer Normalverteilung approximiert werden kann und eine einfache Zufallsstichprobe gezogen wird.

    1. Stellen Sie die inhaltlichen Hypothesen auf.

      \[H_{0}:{\overline{x}}_{S} \leq 32\]

      \[H_{1}:{\overline{x}}_{S} > 32\]

    2. Stellen Sie die statistischen Hypothesen auf.

      \[H_{0}:\mu \leq 32\]

      \[H_{1}:\mu > 32\]

    3. Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothese?

      Hypothesentest über \(\mu\) (t-Test) für eine Stichprobe für eine rechtsgerichtete Hypothese.

    4. Sie haben folgende Daten aus einer einfachen Zufallsstichprobe vorliegen:

      Person Selbstwirksamkeit
      1 42
      2 41
      3 41

      Der Mittelwert beträgt in der Stichprobe \(\overline{x} = 41.33\) und als Schätzung der Populationsvarianz erhalten Sie den Wert \(s^2 = 0.33\).

      Berechnen Sie die Realisation der Teststatistik und daraus mit Hilfe der Funktion pt() den p-Wert, um eine Testentscheidung treffen zu können.

      Die Realisation der Teststatistik berechnet sich aus der Formel

      \[t = \frac{\overline{x} - \mu_{0}}{\sqrt{\frac{s^{2}}{n}}}\]

      \(\mu_{0} = 32\) ergibt sich aus unseren Hypothesen. Da wir 3 Studentinnen in unserer Stichprobe haben, ist \(n = 3\).

      Wir müssen also noch \(\overline{x}\) und \(s^{2}\) berechnen.

      \[\begin{align*} \overline{x} &= \frac{1}{n}\sum_{i = 1}^{n}x_{i} = \frac{42 + 41 + 41}{3} = 41.33 \\ s^{2} &= \frac{1}{n - 1}\sum_{i = 1}^{n}\left( x_{i} - \overline{x} \right)^{2} = \\ &=\frac{(42 - 41.33)^2 + (41 - 41.33)^2 + (41 - 41.33)^2}{2} = 0.33 \end{align*}\]

      Einsetzen ergibt:

      \[t = \frac{\overline{x} - \mu_{0}}{\sqrt{\frac{s^{2}}{n}}} = \frac{41.33 - 32}{\sqrt{\frac{0.33}{3}}} \approx 28.131\]

      Durch die Richtung der Hypothese berechnet sich der p-Wert durch:

      \[ P(T \geq t) = 1 - P(T < t) = 1 - P(T < 28.131 = 1 - F(28.131) \]

      1 - pt(28.131, 2)
      [1] 0.000630634
    5. Können Sie davon ausgehen, dass die Personen in der Population der Studentinnen im Durchschnitt in ihrer Selbstwirksamkeit einen Wert von größer als 32 aufweisen? Gehen Sie von einem Signifikanzniveau von \(\alpha = 0.005\) aus.

      Um das beantworten zu können, müssen wir die Testentscheidung treffen:

      Da der p-Wert \(p = 6.3063405\times 10^{-4}\) \(\leq\) \(\alpha = 0.005\) ist, entscheiden wir uns für die \(H_{1}\). Wir entscheiden uns also dafür, dass \(\mu > 32\) ist, und damit auch, dass die mittlere Selbstwirksamkeit in der Population der Studentinnen größer als 32 ist.

    6. Überprüfen Sie Ihre Rechnung, indem Sie die Werte der Stichprobe in R im Vektor x abspeichern und mit dem Befehl t.test() den Hypothesentest durchführen. In diesem Befehl könnnen Sie den Wert für \(\mu_0\) im Argument mu = festlegen und die Richtung der Hypothese mit dem Argument alternative =, das die Ausprägungen "greater", "less" und "two.sided" (für rechts-, links- oder ungerichtete Alternativhypothesen) annehmen kann.

      x <- c(42, 41, 41)
      t.test(x, mu = 32, alternative = "greater")
      
       One Sample t-test
      
      data:  x
      t = 28, df = 2, p-value = 0.0006365
      alternative hypothesis: true mean is greater than 32
      95 percent confidence interval:
       40.36   Inf
      sample estimates:
      mean of x 
       41.33333 
  1. Sie vermuten, dass die mittlere (stetige) Konzentrationsleistung von Personen morgens höher ist als abends. Sie können davon ausgehen, dass das Histogramm der Konzentrationsleistung in der Population sowohl morgens als auch abends durch die Dichte einer Normalverteilung approximiert werden kann und eine einfache Zufallsstichprobe (\(n=120\)) von Personen gezogen wird, deren Konzentrationsleistung jeweils einmal morgens und einmal abends gemessen wird. Sie legen das Signifikanzniveau auf \(\alpha = 0.005\) fest.

    1. Laden Sie den Datensatz herunter und lesen Sie ihn in R als Objekt mit dem Namen Daten ein.

      Daten <- read.csv2("Daten1") # Daten einlesen
    2. Stellen Sie die inhaltlichen Hypothesen auf.

      \[H_{0}:\ {\overline{x}}_{Pop\_morgens} - {\overline{x}}_{Pop\_abends} \leq 0\]

      \[H_{1}:\ {\overline{x}}_{Pop\_morgens} - {\overline{x}}_{Pop\_abends} > 0\]

    3. Stellen Sie die statistischen Hypothesen auf.

      \[H_{0}:\ \mu_{morgens} - \mu_{abends} \leq 0\]

      \[H_{1}:\ \mu_{morgens} - \mu_{abends} > 0\]

    4. Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothesen?

      Zweistichproben t-Test für (rechts-)gerichtete Hypothesen und abhängige Stichproben.

    5. Berechnen Sie den p-Wert in R mithilfe der Funktion für den entsprechenden Hypothesentest.

      t.test(Daten$morgens, Daten$abends, alternative = 'greater', mu = 0, paired = TRUE, var.equal = TRUE)
      
          Paired t-test
      
      data:  Daten$morgens and Daten$abends
      t = 3.0796, df = 119, p-value = 0.001287
      alternative hypothesis: true mean difference is greater than 0
      95 percent confidence interval:
       1.742919      Inf
      sample estimates:
      mean difference 
                3.775 
    6. Welche Testentscheidung treffen Sie? Begründen und interpretieren Sie diese.

      Da \(p = 0.00129 \leq 0.005 = \alpha\) ist, entscheiden wir uns für die \(H_{1}\). Wir entscheiden uns also dafür, dass die mittlere Konzentrationsleistung von Personen morgens höher ist als abends.

  1. Sie vermuten, dass die mittlere (stetige) Kreativität von Personen morgens geringer ist als abends. Sie können davon ausgehen, dass das Histogramm der Kreativität in der Population sowohl morgens als auch abends durch die Dichte einer Normalverteilung approximiert werden kann und eine einfache Zufallsstichprobe (\(n=120\)) von Personen gezogen wird, deren Kreativität jeweils einmal morgens und einmal abends gemessen wird. Sie legen das Signifikanzniveau auf \(\alpha = 0.005\) fest.

    1. Laden Sie den Datensatz herunter und lesen Sie ihn in R als Objekt mit dem Namen Daten ein.

      Daten <- read.csv2("Daten2") # Daten einlesen
    2. Stellen Sie die inhaltlichen Hypothesen auf.

      \[H_{0}:\ {\overline{x}}_{Pop\_morgens} - {\overline{x}}_{Pop\_abends} \geq 0\]

      \[H_{1}:\ {\overline{x}}_{Pop\_morgens} - {\overline{x}}_{Pop\_abends} < 0\]

    3. Stellen Sie die statistischen Hypothesen auf.

      \[H_{0}:\ \mu_{morgens} - \mu_{abends} \geq 0\]

      \[H_{1}:\ \mu_{morgens} - \mu_{abends} < 0\]

    4. Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothesen?

      Zweistichproben t-Test für (links-)gerichtete Hypothesen und abhängige Stichproben.

    5. Berechnen Sie den p-Wert in R mithilfe der Funktion für den entsprechenden Hypothesentest.

      t.test(Daten$morgens, Daten$abends, alternative = 'less', mu = 0, paired = TRUE, var.equal = TRUE)
      
          Paired t-test
      
      data:  Daten$morgens and Daten$abends
      t = 1.5891, df = 119, p-value = 0.9427
      alternative hypothesis: true mean difference is less than 0
      95 percent confidence interval:
           -Inf 4.546117
      sample estimates:
      mean difference 
                2.225 
    6. Welche Testentscheidung treffen Sie? Begründen und interpretieren Sie diese.

      Da \(p = 0.943 > 0.005 = \alpha\) ist, entscheiden wir uns für die \(H_{0}\). Wir entscheiden uns also dafür, dass die mittlere Kreativität von Personen morgens nicht geringer ist als abends.

  1. Sie vermuten, dass sich Künstler in der mittleren (stetigen) Kreativität von Angestellten unterscheiden. Sie können davon ausgehen, dass das Histogramm der Kreativität in beiden Populationen jeweils durch die Dichte einer Normalverteilung approximiert werden kann und dass die empirische Varianz in beiden Populationen gleich ist. Sie haben die folgenden Daten aus zwei unabhängigen einfachen Zufallsstichproben vorliegen. Das Signifikanzniveau sei \(\alpha = 0.005\).

    Kreativität bei den Künstlern Kreativität bei den Angestellten
    79 44
    62 36
    55 36
    58 46
    44 37
    51 39
    38


    Außerdem sind Ihnen die Mittelwerte: \({\overline{x}}_{1} = 58.17\), \({\overline{x}}_{2} = 39.43\) und die Schätzungen der Standardabweichung \(s_{1}^{2} = 142.17\), \(s_{2}^{2} = 15.95\) bekannt. Der Index 1 steht dabei für die Stichprobe der Künstler und der Index 2 für die Stichprobe der Angestellte.

    1. Stellen Sie die inhaltlichen Hypothesen auf.

      \[H_{0}:\ {\overline{x}}_{Pop\_Künstler} - {\overline{x}}_{Pop\_Angestellte} = 0\]

      \[H_{1}:\ {\overline{x}}_{Pop\_Künstler} - {\overline{x}}_{Pop\_Angestellte} \neq 0\]

    2. Stellen Sie die statistischen Hypothesen auf.

      \[H_{0}:\ \mu_{Künstler} - \mu_{Angestellte} = 0\]

      \[H_{1}:\ \mu_{Künstler} - \mu_{Angestellte} \neq 0\]

    3. Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothesen?

      Zwei-Stichproben t-Test für ungerichtete Hypothesen und unabhängige Stichproben.

    4. Berechnen Sie die Realisation der Teststatistik per Hand.

      \[\begin{align*} &n_{1} = 6 \\ &n_{2} = 7 \\ &s_{pool}^{2} = \frac{\left( n_{1} - 1 \right) \cdot s_{1}^{2} + \left( n_{2} - 1 \right) \cdot s_{2}^{2}}{n_{1} + n_{2} - 2} = \frac{5 \cdot 142.17 + 6 \cdot 15.95}{11} = 73.32 \\ &t = \frac{{(\overline{x}}_{1} - {\overline{x}}_{2}) - \mu_{0}}{\sqrt{\frac{S_{pool}^{2}}{n_{1}} + \frac{S_{pool}^{2}}{n_{2}}}} = \frac{(58.17 - 39.43) - 0}{\sqrt{\frac{73.32}{6} + \frac{73.32}{7}}} = 3.93 \end{align*}\]

    5. Berechnen Sie den p-Wert mithilfe der pt Funktion.

      Da wir eine ungerichtete Alternativhypothese haben und \(t = 3.93 > 0\) ist, ist der p-Wert

      \[\begin{align*} P\left( T \leq - t\text{~oder~}T \geq t \right) &= P\left( T \leq - t\text{~} \right) + P(T \geq t) \\ &= P\left( T \leq - 3.93\text{~} \right) + P(T \geq 3.93) \\ &= 2 \cdot P(T \leq - 3.93) \\ &= 2 \cdot F(- 3.93) \end{align*}\]

      wobei \(P\) eine t-Verteilung mit \(\nu = n_{1} + n_{2} - 2 = 11\) und \(F\) deren Verteilungsfunktion ist.

      Berechnung mithilfe von pt in R:

      2 * pt(- 3.93,  11)
      [1] 0.002352075
    6. Überprüfen Sie Ihr Ergebnis, indem Sie die Daten als Vektoren x und y in R definieren und den Hypothesentest mit der Funktion t.test(x, y, alternative = "two.sided", paired = FALSE, var.equal = TRUE) durchführen.

      x <- c(79, 62, 55, 58, 44, 51)
      y <- c(44, 36, 36, 46, 37, 39, 38)
      t.test(x, y, alternative = "two.sided", paired = FALSE, var.equal = TRUE)
      
          Two Sample t-test
      
      data:  x and y
      t = 3.9333, df = 11, p-value = 0.002339
      alternative hypothesis: true difference in means is not equal to 0
      95 percent confidence interval:
        8.252748 29.223442
      sample estimates:
      mean of x mean of y 
       58.16667  39.42857 

      Hinweis: Dadurch, dass bei der Rechnung per Hand zwischendrin immer wieder gerundet wurde, ist es möglich, dass es Unterschiede der Ergebnisse auf den hinteren Nachkommastellen gibt. Das ist natürlich kein Fehler, denn ohne jegliche Rundung würden die Unterschiede verschwinden.

    7. Können Sie davon ausgehen, dass sich in der Population Künstler in ihrer mittleren Kreativität von Angestellten unterscheiden? Begründen Sie Ihre Entscheidung.

      Da \(p = 0.0023521 \leq 0.005 = \alpha\) ist, entscheiden wir uns für die Alternativhypothese. Wir entscheiden uns also dafür, dass sich Künstler in der mittleren Kreativität von Angestellten unterscheiden.

  1. Aus Ihrer Theorie ergibt sich, dass Senioren in ihrer (stetigen) Resilienz im Durchschnitt einen Wert von kleiner als 47 aufweisen sollten. Sie können davon ausgehen, dass das Histogramm der Werte der Resilienz in der Population durch die Dichte einer Normalverteilung approximiert werden kann und eine einfache Zufallsstichprobe gezogen wird.

    1. Stellen Sie die inhaltlichen Hypothesen auf.

      \[H_{0}:{\overline{x}}_{R} \geq 47\]

      \[H_{1}:{\overline{x}}_{R} < 47\]

    2. Stellen Sie die statistischen Hypothesen auf.

      \[H_{0}:\mu \geq 47\]

      \[H_{1}:\mu < 47\]

    3. Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothese?

      Hypothesentest über \(\mu\) (t-Test) für eine Stichprobe für eine linksgerichtete Hypothese.

    4. Sie haben folgende Daten aus einer einfachen Zufallsstichprobe vorliegen:

      Person Resilienz
      1 39
      2 41
      3 44
      4 42

      Der Mittelwert beträgt in der Stichprobe \(\overline{x} = 41.5\) und als Schätzung der Populationsvarianz erhalten Sie den Wert \(s^2 = 4.33\).

      Berechnen Sie die Realisation der Teststatistik und daraus mit Hilfe der Funktion pt() den p-Wert, um eine Testentscheidung treffen zu können.

      Die Realisation der Teststatistik berechnet sich aus der Formel

      \[t = \frac{\overline{x} - \mu_{0}}{\sqrt{\frac{s^{2}}{n}}}\]

      \(\mu_{0} = 47\) ergibt sich aus unseren Hypothesen. Da wir 4 Senioren in unserer Stichprobe haben, ist \(n = 4\).

      Wir müssen also noch \(\overline{x}\) und \(s^{2}\) berechnen.

      \[\begin{align*} \overline{x} &= \frac{1}{n}\sum_{i = 1}^{n}x_{i} = \frac{39 + 41 + 44 + 42}{4} = 41.5 \\ s^{2} &= \frac{1}{n - 1}\sum_{i = 1}^{n}\left( x_{i} - \overline{x} \right)^{2} = \\ &=\frac{(39 - 41.5)^2 + (41 - 41.5)^2 + (44 - 41.5)^2 + (42 - 41.5)^2}{3} = 4.33 \end{align*}\]

      Einsetzen ergibt:

      \[t = \frac{\overline{x} - \mu_{0}}{\sqrt{\frac{s^{2}}{n}}} = \frac{41.5 - 47}{\sqrt{\frac{4.33}{4}}} \approx -5.286\]

      Durch die Richtung der Hypothese berechnet sich der p-Wert durch:

      \[ P(T \leq t) = P(T \leq-5.286 = F(-5.286) \]

      pt(-5.286, 3)
      [1] 0.006603203
    5. Können Sie davon ausgehen, dass die Personen in der Population der Senioren im Durchschnitt in ihrer Resilienz einen Wert von kleiner als 47 aufweisen? Gehen Sie von einem Signifikanzniveau von \(\alpha = 0.005\) aus.

      Um das beantworten zu können, müssen wir die Testentscheidung treffen:

      Da der p-Wert \(p = 0.0066032\) \(>\) \(\alpha = 0.005\) ist, entscheiden wir uns für die \(H_{0}\). Wir entscheiden uns also dafür, dass \(\mu \geq 47\) ist, und damit auch, dass die mittlere Resilienz in der Population der Senioren nicht kleiner als 47 ist.

    6. Überprüfen Sie Ihre Rechnung, indem Sie die Werte der Stichprobe in R im Vektor x abspeichern und mit dem Befehl t.test() den Hypothesentest durchführen. In diesem Befehl könnnen Sie den Wert für \(\mu_0\) im Argument mu = festlegen und die Richtung der Hypothese mit dem Argument alternative =, das die Ausprägungen "greater", "less" und "two.sided" (für rechts-, links- oder ungerichtete Alternativhypothesen) annehmen kann.

      x <- c(39, 41, 44, 42)
      t.test(x, mu = 47, alternative = "less")
      
       One Sample t-test
      
      data:  x
      t = -5.2842, df = 3, p-value = 0.006609
      alternative hypothesis: true mean is less than 47
      95 percent confidence interval:
           -Inf 43.94946
      sample estimates:
      mean of x 
           41.5 
  1. Sie vermuten, dass der Anteil von Personen, die Sport machen an den unter Depression leidenden Personen größer ist als 12%. Sie ziehen eine einfache Zufallsstichprobe der Größe \(n = 400\) aus der Population der Depressiven und erfassen von jeder Person das Sportverhalten, um diese Hypothese zu überprüfen. Sie wählen ein Signifikanzniveau von \(\alpha = 0.005\).

    1. Stellen Sie die inhaltlichen Hypothesen auf.

      \[H_{0}:\ h_{kein\_Sport} \leq 0.12\]

      \[H_{1}:\ h_{kein\_Sport} > 0.12\]

    2. Stellen Sie die statistischen Hypothesen auf.

      \[H_{0}:\ \pi \leq 0.12\]

      \[H_{1}:\ \pi > 0.12\]

    3. Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothesen?

      Binomialtest für rechtsgerichtete Hypothesen.

    4. In Ihrer Stichprobe befinden sich 72 Personen , die Sport machen. Berechnen Sie den für die Testentscheidung nötigen p-Wert zunächst selbst mithilfe der pbinom Funktion. Überprüfen Sie Ihr Ergebnis dann, indem Sie den p-Wert mit der Funktion in R für den entsprechenden Hypothesentest berechnen.

      Die Realisation \(t\) der Teststatistik \(T\) entspricht der absoluten Häufigkeit der Personen , die Sport machen in der Stichprobe, da sich die inhaltlichen Hypothesen auf die relative Häufigkeit der Personen , die Sport machen in der Population beziehen.

      Die Realisation der Teststatistik \(T\) ist somit \(t = 72\).

      Da wir eine rechtsgerichtete Alternativhypothese haben, ist der p-Wert

      \(P(T \geq t) = P(T \geq 72) = 1 - P(T < 72) = 1 - P(T \leq 71) = 1 - F(71)\),

      wobei \(P\) eine Binomialverteilung mit \(n = 400\) und \(\pi = \pi_{0} = 0.12\) und \(F\) deren Verteilungsfunktion ist.

      Berechnung mithilfe von pbinom in R:

      1 - pbinom(71, size = 400, prob = 0.12)
      [1] 0.0003106551

      Überprüfung mit binom.test:

      binom.test(72, n = 400, p = 0.12, alternative = "greater")
      
          Exact binomial test
      
      data:  n1 and 400
      number of successes = 72, number of trials = 400, p-value = 0.0003107
      alternative hypothesis: true probability of success is greater than 0.12
      95 percent confidence interval:
       0.1489938 1.0000000
      sample estimates:
      probability of success 
                        0.18 
    5. Welche Testentscheidung treffen Sie? Begründen und interpretieren Sie diese.

      Da \(p = 0.000311 \leq 0.005 = \alpha\) ist, entscheiden wir uns für die \(H_{1}\). Wir entscheiden uns also dafür, dass der Anteil der Personen , die Sport machen an den unter einer Depression leidenden Personen der Population größer ist als 12 %.