Weitere Übungsaufgaben 11

Einführung in statistische Hypothesentests II

Hinweis

Die hier veröffentlichten Übungsaufgaben sind brandneu und deshalb noch nicht auf Herz und Nieren überprüft. Sollten Sie Fehler entdecken, geben Sie uns bitte unbedingt eine Rückmeldung an philipp.sckopke(at)psy.lmu.de, damit wir so bald wie möglich eine verbesserte Version online stellen können.

  1. Sie vermuten, dass sich Frühaufsteher in der mittleren (stetigen) Konzentrationsleistung von Langschläfern unterscheiden. Sie können davon ausgehen, dass das Histogramm der Konzentrationsleistung in beiden Populationen jeweils durch die Dichte einer Normalverteilung approximiert werden kann und dass die empirische Varianz in beiden Populationen gleich ist. Sie haben die folgenden Daten aus zwei unabhängigen einfachen Zufallsstichproben vorliegen. Das Signifikanzniveau sei \(\alpha = 0.005\).

    Konzentrationsleistung bei den Frühaufstehern Konzentrationsleistung bei den Langschläfern
    57 41
    44 43
    44 37
    59 25
    42 35
    49 45
    55 22
    47
    37


    Außerdem sind Ihnen die Mittelwerte: \({\overline{x}}_{1} = 50\), \({\overline{x}}_{2} = 36.89\) und die Schätzungen der Standardabweichung \(s_{1}^{2} = 48.67\), \(s_{2}^{2} = 73.61\) bekannt. Der Index 1 steht dabei für die Stichprobe der Frühaufsteher und der Index 2 für die Stichprobe der Langschläfer.

    1. Stellen Sie die inhaltlichen Hypothesen auf.

      \[H_{0}:\ {\overline{x}}_{Pop\_Frühaufsteher} - {\overline{x}}_{Pop\_Langschläfer} = 0\]

      \[H_{1}:\ {\overline{x}}_{Pop\_Frühaufsteher} - {\overline{x}}_{Pop\_Langschläfer} \neq 0\]

    2. Stellen Sie die statistischen Hypothesen auf.

      \[H_{0}:\ \mu_{Frühaufsteher} - \mu_{Langschläfer} = 0\]

      \[H_{1}:\ \mu_{Frühaufsteher} - \mu_{Langschläfer} \neq 0\]

    3. Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothesen?

      Zwei-Stichproben t-Test für ungerichtete Hypothesen und unabhängige Stichproben.

    4. Berechnen Sie die Realisation der Teststatistik per Hand.

      \[\begin{align*} &n_{1} = 7 \\ &n_{2} = 9 \\ &s_{pool}^{2} = \frac{\left( n_{1} - 1 \right) \cdot s_{1}^{2} + \left( n_{2} - 1 \right) \cdot s_{2}^{2}}{n_{1} + n_{2} - 2} = \frac{6 \cdot 48.67 + 8 \cdot 73.61}{14} = 62.92 \\ &t = \frac{{(\overline{x}}_{1} - {\overline{x}}_{2}) - \mu_{0}}{\sqrt{\frac{S_{pool}^{2}}{n_{1}} + \frac{S_{pool}^{2}}{n_{2}}}} = \frac{(50 - 36.89) - 0}{\sqrt{\frac{62.92}{7} + \frac{62.92}{9}}} = 3.28 \end{align*}\]

    5. Berechnen Sie den p-Wert mithilfe der pt Funktion.

      Da wir eine ungerichtete Alternativhypothese haben und \(t = 3.28 > 0\) ist, ist der p-Wert

      \[\begin{align*} P\left( T \leq - t\text{~oder~}T \geq t \right) &= P\left( T \leq - t\text{~} \right) + P(T \geq t) \\ &= P\left( T \leq - 3.28\text{~} \right) + P(T \geq 3.28) \\ &= 2 \cdot P(T \leq - 3.28) \\ &= 2 \cdot F(- 3.28) \end{align*}\]

      wobei \(P\) eine t-Verteilung mit \(\nu = n_{1} + n_{2} - 2 = 14\) und \(F\) deren Verteilungsfunktion ist.

      Berechnung mithilfe von pt in R:

      2 * pt(- 3.28,  14)
      [1] 0.005475914
    6. Überprüfen Sie Ihr Ergebnis, indem Sie die Daten als Vektoren x und y in R definieren und den Hypothesentest mit der Funktion t.test(x, y, alternative = "two.sided", paired = FALSE, var.equal = TRUE) durchführen.

      x <- c(57, 44, 44, 59, 42, 49, 55)
      y <- c(41, 43, 37, 25, 35, 45, 22, 47, 37)
      t.test(x, y, alternative = "two.sided", paired = FALSE, var.equal = TRUE)
      
          Two Sample t-test
      
      data:  x and y
      t = 3.2798, df = 14, p-value = 0.005478
      alternative hypothesis: true difference in means is not equal to 0
      95 percent confidence interval:
        4.53737 21.68485
      sample estimates:
      mean of x mean of y 
       50.00000  36.88889 

      Hinweis: Dadurch, dass bei der Rechnung per Hand zwischendrin immer wieder gerundet wurde, ist es möglich, dass es Unterschiede der Ergebnisse auf den hinteren Nachkommastellen gibt. Das ist natürlich kein Fehler, denn ohne jegliche Rundung würden die Unterschiede verschwinden.

    7. Können Sie davon ausgehen, dass sich in der Population Frühaufsteher in ihrer mittleren Konzentrationsleistung von Langschläfern unterscheiden? Begründen Sie Ihre Entscheidung.

      Da \(p = 0.0054759 > 0.005 = \alpha\) ist, entscheiden wir uns für die Nullhypothese. Wir entscheiden uns also dafür, dass sich Frühaufsteher in der mittleren Konzentrationsleistung von Langschläfern nicht unterscheiden.

  1. Sie vermuten, dass der Anteil von Personen mit roten Haaren an den unter Depression leidenden Personen kleiner ist als 22%. Sie ziehen eine einfache Zufallsstichprobe der Größe \(n = 400\) aus der Population der Depressiven und erfassen von jeder Person die Haarfarbe, um diese Hypothese zu überprüfen. Sie wählen ein Signifikanzniveau von \(\alpha = 0.005\).

    1. Stellen Sie die inhaltlichen Hypothesen auf.

      \[H_{0}:\ h_{rote\_Haare} \geq 0.22\]

      \[H_{1}:\ h_{rote\_Haare} < 0.22\]

    2. Stellen Sie die statistischen Hypothesen auf.

      \[H_{0}:\ \pi \geq 0.22\]

      \[H_{1}:\ \pi < 0.22\]

    3. Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothesen?

      Binomialtest für linksgerichtete Hypothesen.

    4. In Ihrer Stichprobe befinden sich 73 Personen mit roten Haaren. Berechnen Sie den für die Testentscheidung nötigen p-Wert zunächst selbst mithilfe der pbinom Funktion. Überprüfen Sie Ihr Ergebnis dann, indem Sie den p-Wert mit der Funktion in R für den entsprechenden Hypothesentest berechnen.

      Die Realisation \(t\) der Teststatistik \(T\) entspricht der absoluten Häufigkeit der Personen mit roten Haaren in der Stichprobe, da sich die inhaltlichen Hypothesen auf die relative Häufigkeit der Personen mit roten Haaren in der Population beziehen.

      Die Realisation der Teststatistik \(T\) ist somit \(t = 73\).

      Da wir eine linksgerichtete Alternativhypothese haben, ist der p-Wert

      \(P(T \leq t) = P(T \leq 73) = F(73)\),

      wobei \(P\) eine Binomialverteilung mit \(n = 400\) und \(\pi = \pi_{0} = 0.22\) und \(F\) deren Verteilungsfunktion ist.

      Berechnung mithilfe von pbinom in R:

      pbinom(73, size = 400, prob = 0.22)
      [1] 0.0378785

      Überprüfung mit binom.test:

      binom.test(73, n = 400, p = 0.22, alternative = "less")
      
          Exact binomial test
      
      data:  n1 and 400
      number of successes = 73, number of trials = 400, p-value = 0.03788
      alternative hypothesis: true probability of success is less than 0.22
      95 percent confidence interval:
       0.0000000 0.2172391
      sample estimates:
      probability of success 
                      0.1825 
    5. Welche Testentscheidung treffen Sie? Begründen und interpretieren Sie diese.

      Da \(p = 0.0379 > 0.005 = \alpha\) ist, entscheiden wir uns für die \(H_{0}\). Wir entscheiden uns also dafür, dass der Anteil der Personen mit roten Haaren an den unter einer Depression leidenden Personen der Population nicht kleiner ist als 22 %.

  1. Aus Ihrer Theorie ergibt sich, dass Studentinnen in ihrer (stetigen) Selbstwirksamkeit im Durchschnitt einen Wert von größer als 45 aufweisen sollten. Sie können davon ausgehen, dass das Histogramm der Werte der Selbstwirksamkeit in der Population durch die Dichte einer Normalverteilung approximiert werden kann und eine einfache Zufallsstichprobe gezogen wird.

    1. Stellen Sie die inhaltlichen Hypothesen auf.

      \[H_{0}:{\overline{x}}_{S} \leq 45\]

      \[H_{1}:{\overline{x}}_{S} > 45\]

    2. Stellen Sie die statistischen Hypothesen auf.

      \[H_{0}:\mu \leq 45\]

      \[H_{1}:\mu > 45\]

    3. Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothese?

      Hypothesentest über \(\mu\) (t-Test) für eine Stichprobe für eine rechtsgerichtete Hypothese.

    4. Sie haben folgende Daten aus einer einfachen Zufallsstichprobe vorliegen:

      Person Selbstwirksamkeit
      1 50
      2 53
      3 49
      4 54
      5 55

      Der Mittelwert beträgt in der Stichprobe \(\overline{x} = 52.2\) und als Schätzung der Populationsvarianz erhalten Sie den Wert \(s^2 = 6.7\).

      Berechnen Sie die Realisation der Teststatistik und daraus mit Hilfe der Funktion pt() den p-Wert, um eine Testentscheidung treffen zu können.

      Die Realisation der Teststatistik berechnet sich aus der Formel

      \[t = \frac{\overline{x} - \mu_{0}}{\sqrt{\frac{s^{2}}{n}}}\]

      \(\mu_{0} = 45\) ergibt sich aus unseren Hypothesen. Da wir 5 Studentinnen in unserer Stichprobe haben, ist \(n = 5\).

      Wir müssen also noch \(\overline{x}\) und \(s^{2}\) berechnen.

      \[\begin{align*} \overline{x} &= \frac{1}{n}\sum_{i = 1}^{n}x_{i} = \frac{50 + 53 + 49 + 54 + 55}{5} = 52.2 \\ s^{2} &= \frac{1}{n - 1}\sum_{i = 1}^{n}\left( x_{i} - \overline{x} \right)^{2} = \\ &=\frac{(50 - 52.2)^2 + (53 - 52.2)^2 + (49 - 52.2)^2 + (54 - 52.2)^2 + (55 - 52.2)^2}{4} = 6.7 \end{align*}\]

      Einsetzen ergibt:

      \[t = \frac{\overline{x} - \mu_{0}}{\sqrt{\frac{s^{2}}{n}}} = \frac{52.2 - 45}{\sqrt{\frac{6.7}{5}}} \approx 6.22\]

      Durch die Richtung der Hypothese berechnet sich der p-Wert durch:

      \[ P(T \geq t) = 1 - P(T < t) = 1 - P(T < 6.22 = 1 - F(6.22) \]

      1 - pt(6.22, 4)
      [1] 0.001700583
    5. Können Sie davon ausgehen, dass die Personen in der Population der Studentinnen im Durchschnitt in ihrer Selbstwirksamkeit einen Wert von größer als 45 aufweisen? Gehen Sie von einem Signifikanzniveau von \(\alpha = 0.005\) aus.

      Um das beantworten zu können, müssen wir die Testentscheidung treffen:

      Da der p-Wert \(p = 0.0017006\) \(\leq\) \(\alpha = 0.005\) ist, entscheiden wir uns für die \(H_{1}\). Wir entscheiden uns also dafür, dass \(\mu > 45\) ist, und damit auch, dass die mittlere Selbstwirksamkeit in der Population der Studentinnen größer als 45 ist.

    6. Überprüfen Sie Ihre Rechnung, indem Sie die Werte der Stichprobe in R im Vektor x abspeichern und mit dem Befehl t.test() den Hypothesentest durchführen. In diesem Befehl könnnen Sie den Wert für \(\mu_0\) im Argument mu = festlegen und die Richtung der Hypothese mit dem Argument alternative =, das die Ausprägungen "greater", "less" und "two.sided" (für rechts-, links- oder ungerichtete Alternativhypothesen) annehmen kann.

      x <- c(50, 53, 49, 54, 55)
      t.test(x, mu = 45, alternative = "greater")
      
       One Sample t-test
      
      data:  x
      t = 6.2199, df = 4, p-value = 0.001701
      alternative hypothesis: true mean is greater than 45
      95 percent confidence interval:
       49.73221      Inf
      sample estimates:
      mean of x 
           52.2 
  1. Sie vermuten, dass die mittlere (stetige) Konzentrationsleistung von Personen morgens höher ist als abends. Sie können davon ausgehen, dass das Histogramm der Konzentrationsleistung in der Population sowohl morgens als auch abends durch die Dichte einer Normalverteilung approximiert werden kann und eine einfache Zufallsstichprobe (\(n=120\)) von Personen gezogen wird, deren Konzentrationsleistung jeweils einmal morgens und einmal abends gemessen wird. Sie legen das Signifikanzniveau auf \(\alpha = 0.005\) fest.

    1. Laden Sie den Datensatz herunter und lesen Sie ihn in R als Objekt mit dem Namen Daten ein.

      Daten <- read.csv2("Daten1") # Daten einlesen
    2. Stellen Sie die inhaltlichen Hypothesen auf.

      \[H_{0}:\ {\overline{x}}_{Pop\_morgens} - {\overline{x}}_{Pop\_abends} \leq 0\]

      \[H_{1}:\ {\overline{x}}_{Pop\_morgens} - {\overline{x}}_{Pop\_abends} > 0\]

    3. Stellen Sie die statistischen Hypothesen auf.

      \[H_{0}:\ \mu_{morgens} - \mu_{abends} \leq 0\]

      \[H_{1}:\ \mu_{morgens} - \mu_{abends} > 0\]

    4. Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothesen?

      Zweistichproben t-Test für (rechts-)gerichtete Hypothesen und abhängige Stichproben.

    5. Berechnen Sie den p-Wert in R mithilfe der Funktion für den entsprechenden Hypothesentest.

      t.test(Daten$morgens, Daten$abends, alternative = 'greater', mu = 0, paired = TRUE, var.equal = TRUE)
      
          Paired t-test
      
      data:  Daten$morgens and Daten$abends
      t = 3.0796, df = 119, p-value = 0.001287
      alternative hypothesis: true mean difference is greater than 0
      95 percent confidence interval:
       1.742919      Inf
      sample estimates:
      mean difference 
                3.775 
    6. Welche Testentscheidung treffen Sie? Begründen und interpretieren Sie diese.

      Da \(p = 0.00129 \leq 0.005 = \alpha\) ist, entscheiden wir uns für die \(H_{1}\). Wir entscheiden uns also dafür, dass die mittlere Konzentrationsleistung von Personen morgens höher ist als abends.

  1. Sie vermuten, dass die mittlere (stetige) Kreativität von Personen morgens geringer ist als abends. Sie können davon ausgehen, dass das Histogramm der Kreativität in der Population sowohl morgens als auch abends durch die Dichte einer Normalverteilung approximiert werden kann und eine einfache Zufallsstichprobe (\(n=120\)) von Personen gezogen wird, deren Kreativität jeweils einmal morgens und einmal abends gemessen wird. Sie legen das Signifikanzniveau auf \(\alpha = 0.005\) fest.

    1. Laden Sie den Datensatz herunter und lesen Sie ihn in R als Objekt mit dem Namen Daten ein.

      Daten <- read.csv2("Daten2") # Daten einlesen
    2. Stellen Sie die inhaltlichen Hypothesen auf.

      \[H_{0}:\ {\overline{x}}_{Pop\_morgens} - {\overline{x}}_{Pop\_abends} \geq 0\]

      \[H_{1}:\ {\overline{x}}_{Pop\_morgens} - {\overline{x}}_{Pop\_abends} < 0\]

    3. Stellen Sie die statistischen Hypothesen auf.

      \[H_{0}:\ \mu_{morgens} - \mu_{abends} \geq 0\]

      \[H_{1}:\ \mu_{morgens} - \mu_{abends} < 0\]

    4. Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothesen?

      Zweistichproben t-Test für (links-)gerichtete Hypothesen und abhängige Stichproben.

    5. Berechnen Sie den p-Wert in R mithilfe der Funktion für den entsprechenden Hypothesentest.

      t.test(Daten$morgens, Daten$abends, alternative = 'less', mu = 0, paired = TRUE, var.equal = TRUE)
      
          Paired t-test
      
      data:  Daten$morgens and Daten$abends
      t = 1.5891, df = 119, p-value = 0.9427
      alternative hypothesis: true mean difference is less than 0
      95 percent confidence interval:
           -Inf 4.546117
      sample estimates:
      mean difference 
                2.225 
    6. Welche Testentscheidung treffen Sie? Begründen und interpretieren Sie diese.

      Da \(p = 0.943 > 0.005 = \alpha\) ist, entscheiden wir uns für die \(H_{0}\). Wir entscheiden uns also dafür, dass die mittlere Kreativität von Personen morgens nicht geringer ist als abends.

  1. Sie vermuten, dass sich Künstler in der mittleren (stetigen) Kreativität von Angestellten unterscheiden. Sie können davon ausgehen, dass das Histogramm der Kreativität in beiden Populationen jeweils durch die Dichte einer Normalverteilung approximiert werden kann und dass die empirische Varianz in beiden Populationen gleich ist. Sie haben die folgenden Daten aus zwei unabhängigen einfachen Zufallsstichproben vorliegen. Das Signifikanzniveau sei \(\alpha = 0.005\).

    Kreativität bei den Künstlern Kreativität bei den Angestellten
    79 44
    62 36
    55 36
    58 46
    44 37
    51 39
    38


    Außerdem sind Ihnen die Mittelwerte: \({\overline{x}}_{1} = 58.17\), \({\overline{x}}_{2} = 39.43\) und die Schätzungen der Standardabweichung \(s_{1}^{2} = 142.17\), \(s_{2}^{2} = 15.95\) bekannt. Der Index 1 steht dabei für die Stichprobe der Künstler und der Index 2 für die Stichprobe der Angestellte.

    1. Stellen Sie die inhaltlichen Hypothesen auf.

      \[H_{0}:\ {\overline{x}}_{Pop\_Künstler} - {\overline{x}}_{Pop\_Angestellte} = 0\]

      \[H_{1}:\ {\overline{x}}_{Pop\_Künstler} - {\overline{x}}_{Pop\_Angestellte} \neq 0\]

    2. Stellen Sie die statistischen Hypothesen auf.

      \[H_{0}:\ \mu_{Künstler} - \mu_{Angestellte} = 0\]

      \[H_{1}:\ \mu_{Künstler} - \mu_{Angestellte} \neq 0\]

    3. Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothesen?

      Zwei-Stichproben t-Test für ungerichtete Hypothesen und unabhängige Stichproben.

    4. Berechnen Sie die Realisation der Teststatistik per Hand.

      \[\begin{align*} &n_{1} = 6 \\ &n_{2} = 7 \\ &s_{pool}^{2} = \frac{\left( n_{1} - 1 \right) \cdot s_{1}^{2} + \left( n_{2} - 1 \right) \cdot s_{2}^{2}}{n_{1} + n_{2} - 2} = \frac{5 \cdot 142.17 + 6 \cdot 15.95}{11} = 73.32 \\ &t = \frac{{(\overline{x}}_{1} - {\overline{x}}_{2}) - \mu_{0}}{\sqrt{\frac{S_{pool}^{2}}{n_{1}} + \frac{S_{pool}^{2}}{n_{2}}}} = \frac{(58.17 - 39.43) - 0}{\sqrt{\frac{73.32}{6} + \frac{73.32}{7}}} = 3.93 \end{align*}\]

    5. Berechnen Sie den p-Wert mithilfe der pt Funktion.

      Da wir eine ungerichtete Alternativhypothese haben und \(t = 3.93 > 0\) ist, ist der p-Wert

      \[\begin{align*} P\left( T \leq - t\text{~oder~}T \geq t \right) &= P\left( T \leq - t\text{~} \right) + P(T \geq t) \\ &= P\left( T \leq - 3.93\text{~} \right) + P(T \geq 3.93) \\ &= 2 \cdot P(T \leq - 3.93) \\ &= 2 \cdot F(- 3.93) \end{align*}\]

      wobei \(P\) eine t-Verteilung mit \(\nu = n_{1} + n_{2} - 2 = 11\) und \(F\) deren Verteilungsfunktion ist.

      Berechnung mithilfe von pt in R:

      2 * pt(- 3.93,  11)
      [1] 0.002352075
    6. Überprüfen Sie Ihr Ergebnis, indem Sie die Daten als Vektoren x und y in R definieren und den Hypothesentest mit der Funktion t.test(x, y, alternative = "two.sided", paired = FALSE, var.equal = TRUE) durchführen.

      x <- c(79, 62, 55, 58, 44, 51)
      y <- c(44, 36, 36, 46, 37, 39, 38)
      t.test(x, y, alternative = "two.sided", paired = FALSE, var.equal = TRUE)
      
          Two Sample t-test
      
      data:  x and y
      t = 3.9333, df = 11, p-value = 0.002339
      alternative hypothesis: true difference in means is not equal to 0
      95 percent confidence interval:
        8.252748 29.223442
      sample estimates:
      mean of x mean of y 
       58.16667  39.42857 

      Hinweis: Dadurch, dass bei der Rechnung per Hand zwischendrin immer wieder gerundet wurde, ist es möglich, dass es Unterschiede der Ergebnisse auf den hinteren Nachkommastellen gibt. Das ist natürlich kein Fehler, denn ohne jegliche Rundung würden die Unterschiede verschwinden.

    7. Können Sie davon ausgehen, dass sich in der Population Künstler in ihrer mittleren Kreativität von Angestellten unterscheiden? Begründen Sie Ihre Entscheidung.

      Da \(p = 0.0023521 \leq 0.005 = \alpha\) ist, entscheiden wir uns für die Alternativhypothese. Wir entscheiden uns also dafür, dass sich Künstler in der mittleren Kreativität von Angestellten unterscheiden.

  1. Aus Ihrer Theorie ergibt sich, dass Senioren in ihrer (stetigen) Resilienz im Durchschnitt einen Wert von kleiner als 47 aufweisen sollten. Sie können davon ausgehen, dass das Histogramm der Werte der Resilienz in der Population durch die Dichte einer Normalverteilung approximiert werden kann und eine einfache Zufallsstichprobe gezogen wird.

    1. Stellen Sie die inhaltlichen Hypothesen auf.

      \[H_{0}:{\overline{x}}_{R} \geq 47\]

      \[H_{1}:{\overline{x}}_{R} < 47\]

    2. Stellen Sie die statistischen Hypothesen auf.

      \[H_{0}:\mu \geq 47\]

      \[H_{1}:\mu < 47\]

    3. Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothese?

      Hypothesentest über \(\mu\) (t-Test) für eine Stichprobe für eine linksgerichtete Hypothese.

    4. Sie haben folgende Daten aus einer einfachen Zufallsstichprobe vorliegen:

      Person Resilienz
      1 39
      2 41
      3 44
      4 42

      Der Mittelwert beträgt in der Stichprobe \(\overline{x} = 41.5\) und als Schätzung der Populationsvarianz erhalten Sie den Wert \(s^2 = 4.33\).

      Berechnen Sie die Realisation der Teststatistik und daraus mit Hilfe der Funktion pt() den p-Wert, um eine Testentscheidung treffen zu können.

      Die Realisation der Teststatistik berechnet sich aus der Formel

      \[t = \frac{\overline{x} - \mu_{0}}{\sqrt{\frac{s^{2}}{n}}}\]

      \(\mu_{0} = 47\) ergibt sich aus unseren Hypothesen. Da wir 4 Senioren in unserer Stichprobe haben, ist \(n = 4\).

      Wir müssen also noch \(\overline{x}\) und \(s^{2}\) berechnen.

      \[\begin{align*} \overline{x} &= \frac{1}{n}\sum_{i = 1}^{n}x_{i} = \frac{39 + 41 + 44 + 42}{4} = 41.5 \\ s^{2} &= \frac{1}{n - 1}\sum_{i = 1}^{n}\left( x_{i} - \overline{x} \right)^{2} = \\ &=\frac{(39 - 41.5)^2 + (41 - 41.5)^2 + (44 - 41.5)^2 + (42 - 41.5)^2}{3} = 4.33 \end{align*}\]

      Einsetzen ergibt:

      \[t = \frac{\overline{x} - \mu_{0}}{\sqrt{\frac{s^{2}}{n}}} = \frac{41.5 - 47}{\sqrt{\frac{4.33}{4}}} \approx -5.286\]

      Durch die Richtung der Hypothese berechnet sich der p-Wert durch:

      \[ P(T \leq t) = P(T \leq-5.286 = F(-5.286) \]

      pt(-5.286, 3)
      [1] 0.006603203
    5. Können Sie davon ausgehen, dass die Personen in der Population der Senioren im Durchschnitt in ihrer Resilienz einen Wert von kleiner als 47 aufweisen? Gehen Sie von einem Signifikanzniveau von \(\alpha = 0.005\) aus.

      Um das beantworten zu können, müssen wir die Testentscheidung treffen:

      Da der p-Wert \(p = 0.0066032\) \(>\) \(\alpha = 0.005\) ist, entscheiden wir uns für die \(H_{0}\). Wir entscheiden uns also dafür, dass \(\mu \geq 47\) ist, und damit auch, dass die mittlere Resilienz in der Population der Senioren nicht kleiner als 47 ist.

    6. Überprüfen Sie Ihre Rechnung, indem Sie die Werte der Stichprobe in R im Vektor x abspeichern und mit dem Befehl t.test() den Hypothesentest durchführen. In diesem Befehl könnnen Sie den Wert für \(\mu_0\) im Argument mu = festlegen und die Richtung der Hypothese mit dem Argument alternative =, das die Ausprägungen "greater", "less" und "two.sided" (für rechts-, links- oder ungerichtete Alternativhypothesen) annehmen kann.

      x <- c(39, 41, 44, 42)
      t.test(x, mu = 47, alternative = "less")
      
       One Sample t-test
      
      data:  x
      t = -5.2842, df = 3, p-value = 0.006609
      alternative hypothesis: true mean is less than 47
      95 percent confidence interval:
           -Inf 43.94946
      sample estimates:
      mean of x 
           41.5 
  1. Sie vermuten, dass der Anteil von Personen, die Sport machen an den unter Depression leidenden Personen größer ist als 12%. Sie ziehen eine einfache Zufallsstichprobe der Größe \(n = 400\) aus der Population der Depressiven und erfassen von jeder Person das Sportverhalten, um diese Hypothese zu überprüfen. Sie wählen ein Signifikanzniveau von \(\alpha = 0.005\).

    1. Stellen Sie die inhaltlichen Hypothesen auf.

      \[H_{0}:\ h_{kein\_Sport} \leq 0.12\]

      \[H_{1}:\ h_{kein\_Sport} > 0.12\]

    2. Stellen Sie die statistischen Hypothesen auf.

      \[H_{0}:\ \pi \leq 0.12\]

      \[H_{1}:\ \pi > 0.12\]

    3. Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothesen?

      Binomialtest für rechtsgerichtete Hypothesen.

    4. In Ihrer Stichprobe befinden sich 72 Personen , die Sport machen. Berechnen Sie den für die Testentscheidung nötigen p-Wert zunächst selbst mithilfe der pbinom Funktion. Überprüfen Sie Ihr Ergebnis dann, indem Sie den p-Wert mit der Funktion in R für den entsprechenden Hypothesentest berechnen.

      Die Realisation \(t\) der Teststatistik \(T\) entspricht der absoluten Häufigkeit der Personen , die Sport machen in der Stichprobe, da sich die inhaltlichen Hypothesen auf die relative Häufigkeit der Personen , die Sport machen in der Population beziehen.

      Die Realisation der Teststatistik \(T\) ist somit \(t = 72\).

      Da wir eine rechtsgerichtete Alternativhypothese haben, ist der p-Wert

      \(P(T \geq t) = P(T \geq 72) = 1 - P(T < 72) = 1 - P(T \leq 71) = 1 - F(71)\),

      wobei \(P\) eine Binomialverteilung mit \(n = 400\) und \(\pi = \pi_{0} = 0.12\) und \(F\) deren Verteilungsfunktion ist.

      Berechnung mithilfe von pbinom in R:

      1 - pbinom(71, size = 400, prob = 0.12)
      [1] 0.0003106551

      Überprüfung mit binom.test:

      binom.test(72, n = 400, p = 0.12, alternative = "greater")
      
          Exact binomial test
      
      data:  n1 and 400
      number of successes = 72, number of trials = 400, p-value = 0.0003107
      alternative hypothesis: true probability of success is greater than 0.12
      95 percent confidence interval:
       0.1489938 1.0000000
      sample estimates:
      probability of success 
                        0.18 
    5. Welche Testentscheidung treffen Sie? Begründen und interpretieren Sie diese.

      Da \(p = 0.000311 \leq 0.005 = \alpha\) ist, entscheiden wir uns für die \(H_{1}\). Wir entscheiden uns also dafür, dass der Anteil der Personen , die Sport machen an den unter einer Depression leidenden Personen der Population größer ist als 12 %.