Konzentrationsleistung bei den Frühaufstehern | Konzentrationsleistung bei den Langschläfern |
---|---|
46 | 49 |
44 | 40 |
52 | 23 |
62 | 42 |
38 | 45 |
50 | 41 |
57 | |
38 |
Übungsaufgaben
Einführung in statistische Hypothesentests II
Die hier veröffentlichten Übungsaufgaben sind brandneu und deshalb noch nicht auf Herz und Nieren überprüft. Sollten Sie Fehler entdecken, geben Sie uns bitte unbedingt eine Rückmeldung an philipp.sckopke(at)psy.lmu.de, damit wir so bald wie möglich eine verbesserte Version online stellen können.
Sie vermuten, dass sich Frühaufsteher in der mittleren (stetigen) Konzentrationsleistung von Langschläfern unterscheiden. Sie können davon ausgehen, dass das Histogramm der Konzentrationsleistung in beiden Populationen jeweils durch die Dichte einer Normalverteilung approximiert werden kann und dass die empirische Varianz in beiden Populationen gleich ist. Sie haben die folgenden Daten aus zwei unabhängigen einfachen Zufallsstichproben vorliegen. Das Signifikanzniveau sei \(\alpha = 0.005\).
Außerdem sind Ihnen die Mittelwerte: \({\overline{x}}_{1} = 48.67\), \({\overline{x}}_{2} = 41.88\) und die Schätzungen der Standardabweichung \(s_{1}^{2} = 66.67\), \(s_{2}^{2} = 94.98\) bekannt. Der Index 1 steht dabei für die Stichprobe der Frühaufsteher und der Index 2 für die Stichprobe der Langschläfer.
Stellen Sie die inhaltlichen Hypothesen auf.
Lösung\[H_{0}:\ {\overline{x}}_{Pop\_Frühaufsteher} - {\overline{x}}_{Pop\_Langschläfer} = 0\]
\[H_{1}:\ {\overline{x}}_{Pop\_Frühaufsteher} - {\overline{x}}_{Pop\_Langschläfer} \neq 0\]
Stellen Sie die statistischen Hypothesen auf.
Lösung\[H_{0}:\ \mu_{Frühaufsteher} - \mu_{Langschläfer} = 0\]
\[H_{1}:\ \mu_{Frühaufsteher} - \mu_{Langschläfer} \neq 0\]
Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothesen?
LösungZwei-Stichproben t-Test für ungerichtete Hypothesen und unabhängige Stichproben.
Berechnen Sie die Realisation der Teststatistik per Hand.
Lösung\[\begin{align*} &n_{1} = 6 \\ &n_{2} = 8 \\ &s_{pool}^{2} = \frac{\left( n_{1} - 1 \right) \cdot s_{1}^{2} + \left( n_{2} - 1 \right) \cdot s_{2}^{2}}{n_{1} + n_{2} - 2} = \frac{5 \cdot 66.67 + 7 \cdot 94.98}{12} = 83.18 \\ &t = \frac{{(\overline{x}}_{1} - {\overline{x}}_{2}) - \mu_{0}}{\sqrt{\frac{S_{pool}^{2}}{n_{1}} + \frac{S_{pool}^{2}}{n_{2}}}} = \frac{(48.67 - 41.88) - 0}{\sqrt{\frac{83.18}{6} + \frac{83.18}{8}}} = 1.38 \end{align*}\]
Berechnen Sie den p-Wert mithilfe der
pt
Funktion.LösungDa wir eine ungerichtete Alternativhypothese haben und \(t = 1.38 > 0\) ist, ist der p-Wert
\[\begin{align*} P\left( T \leq - t\text{~oder~}T \geq t \right) &= P\left( T \leq - t\text{~} \right) + P(T \geq t) \\ &= P\left( T \leq - 1.38\text{~} \right) + P(T \geq 1.38) \\ &= 2 \cdot P(T \leq - 1.38) \\ &= 2 \cdot F(- 1.38) \end{align*}\]
wobei \(P\) eine t-Verteilung mit \(\nu = n_{1} + n_{2} - 2 = 12\) und \(F\) deren Verteilungsfunktion ist.
Berechnung mithilfe von pt in R:
2 * pt(- 1.38, 12)
[1] 0.1927556
Überprüfen Sie Ihr Ergebnis, indem Sie die Daten als Vektoren
x
undy
in R definieren und den Hypothesentest mit der Funktiont.test(x, y, alternative = "two.sided", paired = FALSE, var.equal = TRUE)
durchführen.Lösung<- c(46, 44, 52, 62, 38, 50) x <- c(49, 40, 23, 42, 45, 41, 57, 38) y
t.test(x, y, alternative = "two.sided", paired = FALSE, var.equal = TRUE)
Two Sample t-test data: x and y t = 1.3788, df = 12, p-value = 0.1931 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -3.940398 17.523732 sample estimates: mean of x mean of y 48.66667 41.87500
Hinweis: Dadurch, dass bei der Rechnung per Hand zwischendrin immer wieder gerundet wurde, ist es möglich, dass es Unterschiede der Ergebnisse auf den hinteren Nachkommastellen gibt. Das ist natürlich kein Fehler, denn ohne jegliche Rundung würden die Unterschiede verschwinden.
Können Sie davon ausgehen, dass sich in der Population Frühaufsteher in ihrer mittleren Konzentrationsleistung von Langschläfern unterscheiden? Begründen Sie Ihre Entscheidung.
LösungDa \(p = 0.1927556 > 0.005 = \alpha\) ist, entscheiden wir uns für die Nullhypothese. Wir entscheiden uns also dafür, dass sich Frühaufsteher in der mittleren Konzentrationsleistung von Langschläfern nicht unterscheiden.
Sie vermuten, dass der Anteil von Personen mit roten Haaren an den unter Depression leidenden Personen kleiner ist als 18%. Sie ziehen eine einfache Zufallsstichprobe der Größe \(n = 400\) aus der Population der Depressiven und erfassen von jeder Person die Haarfarbe, um diese Hypothese zu überprüfen. Sie wählen ein Signifikanzniveau von \(\alpha = 0.005\).
Stellen Sie die inhaltlichen Hypothesen auf.
Lösung\[H_{0}:\ h_{rote\_Haare} \geq 0.18\]
\[H_{1}:\ h_{rote\_Haare} < 0.18\]
Stellen Sie die statistischen Hypothesen auf.
Lösung\[H_{0}:\ \pi \geq 0.18\]
\[H_{1}:\ \pi < 0.18\]
Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothesen?
LösungBinomialtest für linksgerichtete Hypothesen.
In Ihrer Stichprobe befinden sich 56 Personen mit roten Haaren. Berechnen Sie den für die Testentscheidung nötigen p-Wert zunächst selbst mithilfe der
pbinom
Funktion. Überprüfen Sie Ihr Ergebnis dann, indem Sie den p-Wert mit der Funktion in R für den entsprechenden Hypothesentest berechnen.LösungDie Realisation \(t\) der Teststatistik \(T\) entspricht der absoluten Häufigkeit der Personen mit roten Haaren in der Stichprobe, da sich die inhaltlichen Hypothesen auf die relative Häufigkeit der Personen mit roten Haaren in der Population beziehen.
Die Realisation der Teststatistik \(T\) ist somit \(t = 56\).
Da wir eine linksgerichtete Alternativhypothese haben, ist der p-Wert
\(P(T \leq t) = P(T \leq 56) = F(56)\),
wobei \(P\) eine Binomialverteilung mit \(n = 400\) und \(\pi = \pi_{0} = 0.18\) und \(F\) deren Verteilungsfunktion ist.
Berechnung mithilfe von pbinom in R:
pbinom(56, size = 400, prob = 0.18)
[1] 0.01944413
Überprüfung mit binom.test:
binom.test(56, n = 400, p = 0.18, alternative = "less")
Exact binomial test data: n1 and 400 number of successes = 56, number of trials = 400, p-value = 0.01944 alternative hypothesis: true probability of success is less than 0.18 95 percent confidence interval: 0.000000 0.171777 sample estimates: probability of success 0.14
Welche Testentscheidung treffen Sie? Begründen und interpretieren Sie diese.
LösungDa \(p = 0.0194 > 0.005 = \alpha\) ist, entscheiden wir uns für die \(H_{0}\). Wir entscheiden uns also dafür, dass der Anteil der Personen mit roten Haaren an den unter einer Depression leidenden Personen der Population nicht kleiner ist als 18 %.
Aus Ihrer Theorie ergibt sich, dass Studentinnen in ihrer (stetigen) Selbstwirksamkeit im Durchschnitt einen Wert von größer als 32 aufweisen sollten. Sie können davon ausgehen, dass das Histogramm der Werte der Selbstwirksamkeit in der Population durch die Dichte einer Normalverteilung approximiert werden kann und eine einfache Zufallsstichprobe gezogen wird.
Stellen Sie die inhaltlichen Hypothesen auf.
Lösung\[H_{0}:{\overline{x}}_{S} \leq 32\]
\[H_{1}:{\overline{x}}_{S} > 32\]
Stellen Sie die statistischen Hypothesen auf.
Lösung\[H_{0}:\mu \leq 32\]
\[H_{1}:\mu > 32\]
Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothese?
LösungHypothesentest über \(\mu\) (t-Test) für eine Stichprobe für eine rechtsgerichtete Hypothese.
Sie haben folgende Daten aus einer einfachen Zufallsstichprobe vorliegen:
Person Selbstwirksamkeit 1 42 2 41 3 41 Der Mittelwert beträgt in der Stichprobe \(\overline{x} = 41.33\) und als Schätzung der Populationsvarianz erhalten Sie den Wert \(s^2 = 0.33\).
Berechnen Sie die Realisation der Teststatistik und daraus mit Hilfe der Funktion
pt()
den p-Wert, um eine Testentscheidung treffen zu können.LösungDie Realisation der Teststatistik berechnet sich aus der Formel
\[t = \frac{\overline{x} - \mu_{0}}{\sqrt{\frac{s^{2}}{n}}}\]
\(\mu_{0} = 32\) ergibt sich aus unseren Hypothesen. Da wir 3 Studentinnen in unserer Stichprobe haben, ist \(n = 3\).
Wir müssen also noch \(\overline{x}\) und \(s^{2}\) berechnen.
\[\begin{align*} \overline{x} &= \frac{1}{n}\sum_{i = 1}^{n}x_{i} = \frac{42 + 41 + 41}{3} = 41.33 \\ s^{2} &= \frac{1}{n - 1}\sum_{i = 1}^{n}\left( x_{i} - \overline{x} \right)^{2} = \\ &=\frac{(42 - 41.33)^2 + (41 - 41.33)^2 + (41 - 41.33)^2}{2} = 0.33 \end{align*}\]
Einsetzen ergibt:
\[t = \frac{\overline{x} - \mu_{0}}{\sqrt{\frac{s^{2}}{n}}} = \frac{41.33 - 32}{\sqrt{\frac{0.33}{3}}} \approx 28.131\]
Durch die Richtung der Hypothese berechnet sich der p-Wert durch:
\[ P(T \geq t) = 1 - P(T < t) = 1 - P(T < 28.131 = 1 - F(28.131) \]
1 - pt(28.131, 2)
[1] 0.000630634
Können Sie davon ausgehen, dass die Personen in der Population der Studentinnen im Durchschnitt in ihrer Selbstwirksamkeit einen Wert von größer als 32 aufweisen? Gehen Sie von einem Signifikanzniveau von \(\alpha = 0.005\) aus.
LösungUm das beantworten zu können, müssen wir die Testentscheidung treffen:
Da der p-Wert \(p = 6.3063405\times 10^{-4}\) \(\leq\) \(\alpha = 0.005\) ist, entscheiden wir uns für die \(H_{1}\). Wir entscheiden uns also dafür, dass \(\mu > 32\) ist, und damit auch, dass die mittlere Selbstwirksamkeit in der Population der Studentinnen größer als 32 ist.
Überprüfen Sie Ihre Rechnung, indem Sie die Werte der Stichprobe in R im Vektor
x
abspeichern und mit dem Befehlt.test()
den Hypothesentest durchführen. In diesem Befehl könnnen Sie den Wert für \(\mu_0\) im Argumentmu =
festlegen und die Richtung der Hypothese mit dem Argumentalternative =
, das die Ausprägungen"greater"
,"less"
und"two.sided"
(für rechts-, links- oder ungerichtete Alternativhypothesen) annehmen kann.Lösung<- c(42, 41, 41) x t.test(x, mu = 32, alternative = "greater")
One Sample t-test data: x t = 28, df = 2, p-value = 0.0006365 alternative hypothesis: true mean is greater than 32 95 percent confidence interval: 40.36 Inf sample estimates: mean of x 41.33333
Sie vermuten, dass die mittlere (stetige) Konzentrationsleistung von Personen morgens höher ist als abends. Sie können davon ausgehen, dass das Histogramm der Konzentrationsleistung in der Population sowohl morgens als auch abends durch die Dichte einer Normalverteilung approximiert werden kann und eine einfache Zufallsstichprobe (\(n=120\)) von Personen gezogen wird, deren Konzentrationsleistung jeweils einmal morgens und einmal abends gemessen wird. Sie legen das Signifikanzniveau auf \(\alpha = 0.005\) fest.
Laden Sie den Datensatz herunter und lesen Sie ihn in R als Objekt mit dem Namen Daten ein.
Lösung<- read.csv2("Daten1") # Daten einlesen Daten
Stellen Sie die inhaltlichen Hypothesen auf.
Lösung\[H_{0}:\ {\overline{x}}_{Pop\_morgens} - {\overline{x}}_{Pop\_abends} \leq 0\]
\[H_{1}:\ {\overline{x}}_{Pop\_morgens} - {\overline{x}}_{Pop\_abends} > 0\]
Stellen Sie die statistischen Hypothesen auf.
Lösung\[H_{0}:\ \mu_{morgens} - \mu_{abends} \leq 0\]
\[H_{1}:\ \mu_{morgens} - \mu_{abends} > 0\]
Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothesen?
LösungZweistichproben t-Test für (rechts-)gerichtete Hypothesen und abhängige Stichproben.
Berechnen Sie den p-Wert in R mithilfe der Funktion für den entsprechenden Hypothesentest.
Lösungt.test(Daten$morgens, Daten$abends, alternative = 'greater', mu = 0, paired = TRUE, var.equal = TRUE)
Paired t-test data: Daten$morgens and Daten$abends t = 3.0796, df = 119, p-value = 0.001287 alternative hypothesis: true mean difference is greater than 0 95 percent confidence interval: 1.742919 Inf sample estimates: mean difference 3.775
Welche Testentscheidung treffen Sie? Begründen und interpretieren Sie diese.
LösungDa \(p = 0.00129 \leq 0.005 = \alpha\) ist, entscheiden wir uns für die \(H_{1}\). Wir entscheiden uns also dafür, dass die mittlere Konzentrationsleistung von Personen morgens höher ist als abends.
Sie vermuten, dass die mittlere (stetige) Kreativität von Personen morgens geringer ist als abends. Sie können davon ausgehen, dass das Histogramm der Kreativität in der Population sowohl morgens als auch abends durch die Dichte einer Normalverteilung approximiert werden kann und eine einfache Zufallsstichprobe (\(n=120\)) von Personen gezogen wird, deren Kreativität jeweils einmal morgens und einmal abends gemessen wird. Sie legen das Signifikanzniveau auf \(\alpha = 0.005\) fest.
Laden Sie den Datensatz herunter und lesen Sie ihn in R als Objekt mit dem Namen Daten ein.
Lösung<- read.csv2("Daten2") # Daten einlesen Daten
Stellen Sie die inhaltlichen Hypothesen auf.
Lösung\[H_{0}:\ {\overline{x}}_{Pop\_morgens} - {\overline{x}}_{Pop\_abends} \geq 0\]
\[H_{1}:\ {\overline{x}}_{Pop\_morgens} - {\overline{x}}_{Pop\_abends} < 0\]
Stellen Sie die statistischen Hypothesen auf.
Lösung\[H_{0}:\ \mu_{morgens} - \mu_{abends} \geq 0\]
\[H_{1}:\ \mu_{morgens} - \mu_{abends} < 0\]
Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothesen?
LösungZweistichproben t-Test für (links-)gerichtete Hypothesen und abhängige Stichproben.
Berechnen Sie den p-Wert in R mithilfe der Funktion für den entsprechenden Hypothesentest.
Lösungt.test(Daten$morgens, Daten$abends, alternative = 'less', mu = 0, paired = TRUE, var.equal = TRUE)
Paired t-test data: Daten$morgens and Daten$abends t = 1.5891, df = 119, p-value = 0.9427 alternative hypothesis: true mean difference is less than 0 95 percent confidence interval: -Inf 4.546117 sample estimates: mean difference 2.225
Welche Testentscheidung treffen Sie? Begründen und interpretieren Sie diese.
LösungDa \(p = 0.943 > 0.005 = \alpha\) ist, entscheiden wir uns für die \(H_{0}\). Wir entscheiden uns also dafür, dass die mittlere Kreativität von Personen morgens nicht geringer ist als abends.
Sie vermuten, dass sich Künstler in der mittleren (stetigen) Kreativität von Angestellten unterscheiden. Sie können davon ausgehen, dass das Histogramm der Kreativität in beiden Populationen jeweils durch die Dichte einer Normalverteilung approximiert werden kann und dass die empirische Varianz in beiden Populationen gleich ist. Sie haben die folgenden Daten aus zwei unabhängigen einfachen Zufallsstichproben vorliegen. Das Signifikanzniveau sei \(\alpha = 0.005\).
Kreativität bei den Künstlern Kreativität bei den Angestellten 79 44 62 36 55 36 58 46 44 37 51 39 38
Außerdem sind Ihnen die Mittelwerte: \({\overline{x}}_{1} = 58.17\), \({\overline{x}}_{2} = 39.43\) und die Schätzungen der Standardabweichung \(s_{1}^{2} = 142.17\), \(s_{2}^{2} = 15.95\) bekannt. Der Index 1 steht dabei für die Stichprobe der Künstler und der Index 2 für die Stichprobe der Angestellte.
Stellen Sie die inhaltlichen Hypothesen auf.
Lösung\[H_{0}:\ {\overline{x}}_{Pop\_Künstler} - {\overline{x}}_{Pop\_Angestellte} = 0\]
\[H_{1}:\ {\overline{x}}_{Pop\_Künstler} - {\overline{x}}_{Pop\_Angestellte} \neq 0\]
Stellen Sie die statistischen Hypothesen auf.
Lösung\[H_{0}:\ \mu_{Künstler} - \mu_{Angestellte} = 0\]
\[H_{1}:\ \mu_{Künstler} - \mu_{Angestellte} \neq 0\]
Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothesen?
LösungZwei-Stichproben t-Test für ungerichtete Hypothesen und unabhängige Stichproben.
Berechnen Sie die Realisation der Teststatistik per Hand.
Lösung\[\begin{align*} &n_{1} = 6 \\ &n_{2} = 7 \\ &s_{pool}^{2} = \frac{\left( n_{1} - 1 \right) \cdot s_{1}^{2} + \left( n_{2} - 1 \right) \cdot s_{2}^{2}}{n_{1} + n_{2} - 2} = \frac{5 \cdot 142.17 + 6 \cdot 15.95}{11} = 73.32 \\ &t = \frac{{(\overline{x}}_{1} - {\overline{x}}_{2}) - \mu_{0}}{\sqrt{\frac{S_{pool}^{2}}{n_{1}} + \frac{S_{pool}^{2}}{n_{2}}}} = \frac{(58.17 - 39.43) - 0}{\sqrt{\frac{73.32}{6} + \frac{73.32}{7}}} = 3.93 \end{align*}\]
Berechnen Sie den p-Wert mithilfe der
pt
Funktion.LösungDa wir eine ungerichtete Alternativhypothese haben und \(t = 3.93 > 0\) ist, ist der p-Wert
\[\begin{align*} P\left( T \leq - t\text{~oder~}T \geq t \right) &= P\left( T \leq - t\text{~} \right) + P(T \geq t) \\ &= P\left( T \leq - 3.93\text{~} \right) + P(T \geq 3.93) \\ &= 2 \cdot P(T \leq - 3.93) \\ &= 2 \cdot F(- 3.93) \end{align*}\]
wobei \(P\) eine t-Verteilung mit \(\nu = n_{1} + n_{2} - 2 = 11\) und \(F\) deren Verteilungsfunktion ist.
Berechnung mithilfe von pt in R:
2 * pt(- 3.93, 11)
[1] 0.002352075
Überprüfen Sie Ihr Ergebnis, indem Sie die Daten als Vektoren
x
undy
in R definieren und den Hypothesentest mit der Funktiont.test(x, y, alternative = "two.sided", paired = FALSE, var.equal = TRUE)
durchführen.Lösung<- c(79, 62, 55, 58, 44, 51) x <- c(44, 36, 36, 46, 37, 39, 38) y
t.test(x, y, alternative = "two.sided", paired = FALSE, var.equal = TRUE)
Two Sample t-test data: x and y t = 3.9333, df = 11, p-value = 0.002339 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 8.252748 29.223442 sample estimates: mean of x mean of y 58.16667 39.42857
Hinweis: Dadurch, dass bei der Rechnung per Hand zwischendrin immer wieder gerundet wurde, ist es möglich, dass es Unterschiede der Ergebnisse auf den hinteren Nachkommastellen gibt. Das ist natürlich kein Fehler, denn ohne jegliche Rundung würden die Unterschiede verschwinden.
Können Sie davon ausgehen, dass sich in der Population Künstler in ihrer mittleren Kreativität von Angestellten unterscheiden? Begründen Sie Ihre Entscheidung.
LösungDa \(p = 0.0023521 \leq 0.005 = \alpha\) ist, entscheiden wir uns für die Alternativhypothese. Wir entscheiden uns also dafür, dass sich Künstler in der mittleren Kreativität von Angestellten unterscheiden.
Aus Ihrer Theorie ergibt sich, dass Senioren in ihrer (stetigen) Resilienz im Durchschnitt einen Wert von kleiner als 47 aufweisen sollten. Sie können davon ausgehen, dass das Histogramm der Werte der Resilienz in der Population durch die Dichte einer Normalverteilung approximiert werden kann und eine einfache Zufallsstichprobe gezogen wird.
Stellen Sie die inhaltlichen Hypothesen auf.
Lösung\[H_{0}:{\overline{x}}_{R} \geq 47\]
\[H_{1}:{\overline{x}}_{R} < 47\]
Stellen Sie die statistischen Hypothesen auf.
Lösung\[H_{0}:\mu \geq 47\]
\[H_{1}:\mu < 47\]
Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothese?
LösungHypothesentest über \(\mu\) (t-Test) für eine Stichprobe für eine linksgerichtete Hypothese.
Sie haben folgende Daten aus einer einfachen Zufallsstichprobe vorliegen:
Person Resilienz 1 39 2 41 3 44 4 42 Der Mittelwert beträgt in der Stichprobe \(\overline{x} = 41.5\) und als Schätzung der Populationsvarianz erhalten Sie den Wert \(s^2 = 4.33\).
Berechnen Sie die Realisation der Teststatistik und daraus mit Hilfe der Funktion
pt()
den p-Wert, um eine Testentscheidung treffen zu können.LösungDie Realisation der Teststatistik berechnet sich aus der Formel
\[t = \frac{\overline{x} - \mu_{0}}{\sqrt{\frac{s^{2}}{n}}}\]
\(\mu_{0} = 47\) ergibt sich aus unseren Hypothesen. Da wir 4 Senioren in unserer Stichprobe haben, ist \(n = 4\).
Wir müssen also noch \(\overline{x}\) und \(s^{2}\) berechnen.
\[\begin{align*} \overline{x} &= \frac{1}{n}\sum_{i = 1}^{n}x_{i} = \frac{39 + 41 + 44 + 42}{4} = 41.5 \\ s^{2} &= \frac{1}{n - 1}\sum_{i = 1}^{n}\left( x_{i} - \overline{x} \right)^{2} = \\ &=\frac{(39 - 41.5)^2 + (41 - 41.5)^2 + (44 - 41.5)^2 + (42 - 41.5)^2}{3} = 4.33 \end{align*}\]
Einsetzen ergibt:
\[t = \frac{\overline{x} - \mu_{0}}{\sqrt{\frac{s^{2}}{n}}} = \frac{41.5 - 47}{\sqrt{\frac{4.33}{4}}} \approx -5.286\]
Durch die Richtung der Hypothese berechnet sich der p-Wert durch:
\[ P(T \leq t) = P(T \leq-5.286 = F(-5.286) \]
pt(-5.286, 3)
[1] 0.006603203
Können Sie davon ausgehen, dass die Personen in der Population der Senioren im Durchschnitt in ihrer Resilienz einen Wert von kleiner als 47 aufweisen? Gehen Sie von einem Signifikanzniveau von \(\alpha = 0.005\) aus.
LösungUm das beantworten zu können, müssen wir die Testentscheidung treffen:
Da der p-Wert \(p = 0.0066032\) \(>\) \(\alpha = 0.005\) ist, entscheiden wir uns für die \(H_{0}\). Wir entscheiden uns also dafür, dass \(\mu \geq 47\) ist, und damit auch, dass die mittlere Resilienz in der Population der Senioren nicht kleiner als 47 ist.
Überprüfen Sie Ihre Rechnung, indem Sie die Werte der Stichprobe in R im Vektor
x
abspeichern und mit dem Befehlt.test()
den Hypothesentest durchführen. In diesem Befehl könnnen Sie den Wert für \(\mu_0\) im Argumentmu =
festlegen und die Richtung der Hypothese mit dem Argumentalternative =
, das die Ausprägungen"greater"
,"less"
und"two.sided"
(für rechts-, links- oder ungerichtete Alternativhypothesen) annehmen kann.Lösung<- c(39, 41, 44, 42) x t.test(x, mu = 47, alternative = "less")
One Sample t-test data: x t = -5.2842, df = 3, p-value = 0.006609 alternative hypothesis: true mean is less than 47 95 percent confidence interval: -Inf 43.94946 sample estimates: mean of x 41.5
Sie vermuten, dass der Anteil von Personen, die Sport machen an den unter Depression leidenden Personen größer ist als 12%. Sie ziehen eine einfache Zufallsstichprobe der Größe \(n = 400\) aus der Population der Depressiven und erfassen von jeder Person das Sportverhalten, um diese Hypothese zu überprüfen. Sie wählen ein Signifikanzniveau von \(\alpha = 0.005\).
Stellen Sie die inhaltlichen Hypothesen auf.
Lösung\[H_{0}:\ h_{kein\_Sport} \leq 0.12\]
\[H_{1}:\ h_{kein\_Sport} > 0.12\]
Stellen Sie die statistischen Hypothesen auf.
Lösung\[H_{0}:\ \pi \leq 0.12\]
\[H_{1}:\ \pi > 0.12\]
Welchen statistischen Hypothesentest wählen Sie zur Überprüfung dieser Hypothesen?
LösungBinomialtest für rechtsgerichtete Hypothesen.
In Ihrer Stichprobe befinden sich 72 Personen , die Sport machen. Berechnen Sie den für die Testentscheidung nötigen p-Wert zunächst selbst mithilfe der
pbinom
Funktion. Überprüfen Sie Ihr Ergebnis dann, indem Sie den p-Wert mit der Funktion in R für den entsprechenden Hypothesentest berechnen.LösungDie Realisation \(t\) der Teststatistik \(T\) entspricht der absoluten Häufigkeit der Personen , die Sport machen in der Stichprobe, da sich die inhaltlichen Hypothesen auf die relative Häufigkeit der Personen , die Sport machen in der Population beziehen.
Die Realisation der Teststatistik \(T\) ist somit \(t = 72\).
Da wir eine rechtsgerichtete Alternativhypothese haben, ist der p-Wert
\(P(T \geq t) = P(T \geq 72) = 1 - P(T < 72) = 1 - P(T \leq 71) = 1 - F(71)\),
wobei \(P\) eine Binomialverteilung mit \(n = 400\) und \(\pi = \pi_{0} = 0.12\) und \(F\) deren Verteilungsfunktion ist.
Berechnung mithilfe von pbinom in R:
1 - pbinom(71, size = 400, prob = 0.12)
[1] 0.0003106551
Überprüfung mit binom.test:
binom.test(72, n = 400, p = 0.12, alternative = "greater")
Exact binomial test data: n1 and 400 number of successes = 72, number of trials = 400, p-value = 0.0003107 alternative hypothesis: true probability of success is greater than 0.12 95 percent confidence interval: 0.1489938 1.0000000 sample estimates: probability of success 0.18
Welche Testentscheidung treffen Sie? Begründen und interpretieren Sie diese.
LösungDa \(p = 0.000311 \leq 0.005 = \alpha\) ist, entscheiden wir uns für die \(H_{1}\). Wir entscheiden uns also dafür, dass der Anteil der Personen , die Sport machen an den unter einer Depression leidenden Personen der Population größer ist als 12 %.