Df Sum Sq Mean Sq F value Pr(>F)
Stockwerk 3 1501 500.4 6.28 0.000549 ***
Residuals 116 9244 79.7
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Übungsaufgaben
Varianzanalyse im einfaktoriellen Modell
Die hier veröffentlichten Übungsaufgaben sind brandneu und deshalb noch nicht auf Herz und Nieren überprüft. Sollten Sie Fehler entdecken, geben Sie uns bitte unbedingt eine Rückmeldung an philipp.sckopke(at)psy.lmu.de, damit wir so bald wie möglich eine verbesserte Version online stellen können.
Sie wollen mithilfe eines Omnibus-Tests untersuchen, ob die diskrete Variable Stockwerk (mit den Ausprägungen EG vs. 1. Stock vs. 2. Stock vs. 3. Stock) mit der stetigen Aufmerksamkeit von Studierenden in der Klausur zusammenhängt. Sie erheben pro Faktorstufe 30 Personen.
Laden Sie den folgenden Datensatz: herunter und lesen Sie diesen in R ein.
Speichern Sie das Objekt unter dem NamenDaten
ab. Für die Berechnung des Omnibus-Tests verwenden Sie zuerst die Funktionaov(AV Name ~ UV Name, data = Daten)
. Weisen Sie dem Objekt den NamenDaten_anova
zu. Danach wenden Sie die Funktionsummary()
auf das ObjektDaten_anova
an. In welchem Wert realisiert sich die Teststatistik T?Lösung<- read.csv2("Daten1") # Daten einlesen Daten <- aov(Aufmerksamkeit ~ Stockwerk, Daten) Daten_anova summary(Daten_anova)
Die Teststatistik \(T\) realisiert sich in dem Wert \(t\ = 6.28\).
Welche Testentscheidung treffen Sie bei einem Signifikanzniveau von \(\alpha = 0.005\)? Begründen Sie.
LösungWegen \(p =5\times 10^{-4} < 0.005 = \alpha\) entscheiden wir uns für die \(H_{1}\) Wir entscheiden uns also dafür, dass sich die mittlere Aufmerksamkeit in mindestens zwei Studentinnenpopulationen unterscheidet. Wir können dabei jedoch nicht sagen, in welchen Populationen.
Berechnen Sie den p-Wert mit Hilfe der Funktion
pf()
und Überprüfen Sie, ob Sie das gleiche Ergebnis wie im Output oben erhalten.LösungDie Teststatistik \(T\) folgt unter der \(H_{0}\) einer \(F\)-Verteilung mit den Parametern \(\nu_{1} = {df}_{zw} = m - 1 = 3\) und \(\nu_{2} = {df}_{inn} = m \cdot (n - 1) = 116\).
Der p-Wert ist \(p\ = P(T \geq 6.28) = 1 - P(T \leq 6.28) = 1 - \ F(6.28)\):
1 - pf(6.28, df1 = 3, df2 = 116)
[1] 0.0005492722
Treffen Sie die Testentscheidung nun mit Hilfe des kritischen Bereiches. Berechnen Sie den kritischen Wert mit der Funktion
qf()
.LösungDie Teststatistik \(T\) folgt unter der \(H_{0}\) einer \(F\)-Verteilung mit den Parametern \(\nu_{1} = {df}_{zw} = m - 1 = 3\) und \(\nu_{2} = {df}_{inn} = m \cdot (n - 1) = 116\).
Kritischer Wert:
qf(0.995, df1 = 3, df2 = 116)
[1] 4.504926
Testentscheidung auf der Basis des kritischen Bereichs:
Der kritische Wert für \(\alpha\ = \ 0.005\) ist \(t_{krit} = 4.505\). Somit liegt der beobachtete Wert \(t\ = \ 6.28\) im kritischen Bereich \(K_{T} = \left\lbrack 4.505;\ \infty \right\lbrack\) und wir entscheiden uns für die Alternativhypothese, dass sich die Stockwerk-Gruppen in ihrer mittleren Aufmerksamkeit unterscheiden.
Sie wollen mithilfe eines Omnibus-Tests untersuchen, ob die diskrete Variable Tageszeit (mit den Ausprägungen morgens vs. mittags vs. abends) mit der stetigen Gelassenheit von Studierenden in der Klausur zusammenhängt. Sie erheben pro Faktorstufe 40 Personen.
Laden Sie den folgenden Datensatz: herunter und lesen Sie diesen in R ein.
Speichern Sie das Objekt unter dem NamenDaten
ab. Für die Berechnung des Omnibus-Tests verwenden Sie zuerst die Funktionaov(AV Name ~ UV Name, data = Daten)
. Weisen Sie dem Objekt den NamenDaten_anova
zu. Danach wenden Sie die Funktionsummary()
auf das ObjektDaten_anova
an. In welchem Wert realisiert sich die Teststatistik T?Lösung<- read.csv2("Daten2") # Daten einlesen Daten <- aov(Gelassenheit ~ Tageszeit, Daten) Daten_anova summary(Daten_anova)
Df Sum Sq Mean Sq F value Pr(>F) Tageszeit 2 776 387.9 3.031 0.0521 . Residuals 117 14971 128.0 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Die Teststatistik \(T\) realisiert sich in dem Wert \(t\ = 3.031\).
Welche Testentscheidung treffen Sie bei einem Signifikanzniveau von \(\alpha = 0.005\)? Begründen Sie.
LösungWegen \(p =0.0521 > 0.005 = \alpha\) entscheiden wir uns für die \(H_{0}\) Wir entscheiden uns also dafür, dass sich die mittlere Gelassenheit zwischen den Studentinnenpopulationen nicht unterscheidet.
Berechnen Sie den p-Wert mit Hilfe der Funktion
pf()
und Überprüfen Sie, ob Sie das gleiche Ergebnis wie im Output oben erhalten.LösungDie Teststatistik \(T\) folgt unter der \(H_{0}\) einer \(F\)-Verteilung mit den Parametern \(\nu_{1} = {df}_{zw} = m - 1 = 2\) und \(\nu_{2} = {df}_{inn} = m \cdot (n - 1) = 117\).
Der p-Wert ist \(p\ = P(T \geq 3.031) = 1 - P(T \leq 3.031) = 1 - \ F(3.031)\):
1 - pf(3.031, df1 = 2, df2 = 117)
[1] 0.05207397
Treffen Sie die Testentscheidung nun mit Hilfe des kritischen Bereiches. Berechnen Sie den kritischen Wert mit der Funktion
qf()
.LösungDie Teststatistik \(T\) folgt unter der \(H_{0}\) einer \(F\)-Verteilung mit den Parametern \(\nu_{1} = {df}_{zw} = m - 1 = 2\) und \(\nu_{2} = {df}_{inn} = m \cdot (n - 1) = 117\).
Kritischer Wert:
qf(0.995, df1 = 2, df2 = 117)
[1] 5.545661
Testentscheidung auf der Basis des kritischen Bereichs:
Der kritische Wert für \(\alpha\ = \ 0.005\) ist \(t_{krit} = 5.546\). Somit liegt der beobachtete Wert \(t\ = \ 3.031\) nicht im kritischen Bereich \(K_{T} = \left\lbrack 5.546;\ \infty \right\lbrack\) und wir entscheiden uns für die Nullhypothese, dass sich die Tageszeit-Gruppen nicht in ihrer mittleren Gelassenheit unterscheiden.
Sie wollen mithilfe eines Omnibus-Tests untersuchen, ob die diskrete Variable Stockwerk (mit den Ausprägungen EG vs. 1. Stock vs. 2. Stock vs. 3. Stock) mit der stetigen Punktezahl von Studierenden in der Klausur zusammenhängt. Sie erheben pro Faktorstufe 30 Personen.
Laden Sie den folgenden Datensatz: herunter und lesen Sie diesen in R ein.
Speichern Sie das Objekt unter dem NamenDaten
ab. Für die Berechnung des Omnibus-Tests verwenden Sie zuerst die Funktionaov(AV Name ~ UV Name, data = Daten)
. Weisen Sie dem Objekt den NamenDaten_anova
zu. Danach wenden Sie die Funktionsummary()
auf das ObjektDaten_anova
an. In welchem Wert realisiert sich die Teststatistik T?Lösung<- read.csv2("Daten3") # Daten einlesen Daten <- aov(Punktezahl ~ Stockwerk, Daten) Daten_anova summary(Daten_anova)
Df Sum Sq Mean Sq F value Pr(>F) Stockwerk 3 2000 666.5 9.189 1.67e-05 *** Residuals 116 8415 72.5 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Die Teststatistik \(T\) realisiert sich in dem Wert \(t\ = 9.189\).
Welche Testentscheidung treffen Sie bei einem Signifikanzniveau von \(\alpha = 0.005\)? Begründen Sie.
LösungWegen \(p =1.7\times 10^{-5} < 0.005 = \alpha\) entscheiden wir uns für die \(H_{1}\) Wir entscheiden uns also dafür, dass sich die mittlere Punktezahl in mindestens zwei Studentinnenpopulationen unterscheidet. Wir können dabei jedoch nicht sagen, in welchen Populationen.
Berechnen Sie den p-Wert mit Hilfe der Funktion
pf()
und Überprüfen Sie, ob Sie das gleiche Ergebnis wie im Output oben erhalten.LösungDie Teststatistik \(T\) folgt unter der \(H_{0}\) einer \(F\)-Verteilung mit den Parametern \(\nu_{1} = {df}_{zw} = m - 1 = 3\) und \(\nu_{2} = {df}_{inn} = m \cdot (n - 1) = 116\).
Der p-Wert ist \(p\ = P(T \geq 9.189) = 1 - P(T \leq 9.189) = 1 - \ F(9.189)\):
1 - pf(9.189, df1 = 3, df2 = 116)
[1] 1.670179e-05
Treffen Sie die Testentscheidung nun mit Hilfe des kritischen Bereiches. Berechnen Sie den kritischen Wert mit der Funktion
qf()
.LösungDie Teststatistik \(T\) folgt unter der \(H_{0}\) einer \(F\)-Verteilung mit den Parametern \(\nu_{1} = {df}_{zw} = m - 1 = 3\) und \(\nu_{2} = {df}_{inn} = m \cdot (n - 1) = 116\).
Kritischer Wert:
qf(0.995, df1 = 3, df2 = 116)
[1] 4.504926
Testentscheidung auf der Basis des kritischen Bereichs:
Der kritische Wert für \(\alpha\ = \ 0.005\) ist \(t_{krit} = 4.505\). Somit liegt der beobachtete Wert \(t\ = \ 9.189\) im kritischen Bereich \(K_{T} = \left\lbrack 4.505;\ \infty \right\lbrack\) und wir entscheiden uns für die Alternativhypothese, dass sich die Stockwerk-Gruppen in ihrer mittleren Punktezahl unterscheiden.
Sie wollen mithilfe eines Omnibus-Tests untersuchen, ob die diskrete Variable Pullifarbe (mit den Ausprägungen blau vs. lila vs. grau vs. schwarz vs. gelb) mit der stetigen Punktezahl von Studierenden in der Klausur zusammenhängt. Sie erheben pro Faktorstufe 24 Personen.
Laden Sie den folgenden Datensatz: herunter und lesen Sie diesen in R ein.
Speichern Sie das Objekt unter dem NamenDaten
ab. Für die Berechnung des Omnibus-Tests verwenden Sie zuerst die Funktionaov(AV Name ~ UV Name, data = Daten)
. Weisen Sie dem Objekt den NamenDaten_anova
zu. Danach wenden Sie die Funktionsummary()
auf das ObjektDaten_anova
an. In welchem Wert realisiert sich die Teststatistik T?Lösung<- read.csv2("Daten4") # Daten einlesen Daten <- aov(Punktezahl ~ Pullifarbe, Daten) Daten_anova summary(Daten_anova)
Df Sum Sq Mean Sq F value Pr(>F) Pullifarbe 4 912 228.05 2.631 0.0379 * Residuals 115 9970 86.69 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Die Teststatistik \(T\) realisiert sich in dem Wert \(t\ = 2.631\).
Welche Testentscheidung treffen Sie bei einem Signifikanzniveau von \(\alpha = 0.005\)? Begründen Sie.
LösungWegen \(p =0.0379 > 0.005 = \alpha\) entscheiden wir uns für die \(H_{0}\) Wir entscheiden uns also dafür, dass sich die mittlere Punktezahl zwischen den Studentinnenpopulationen nicht unterscheidet.
Berechnen Sie den p-Wert mit Hilfe der Funktion
pf()
und Überprüfen Sie, ob Sie das gleiche Ergebnis wie im Output oben erhalten.LösungDie Teststatistik \(T\) folgt unter der \(H_{0}\) einer \(F\)-Verteilung mit den Parametern \(\nu_{1} = {df}_{zw} = m - 1 = 4\) und \(\nu_{2} = {df}_{inn} = m \cdot (n - 1) = 115\).
Der p-Wert ist \(p\ = P(T \geq 2.631) = 1 - P(T \leq 2.631) = 1 - \ F(2.631)\):
1 - pf(2.631, df1 = 4, df2 = 115)
[1] 0.03787229
Treffen Sie die Testentscheidung nun mit Hilfe des kritischen Bereiches. Berechnen Sie den kritischen Wert mit der Funktion
qf()
.LösungDie Teststatistik \(T\) folgt unter der \(H_{0}\) einer \(F\)-Verteilung mit den Parametern \(\nu_{1} = {df}_{zw} = m - 1 = 4\) und \(\nu_{2} = {df}_{inn} = m \cdot (n - 1) = 115\).
Kritischer Wert:
qf(0.995, df1 = 4, df2 = 115)
[1] 3.929893
Testentscheidung auf der Basis des kritischen Bereichs:
Der kritische Wert für \(\alpha\ = \ 0.005\) ist \(t_{krit} = 3.93\). Somit liegt der beobachtete Wert \(t\ = \ 2.631\) nicht im kritischen Bereich \(K_{T} = \left\lbrack 3.93;\ \infty \right\lbrack\) und wir entscheiden uns für die Nullhypothese, dass sich die Pullifarben-Gruppen nicht in ihrer mittleren Punktezahl unterscheiden.
Sie wollen mithilfe eines Omnibus-Tests untersuchen, ob die diskrete Variable Pullifarbe (mit den Ausprägungen blau vs. lila vs. grau vs. schwarz vs. gelb) mit der stetigen Aufmerksamkeit von Studierenden in der Klausur zusammenhängt. Sie erheben pro Faktorstufe 24 Personen.
Laden Sie den folgenden Datensatz: herunter und lesen Sie diesen in R ein.
Speichern Sie das Objekt unter dem NamenDaten
ab. Für die Berechnung des Omnibus-Tests verwenden Sie zuerst die Funktionaov(AV Name ~ UV Name, data = Daten)
. Weisen Sie dem Objekt den NamenDaten_anova
zu. Danach wenden Sie die Funktionsummary()
auf das ObjektDaten_anova
an. In welchem Wert realisiert sich die Teststatistik T?Lösung<- read.csv2("Daten5") # Daten einlesen Daten <- aov(Aufmerksamkeit ~ Pullifarbe, Daten) Daten_anova summary(Daten_anova)
Df Sum Sq Mean Sq F value Pr(>F) Pullifarbe 4 1638 409.6 3.999 0.00449 ** Residuals 115 11778 102.4 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Die Teststatistik \(T\) realisiert sich in dem Wert \(t\ = 3.999\).
Welche Testentscheidung treffen Sie bei einem Signifikanzniveau von \(\alpha = 0.005\)? Begründen Sie.
LösungWegen \(p =0.0045 < 0.005 = \alpha\) entscheiden wir uns für die \(H_{1}\) Wir entscheiden uns also dafür, dass sich die mittlere Aufmerksamkeit in mindestens zwei Studentinnenpopulationen unterscheidet. Wir können dabei jedoch nicht sagen, in welchen Populationen.
Berechnen Sie den p-Wert mit Hilfe der Funktion
pf()
und Überprüfen Sie, ob Sie das gleiche Ergebnis wie im Output oben erhalten.LösungDie Teststatistik \(T\) folgt unter der \(H_{0}\) einer \(F\)-Verteilung mit den Parametern \(\nu_{1} = {df}_{zw} = m - 1 = 4\) und \(\nu_{2} = {df}_{inn} = m \cdot (n - 1) = 115\).
Der p-Wert ist \(p\ = P(T \geq 3.999) = 1 - P(T \leq 3.999) = 1 - \ F(3.999)\):
1 - pf(3.999, df1 = 4, df2 = 115)
[1] 0.004487834
Treffen Sie die Testentscheidung nun mit Hilfe des kritischen Bereiches. Berechnen Sie den kritischen Wert mit der Funktion
qf()
.LösungDie Teststatistik \(T\) folgt unter der \(H_{0}\) einer \(F\)-Verteilung mit den Parametern \(\nu_{1} = {df}_{zw} = m - 1 = 4\) und \(\nu_{2} = {df}_{inn} = m \cdot (n - 1) = 115\).
Kritischer Wert:
qf(0.995, df1 = 4, df2 = 115)
[1] 3.929893
Testentscheidung auf der Basis des kritischen Bereichs:
Der kritische Wert für \(\alpha\ = \ 0.005\) ist \(t_{krit} = 3.93\). Somit liegt der beobachtete Wert \(t\ = \ 3.999\) im kritischen Bereich \(K_{T} = \left\lbrack 3.93;\ \infty \right\lbrack\) und wir entscheiden uns für die Alternativhypothese, dass sich die Pullifarben-Gruppen in ihrer mittleren Aufmerksamkeit unterscheiden.
Sie wollen mithilfe eines Omnibus-Tests untersuchen, ob die diskrete Variable Tageszeit (mit den Ausprägungen morgens vs. mittags vs. abends) mit der stetigen Punktezahl von Studierenden in der Klausur zusammenhängt. Sie erheben pro Faktorstufe 40 Personen.
Laden Sie den folgenden Datensatz: herunter und lesen Sie diesen in R ein.
Speichern Sie das Objekt unter dem NamenDaten
ab. Für die Berechnung des Omnibus-Tests verwenden Sie zuerst die Funktionaov(AV Name ~ UV Name, data = Daten)
. Weisen Sie dem Objekt den NamenDaten_anova
zu. Danach wenden Sie die Funktionsummary()
auf das ObjektDaten_anova
an. In welchem Wert realisiert sich die Teststatistik T?Lösung<- read.csv2("Daten6") # Daten einlesen Daten <- aov(Punktezahl ~ Tageszeit, Daten) Daten_anova summary(Daten_anova)
Df Sum Sq Mean Sq F value Pr(>F) Tageszeit 2 807 403.3 4.159 0.018 * Residuals 117 11345 97.0 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Die Teststatistik \(T\) realisiert sich in dem Wert \(t\ = 4.159\).
Welche Testentscheidung treffen Sie bei einem Signifikanzniveau von \(\alpha = 0.005\)? Begründen Sie.
LösungWegen \(p =0.018 > 0.005 = \alpha\) entscheiden wir uns für die \(H_{0}\) Wir entscheiden uns also dafür, dass sich die mittlere Punktezahl zwischen den Studentinnenpopulationen nicht unterscheidet.
Berechnen Sie den p-Wert mit Hilfe der Funktion
pf()
und Überprüfen Sie, ob Sie das gleiche Ergebnis wie im Output oben erhalten.LösungDie Teststatistik \(T\) folgt unter der \(H_{0}\) einer \(F\)-Verteilung mit den Parametern \(\nu_{1} = {df}_{zw} = m - 1 = 2\) und \(\nu_{2} = {df}_{inn} = m \cdot (n - 1) = 117\).
Der p-Wert ist \(p\ = P(T \geq 4.159) = 1 - P(T \leq 4.159) = 1 - \ F(4.159)\):
1 - pf(4.159, df1 = 2, df2 = 117)
[1] 0.01799226
Treffen Sie die Testentscheidung nun mit Hilfe des kritischen Bereiches. Berechnen Sie den kritischen Wert mit der Funktion
qf()
.LösungDie Teststatistik \(T\) folgt unter der \(H_{0}\) einer \(F\)-Verteilung mit den Parametern \(\nu_{1} = {df}_{zw} = m - 1 = 2\) und \(\nu_{2} = {df}_{inn} = m \cdot (n - 1) = 117\).
Kritischer Wert:
qf(0.995, df1 = 2, df2 = 117)
[1] 5.545661
Testentscheidung auf der Basis des kritischen Bereichs:
Der kritische Wert für \(\alpha\ = \ 0.005\) ist \(t_{krit} = 5.546\). Somit liegt der beobachtete Wert \(t\ = \ 4.159\) nicht im kritischen Bereich \(K_{T} = \left\lbrack 5.546;\ \infty \right\lbrack\) und wir entscheiden uns für die Nullhypothese, dass sich die Tageszeit-Gruppen nicht in ihrer mittleren Punktezahl unterscheiden.
Sie wollen mithilfe eines Omnibus-Tests untersuchen, ob die diskrete Variable Pullifarbe (mit den Ausprägungen blau vs. lila vs. grau vs. schwarz vs. gelb) mit der stetigen Gelassenheit von Studierenden in der Klausur zusammenhängt. Sie erheben pro Faktorstufe 24 Personen.
Laden Sie den folgenden Datensatz: herunter und lesen Sie diesen in R ein.
Speichern Sie das Objekt unter dem NamenDaten
ab. Für die Berechnung des Omnibus-Tests verwenden Sie zuerst die Funktionaov(AV Name ~ UV Name, data = Daten)
. Weisen Sie dem Objekt den NamenDaten_anova
zu. Danach wenden Sie die Funktionsummary()
auf das ObjektDaten_anova
an. In welchem Wert realisiert sich die Teststatistik T?Lösung<- read.csv2("Daten7") # Daten einlesen Daten <- aov(Gelassenheit ~ Pullifarbe, Daten) Daten_anova summary(Daten_anova)
Df Sum Sq Mean Sq F value Pr(>F) Pullifarbe 4 1659 414.8 4.584 0.0018 ** Residuals 115 10406 90.5 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Die Teststatistik \(T\) realisiert sich in dem Wert \(t\ = 4.584\).
Welche Testentscheidung treffen Sie bei einem Signifikanzniveau von \(\alpha = 0.005\)? Begründen Sie.
LösungWegen \(p =0.0018 < 0.005 = \alpha\) entscheiden wir uns für die \(H_{1}\) Wir entscheiden uns also dafür, dass sich die mittlere Gelassenheit in mindestens zwei Studentinnenpopulationen unterscheidet. Wir können dabei jedoch nicht sagen, in welchen Populationen.
Berechnen Sie den p-Wert mit Hilfe der Funktion
pf()
und Überprüfen Sie, ob Sie das gleiche Ergebnis wie im Output oben erhalten.LösungDie Teststatistik \(T\) folgt unter der \(H_{0}\) einer \(F\)-Verteilung mit den Parametern \(\nu_{1} = {df}_{zw} = m - 1 = 4\) und \(\nu_{2} = {df}_{inn} = m \cdot (n - 1) = 115\).
Der p-Wert ist \(p\ = P(T \geq 4.584) = 1 - P(T \leq 4.584) = 1 - \ F(4.584)\):
1 - pf(4.584, df1 = 4, df2 = 115)
[1] 0.001800496
Treffen Sie die Testentscheidung nun mit Hilfe des kritischen Bereiches. Berechnen Sie den kritischen Wert mit der Funktion
qf()
.LösungDie Teststatistik \(T\) folgt unter der \(H_{0}\) einer \(F\)-Verteilung mit den Parametern \(\nu_{1} = {df}_{zw} = m - 1 = 4\) und \(\nu_{2} = {df}_{inn} = m \cdot (n - 1) = 115\).
Kritischer Wert:
qf(0.995, df1 = 4, df2 = 115)
[1] 3.929893
Testentscheidung auf der Basis des kritischen Bereichs:
Der kritische Wert für \(\alpha\ = \ 0.005\) ist \(t_{krit} = 3.93\). Somit liegt der beobachtete Wert \(t\ = \ 4.584\) im kritischen Bereich \(K_{T} = \left\lbrack 3.93;\ \infty \right\lbrack\) und wir entscheiden uns für die Alternativhypothese, dass sich die Pullifarben-Gruppen in ihrer mittleren Gelassenheit unterscheiden.
Sie wollen mithilfe eines Omnibus-Tests untersuchen, ob die diskrete Variable Tageszeit (mit den Ausprägungen morgens vs. mittags vs. abends) mit der stetigen Zuversicht von Studierenden in der Klausur zusammenhängt. Sie erheben pro Faktorstufe 40 Personen.
Laden Sie den folgenden Datensatz: herunter und lesen Sie diesen in R ein.
Speichern Sie das Objekt unter dem NamenDaten
ab. Für die Berechnung des Omnibus-Tests verwenden Sie zuerst die Funktionaov(AV Name ~ UV Name, data = Daten)
. Weisen Sie dem Objekt den NamenDaten_anova
zu. Danach wenden Sie die Funktionsummary()
auf das ObjektDaten_anova
an. In welchem Wert realisiert sich die Teststatistik T?Lösung<- read.csv2("Daten8") # Daten einlesen Daten <- aov(Zuversicht ~ Tageszeit, Daten) Daten_anova summary(Daten_anova)
Df Sum Sq Mean Sq F value Pr(>F) Tageszeit 2 3250 1625 14.26 2.88e-06 *** Residuals 117 13335 114 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Die Teststatistik \(T\) realisiert sich in dem Wert \(t\ = 14.256\).
Welche Testentscheidung treffen Sie bei einem Signifikanzniveau von \(\alpha = 0.005\)? Begründen Sie.
LösungWegen \(p =3\times 10^{-6} < 0.005 = \alpha\) entscheiden wir uns für die \(H_{1}\) Wir entscheiden uns also dafür, dass sich die mittlere Zuversicht in mindestens zwei Studentinnenpopulationen unterscheidet. Wir können dabei jedoch nicht sagen, in welchen Populationen.
Berechnen Sie den p-Wert mit Hilfe der Funktion
pf()
und Überprüfen Sie, ob Sie das gleiche Ergebnis wie im Output oben erhalten.LösungDie Teststatistik \(T\) folgt unter der \(H_{0}\) einer \(F\)-Verteilung mit den Parametern \(\nu_{1} = {df}_{zw} = m - 1 = 2\) und \(\nu_{2} = {df}_{inn} = m \cdot (n - 1) = 117\).
Der p-Wert ist \(p\ = P(T \geq 14.256) = 1 - P(T \leq 14.256) = 1 - \ F(14.256)\):
1 - pf(14.256, df1 = 2, df2 = 117)
[1] 2.879337e-06
Treffen Sie die Testentscheidung nun mit Hilfe des kritischen Bereiches. Berechnen Sie den kritischen Wert mit der Funktion
qf()
.LösungDie Teststatistik \(T\) folgt unter der \(H_{0}\) einer \(F\)-Verteilung mit den Parametern \(\nu_{1} = {df}_{zw} = m - 1 = 2\) und \(\nu_{2} = {df}_{inn} = m \cdot (n - 1) = 117\).
Kritischer Wert:
qf(0.995, df1 = 2, df2 = 117)
[1] 5.545661
Testentscheidung auf der Basis des kritischen Bereichs:
Der kritische Wert für \(\alpha\ = \ 0.005\) ist \(t_{krit} = 5.546\). Somit liegt der beobachtete Wert \(t\ = \ 14.256\) im kritischen Bereich \(K_{T} = \left\lbrack 5.546;\ \infty \right\lbrack\) und wir entscheiden uns für die Alternativhypothese, dass sich die Tageszeit-Gruppen in ihrer mittleren Zuversicht unterscheiden.