Übungsaufgaben

Effektgrößen und Stichprobenumfangsplanung in der ELR und MLR

Hinweis

Die hier veröffentlichten Übungsaufgaben sind brandneu und deshalb noch nicht auf Herz und Nieren überprüft. Sollten Sie Fehler entdecken, geben Sie uns bitte unbedingt eine Rückmeldung an philipp.sckopke(at)psy.lmu.de, damit wir so bald wie möglich eine verbesserte Version online stellen können.

  1. Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Freibadkarten in Tausend, die Anzahl der verkauften Sonnencremetuben in Tausend sowie die Anzahl der Motorradfahrer erhoben.
    Laden sie den Datensatz herunter und lesen Sie ihn als Objekt Daten ein.
  1. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Freibadkarten, Sonnencremetuben\) in R und interpretieren Sie dieses.

    Hinweis

    Für den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion scale() z-standardisiert werden. Diese kann direkt in der lm-Funktion angewandt werden: fit <- lm(scale(Motorradfahrer) ~ scale(Freibadkarten) + scale(Sonnencremetuben), data = Daten)

    Schätzwerte:

    library(multcomp)
    
    ## Daten einlesen:
    Daten <- read.csv2("Daten1.csv")
    
    ## fit-Objekt speichern:
    fit <- lm(scale(Motorradfahrer) ~ scale(Freibadkarten) + scale(Sonnencremetuben), Daten)
    
    summary(fit)
    
    Residuals:
        Min      1Q  Median      3Q     Max 
    -51.367 -12.718  -0.016  15.267  52.432 
    
    Coefficients:
                     Estimate Std. Error t value Pr(>|t|)    
    (Intercept)      103.0954    18.1453   5.682 9.92e-08 ***
    Freibadkarten      0.6177     0.1376   4.488 1.69e-05 ***
    Sonnencremetuben   0.2207     0.1173   1.881   0.0624 .  
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 19.85 on 117 degrees of freedom
    Multiple R-squared:  0.1698,   Adjusted R-squared:  0.1556 
    F-statistic: 11.97 on 2 and 117 DF,  p-value: 1.871e-05
    ## KIs ausgeben:
    confint(fit)
                           2.5 %      97.5 %
    (Intercept)      67.15971559 139.0311711
    Freibadkarten     0.34512893   0.8901836
    Sonnencremetuben -0.01162804   0.4530866

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.345 bis 0.89 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Freibadkarten um eine Standardabweichung erhöht und die Anzahl an Sonnencremetuben konstant bleibt.

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um -0.012 bis 0.453 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Sonnencremetuben um eine Standardabweichung erhöht und die Anzahl an Freibadkarten konstant bleibt.

  2. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.

    Hinweis

    Für das KI für \(\rho^{2}\) können Sie die Funktion ci.R2() aus dem MBESS package verwenden:

    ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße).

    library(MBESS)
    ci.R2(0.17, p = 2, N = 120)
    $Lower.Conf.Limit.R2
    [1] 0.05633634
    
    $Prob.Less.Lower
    [1] 0.025
    
    $Upper.Conf.Limit.R2
    [1] 0.2949528
    
    $Prob.Greater.Upper
    [1] 0.025

    Wir gehen davon aus, dass 5.6 bis 29.5 % der Gesamtvarianz der Motorradfahrer in der Population durch die Freibadkarten und die Sonnencremetuben zusammen erklärt werden können.

  3. Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Freibadkarten}^{2}\) und \(\rho_{Sonnencremetuben}^{2}\) in R und interpretieren Sie dieses.

    \(\rho_{Freibadkarten}^{2} = \rho^2 - \rho_{- Freibadkarten}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.17\) ist.

    Der Schätzwert für \(\rho_{- Freibadkarten}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Freibadkarten:

    fit2 <- lm(Motorradfahrer ~ Sonnencremetuben, Daten)
    summary(fit2)
    
    Coefficients:
                     Estimate Std. Error t value Pr(>|t|)    
    (Intercept)      165.1367    12.6735  13.030   <2e-16 ***
    Sonnencremetuben   0.2282     0.1265   1.804   0.0737 .  
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 21.4 on 118 degrees of freedom
    Multiple R-squared:  0.02685,  Adjusted R-squared:  0.0186 
    F-statistic: 3.256 on 1 and 118 DF,  p-value: 0.07372

    Ein Schätzwert für die Effektstärke \(\rho_{Freibadkarten}^{2} = \rho^2 - \rho_{- Freibadkarten}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Freibadkarten}^{2}\), in dem Fall also 0.17 - 0.027 = 0.143.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Sonnencremetuben hinweg nur durch die Freibadkarten erklärt werden kann, beträgt also 14.3 %.



    \(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.17\) ist.

    Der Schätzwert für \(\rho_{- Sonnencremetuben}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Sonnencremetuben:

    fit3 <- lm(Motorradfahrer ~ Freibadkarten, Daten)
    summary(fit3)
    
    Coefficients:
                  Estimate Std. Error t value Pr(>|t|)    
    (Intercept)   124.5758    14.2537   8.740 1.87e-14 ***
    Freibadkarten   0.6213     0.1391   4.468 1.82e-05 ***
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 20.06 on 118 degrees of freedom
    Multiple R-squared:  0.1447,   Adjusted R-squared:  0.1374 
    F-statistic: 19.96 on 1 and 118 DF,  p-value: 1.823e-05

    Ein Schätzwert für die Effektstärke \(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Sonnencremetuben}^{2}\), in dem Fall also 0.17 - 0.145 = 0.025.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Freibadkarten hinweg nur durch die Sonnencremetuben erklärt werden kann, beträgt also 2.5 %.

  1. Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Cocktails in Tausend, die Anzahl der verkauften Flipflops in Tausend sowie die Anzahl der Motorradfahrer erhoben.
    Laden sie den Datensatz herunter und lesen Sie ihn als Objekt Daten ein.
  1. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Cocktails, Flipflops\) in R und interpretieren Sie dieses.

    Hinweis

    Für den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion scale() z-standardisiert werden. Diese kann direkt in der lm-Funktion angewandt werden: fit <- lm(scale(Motorradfahrer) ~ scale(Cocktails) + scale(Flipflops), data = Daten)

    Schätzwerte:

    library(multcomp)
    
    ## Daten einlesen:
    Daten <- read.csv2("Daten2.csv")
    
    ## fit-Objekt speichern:
    fit <- lm(scale(Motorradfahrer) ~ scale(Cocktails) + scale(Flipflops), Daten)
    
    summary(fit)
    
    Residuals:
        Min      1Q  Median      3Q     Max 
    -56.677 -11.672  -0.892  12.681  43.531 
    
    Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 92.63420   14.99847   6.176 9.81e-09 ***
    Cocktails    0.23139    0.09964   2.322   0.0219 *  
    Flipflops    0.91464    0.10997   8.317 1.88e-13 ***
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 18.45 on 117 degrees of freedom
    Multiple R-squared:  0.3889,   Adjusted R-squared:  0.3785 
    F-statistic: 37.23 on 2 and 117 DF,  p-value: 3.069e-13
    ## KIs ausgeben:
    confint(fit)
                      2.5 %      97.5 %
    (Intercept) 62.93051058 122.3378810
    Cocktails    0.03406072   0.4287248
    Flipflops    0.69684965   1.1324309

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.034 bis 0.429 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Cocktails um eine Standardabweichung erhöht und die Anzahl an Flipflops konstant bleibt.

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.697 bis 1.132 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Flipflops um eine Standardabweichung erhöht und die Anzahl an Cocktails konstant bleibt.

  2. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.

    Hinweis

    Für das KI für \(\rho^{2}\) können Sie die Funktion ci.R2() aus dem MBESS package verwenden:

    ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße).

    library(MBESS)
    ci.R2(0.389, p = 2, N = 120)
    $Lower.Conf.Limit.R2
    [1] 0.2427068
    
    $Prob.Less.Lower
    [1] 0.025
    
    $Upper.Conf.Limit.R2
    [1] 0.5151672
    
    $Prob.Greater.Upper
    [1] 0.025

    Wir gehen davon aus, dass 24.3 bis 51.5 % der Gesamtvarianz der Motorradfahrer in der Population durch die Cocktails und die Flipflops zusammen erklärt werden können.

  3. Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Cocktails}^{2}\) und \(\rho_{Flipflops}^{2}\) in R und interpretieren Sie dieses.

    \(\rho_{Cocktails}^{2} = \rho^2 - \rho_{- Cocktails}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.389\) ist.

    Der Schätzwert für \(\rho_{- Cocktails}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Cocktails:

    fit2 <- lm(Motorradfahrer ~ Flipflops, Daten)
    summary(fit2)
    
    Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 115.9546    11.3460   10.22  < 2e-16 ***
    Flipflops     0.9139     0.1120    8.16 4.12e-13 ***
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 18.79 on 118 degrees of freedom
    Multiple R-squared:  0.3607,   Adjusted R-squared:  0.3553 
    F-statistic: 66.59 on 1 and 118 DF,  p-value: 4.121e-13

    Ein Schätzwert für die Effektstärke \(\rho_{Cocktails}^{2} = \rho^2 - \rho_{- Cocktails}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Cocktails}^{2}\), in dem Fall also 0.389 - 0.361 = 0.028.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Flipflops hinweg nur durch die Cocktails erklärt werden kann, beträgt also 2.8 %.



    \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.389\) ist.

    Der Schätzwert für \(\rho_{- Flipflops}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Flipflops:

    fit3 <- lm(Motorradfahrer ~ Cocktails, Daten)
    summary(fit3)
    
    Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 184.4552    12.7524  14.464   <2e-16 ***
    Cocktails     0.2291     0.1252   1.831   0.0697 .  
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 23.18 on 118 degrees of freedom
    Multiple R-squared:  0.02762,  Adjusted R-squared:  0.01938 
    F-statistic: 3.351 on 1 and 118 DF,  p-value: 0.06967

    Ein Schätzwert für die Effektstärke \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Flipflops}^{2}\), in dem Fall also 0.389 - 0.028 = 0.361.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Cocktails hinweg nur durch die Flipflops erklärt werden kann, beträgt also 36.1 %.

  1. Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Eiskugeln in Tausend, die Anzahl der verkauften Flipflops in Tausend sowie die Anzahl der Motorradfahrer erhoben.
    Laden sie den Datensatz herunter und lesen Sie ihn als Objekt Daten ein.
  1. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Eiskugeln, Flipflops\) in R und interpretieren Sie dieses.

    Hinweis

    Für den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion scale() z-standardisiert werden. Diese kann direkt in der lm-Funktion angewandt werden: fit <- lm(scale(Motorradfahrer) ~ scale(Eiskugeln) + scale(Flipflops), data = Daten)

    Schätzwerte:

    library(multcomp)
    
    ## Daten einlesen:
    Daten <- read.csv2("Daten3.csv")
    
    ## fit-Objekt speichern:
    fit <- lm(scale(Motorradfahrer) ~ scale(Eiskugeln) + scale(Flipflops), Daten)
    
    summary(fit)
    
    Residuals:
        Min      1Q  Median      3Q     Max 
    -51.036 -12.878   1.125  11.637  65.722 
    
    Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
    (Intercept)  57.0842    19.1126   2.987 0.003435 ** 
    Eiskugeln     0.5079     0.1473   3.449 0.000784 ***
    Flipflops     0.6989     0.1094   6.389 3.53e-09 ***
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 20.21 on 117 degrees of freedom
    Multiple R-squared:  0.2981,   Adjusted R-squared:  0.2861 
    F-statistic: 24.84 on 2 and 117 DF,  p-value: 1.018e-09
    ## KIs ausgeben:
    confint(fit)
                     2.5 %     97.5 %
    (Intercept) 19.2327646 94.9357265
    Eiskugeln    0.2162016  0.7995017
    Flipflops    0.4822716  0.9155790

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.216 bis 0.8 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Eiskugeln um eine Standardabweichung erhöht und die Anzahl an Flipflops konstant bleibt.

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.482 bis 0.916 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Flipflops um eine Standardabweichung erhöht und die Anzahl an Eiskugeln konstant bleibt.

  2. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.

    Hinweis

    Für das KI für \(\rho^{2}\) können Sie die Funktion ci.R2() aus dem MBESS package verwenden:

    ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße).

    library(MBESS)
    ci.R2(0.298, p = 2, N = 120)
    $Lower.Conf.Limit.R2
    [1] 0.1575172
    
    $Prob.Less.Lower
    [1] 0.025
    
    $Upper.Conf.Limit.R2
    [1] 0.4290163
    
    $Prob.Greater.Upper
    [1] 0.025

    Wir gehen davon aus, dass 15.8 bis 42.9 % der Gesamtvarianz der Motorradfahrer in der Population durch die Eiskugeln und die Flipflops zusammen erklärt werden können.

  3. Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Eiskugeln}^{2}\) und \(\rho_{Flipflops}^{2}\) in R und interpretieren Sie dieses.

    \(\rho_{Eiskugeln}^{2} = \rho^2 - \rho_{- Eiskugeln}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.298\) ist.

    Der Schätzwert für \(\rho_{- Eiskugeln}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Eiskugeln:

    fit2 <- lm(Motorradfahrer ~ Flipflops, Daten)
    summary(fit2)
    
    Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 110.8459    11.5560   9.592  < 2e-16 ***
    Flipflops     0.6706     0.1140   5.882 3.86e-08 ***
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 21.12 on 118 degrees of freedom
    Multiple R-squared:  0.2267,   Adjusted R-squared:  0.2202 
    F-statistic:  34.6 on 1 and 118 DF,  p-value: 3.864e-08

    Ein Schätzwert für die Effektstärke \(\rho_{Eiskugeln}^{2} = \rho^2 - \rho_{- Eiskugeln}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Eiskugeln}^{2}\), in dem Fall also 0.298 - 0.227 = 0.071.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Flipflops hinweg nur durch die Eiskugeln erklärt werden kann, beträgt also 7.1 %.



    \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.298\) ist.

    Der Schätzwert für \(\rho_{- Flipflops}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Flipflops:

    fit3 <- lm(Motorradfahrer ~ Eiskugeln, Daten)
    summary(fit3)
    
    Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 134.0071    17.1662   7.806 2.65e-12 ***
    Eiskugeln     0.4373     0.1698   2.575   0.0113 *  
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 23.37 on 118 degrees of freedom
    Multiple R-squared:  0.0532,   Adjusted R-squared:  0.04518 
    F-statistic: 6.631 on 1 and 118 DF,  p-value: 0.01126

    Ein Schätzwert für die Effektstärke \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Flipflops}^{2}\), in dem Fall also 0.298 - 0.053 = 0.245.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Eiskugeln hinweg nur durch die Flipflops erklärt werden kann, beträgt also 24.5 %.

  1. Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Freibadkarten in Tausend, die Anzahl der verkauften Flipflops in Tausend sowie die Anzahl der Bademeister erhoben.
    Laden sie den Datensatz herunter und lesen Sie ihn als Objekt Daten ein.
  1. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Freibadkarten, Flipflops\) in R und interpretieren Sie dieses.

    Hinweis

    Für den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion scale() z-standardisiert werden. Diese kann direkt in der lm-Funktion angewandt werden: fit <- lm(scale(Bademeister) ~ scale(Freibadkarten) + scale(Flipflops), data = Daten)

    Schätzwerte:

    library(multcomp)
    
    ## Daten einlesen:
    Daten <- read.csv2("Daten4.csv")
    
    ## fit-Objekt speichern:
    fit <- lm(scale(Bademeister) ~ scale(Freibadkarten) + scale(Flipflops), Daten)
    
    summary(fit)
    
    Residuals:
        Min      1Q  Median      3Q     Max 
    -56.509 -12.942   2.397  13.201  49.661 
    
    Coefficients:
                  Estimate Std. Error t value Pr(>|t|)    
    (Intercept)   103.5334    16.9991   6.091 1.47e-08 ***
    Freibadkarten   0.1131     0.1277   0.885   0.3778    
    Flipflops       0.2969     0.1165   2.548   0.0121 *  
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 19.12 on 117 degrees of freedom
    Multiple R-squared:  0.06033,  Adjusted R-squared:  0.04427 
    F-statistic: 3.756 on 2 and 117 DF,  p-value: 0.02624
    ## KIs ausgeben:
    confint(fit)
                        2.5 %      97.5 %
    (Intercept)   69.86763247 137.1992594
    Freibadkarten -0.13985572   0.3659656
    Flipflops      0.06614788   0.5276702

    Wir gehen davon aus, dass sich die Anzahl der Bademeister im Mittel um -0.14 bis 0.366 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Freibadkarten um eine Standardabweichung erhöht und die Anzahl an Flipflops konstant bleibt.

    Wir gehen davon aus, dass sich die Anzahl der Bademeister im Mittel um 0.066 bis 0.528 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Flipflops um eine Standardabweichung erhöht und die Anzahl an Freibadkarten konstant bleibt.

  2. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.

    Hinweis

    Für das KI für \(\rho^{2}\) können Sie die Funktion ci.R2() aus dem MBESS package verwenden:

    ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße).

    library(MBESS)
    ci.R2(0.06, p = 2, N = 120)
    $Lower.Conf.Limit.R2
    [1] 0
    
    $Prob.Less.Lower
    [1] 0.025
    
    $Upper.Conf.Limit.R2
    [1] 0.1549232
    
    $Prob.Greater.Upper
    [1] 0.025

    Wir gehen davon aus, dass 0 bis 15.5 % der Gesamtvarianz der Bademeister in der Population durch die Freibadkarten und die Flipflops zusammen erklärt werden können.

  3. Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Freibadkarten}^{2}\) und \(\rho_{Flipflops}^{2}\) in R und interpretieren Sie dieses.

    \(\rho_{Freibadkarten}^{2} = \rho^2 - \rho_{- Freibadkarten}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.06\) ist.

    Der Schätzwert für \(\rho_{- Freibadkarten}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Freibadkarten:

    fit2 <- lm(Bademeister ~ Flipflops, Daten)
    summary(fit2)
    
    Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 114.4841    11.6496   9.827   <2e-16 ***
    Flipflops     0.3019     0.1163   2.596   0.0106 *  
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 19.1 on 118 degrees of freedom
    Multiple R-squared:  0.05404,  Adjusted R-squared:  0.04602 
    F-statistic: 6.741 on 1 and 118 DF,  p-value: 0.01062

    Ein Schätzwert für die Effektstärke \(\rho_{Freibadkarten}^{2} = \rho^2 - \rho_{- Freibadkarten}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Freibadkarten}^{2}\), in dem Fall also 0.06 - 0.054 = 0.006.
    Der Anteil der Gesamtvarianz der Bademeister, der über die Flipflops hinweg nur durch die Freibadkarten erklärt werden kann, beträgt also 0.6 %.



    \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.06\) ist.

    Der Schätzwert für \(\rho_{- Flipflops}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Flipflops:

    fit3 <- lm(Bademeister ~ Freibadkarten, Daten)
    summary(fit3)
    
    Coefficients:
                  Estimate Std. Error t value Pr(>|t|)    
    (Intercept)   131.3534    13.3295   9.854   <2e-16 ***
    Freibadkarten   0.1288     0.1305   0.987    0.326    
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 19.56 on 118 degrees of freedom
    Multiple R-squared:  0.008186, Adjusted R-squared:  -0.0002188 
    F-statistic: 0.974 on 1 and 118 DF,  p-value: 0.3257

    Ein Schätzwert für die Effektstärke \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Flipflops}^{2}\), in dem Fall also 0.06 - 0.008 = 0.052.
    Der Anteil der Gesamtvarianz der Bademeister, der über die Freibadkarten hinweg nur durch die Flipflops erklärt werden kann, beträgt also 5.2 %.

  1. Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Eiskugeln in Tausend, die Anzahl der verkauften Sonnencremetuben in Tausend sowie die Anzahl der Motorradfahrer erhoben.
    Laden sie den Datensatz herunter und lesen Sie ihn als Objekt Daten ein.
  1. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Eiskugeln, Sonnencremetuben\) in R und interpretieren Sie dieses.

    Hinweis

    Für den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion scale() z-standardisiert werden. Diese kann direkt in der lm-Funktion angewandt werden: fit <- lm(scale(Motorradfahrer) ~ scale(Eiskugeln) + scale(Sonnencremetuben), data = Daten)

    Schätzwerte:

    library(multcomp)
    
    ## Daten einlesen:
    Daten <- read.csv2("Daten5.csv")
    
    ## fit-Objekt speichern:
    fit <- lm(scale(Motorradfahrer) ~ scale(Eiskugeln) + scale(Sonnencremetuben), Daten)
    
    summary(fit)
    
    Residuals:
        Min      1Q  Median      3Q     Max 
    -56.265 -14.254  -0.313  13.073  45.864 
    
    Coefficients:
                     Estimate Std. Error t value Pr(>|t|)    
    (Intercept)       99.1360    17.2337   5.752 7.17e-08 ***
    Eiskugeln          0.2818     0.1256   2.244  0.02671 *  
    Sonnencremetuben   0.3349     0.1224   2.737  0.00718 ** 
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 20.31 on 117 degrees of freedom
    Multiple R-squared:  0.1016,   Adjusted R-squared:  0.08625 
    F-statistic: 6.616 on 2 and 117 DF,  p-value: 0.001896
    ## KIs ausgeben:
    confint(fit)
                           2.5 %      97.5 %
    (Intercept)      65.00548495 133.2664582
    Eiskugeln         0.03311271   0.5305469
    Sonnencremetuben  0.09253966   0.5772896

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.033 bis 0.531 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Eiskugeln um eine Standardabweichung erhöht und die Anzahl an Sonnencremetuben konstant bleibt.

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.093 bis 0.577 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Sonnencremetuben um eine Standardabweichung erhöht und die Anzahl an Eiskugeln konstant bleibt.

  2. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.

    Hinweis

    Für das KI für \(\rho^{2}\) können Sie die Funktion ci.R2() aus dem MBESS package verwenden:

    ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße).

    library(MBESS)
    ci.R2(0.102, p = 2, N = 120)
    $Lower.Conf.Limit.R2
    [1] 0.01606847
    
    $Prob.Less.Lower
    [1] 0.025
    
    $Upper.Conf.Limit.R2
    [1] 0.2130743
    
    $Prob.Greater.Upper
    [1] 0.025

    Wir gehen davon aus, dass 1.6 bis 21.3 % der Gesamtvarianz der Motorradfahrer in der Population durch die Eiskugeln und die Sonnencremetuben zusammen erklärt werden können.

  3. Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Eiskugeln}^{2}\) und \(\rho_{Sonnencremetuben}^{2}\) in R und interpretieren Sie dieses.

    \(\rho_{Eiskugeln}^{2} = \rho^2 - \rho_{- Eiskugeln}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.102\) ist.

    Der Schätzwert für \(\rho_{- Eiskugeln}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Eiskugeln:

    fit2 <- lm(Motorradfahrer ~ Sonnencremetuben, Daten)
    summary(fit2)
    
    Coefficients:
                     Estimate Std. Error t value Pr(>|t|)    
    (Intercept)      125.9574    12.6264   9.976  < 2e-16 ***
    Sonnencremetuben   0.3499     0.1243   2.815  0.00571 ** 
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 20.65 on 118 degrees of freedom
    Multiple R-squared:  0.06294,  Adjusted R-squared:  0.055 
    F-statistic: 7.925 on 1 and 118 DF,  p-value: 0.005714

    Ein Schätzwert für die Effektstärke \(\rho_{Eiskugeln}^{2} = \rho^2 - \rho_{- Eiskugeln}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Eiskugeln}^{2}\), in dem Fall also 0.102 - 0.063 = 0.039.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Sonnencremetuben hinweg nur durch die Eiskugeln erklärt werden kann, beträgt also 3.9 %.



    \(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.102\) ist.

    Der Schätzwert für \(\rho_{- Sonnencremetuben}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Sonnencremetuben:

    fit3 <- lm(Motorradfahrer ~ Eiskugeln, Daten)
    summary(fit3)
    
    Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 130.9024    13.0835  10.005   <2e-16 ***
    Eiskugeln     0.3005     0.1288   2.333   0.0213 *  
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 20.86 on 118 degrees of freedom
    Multiple R-squared:  0.0441,   Adjusted R-squared:  0.036 
    F-statistic: 5.444 on 1 and 118 DF,  p-value: 0.02133

    Ein Schätzwert für die Effektstärke \(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Sonnencremetuben}^{2}\), in dem Fall also 0.102 - 0.044 = 0.058.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Eiskugeln hinweg nur durch die Sonnencremetuben erklärt werden kann, beträgt also 5.8 %.

  1. Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Sonnencremetuben in Tausend, die Anzahl der verkauften Flipflops in Tausend sowie die Anzahl der Motorradfahrer erhoben.
    Laden sie den Datensatz herunter und lesen Sie ihn als Objekt Daten ein.
  1. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Sonnencremetuben, Flipflops\) in R und interpretieren Sie dieses.

    Hinweis

    Für den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion scale() z-standardisiert werden. Diese kann direkt in der lm-Funktion angewandt werden: fit <- lm(scale(Motorradfahrer) ~ scale(Sonnencremetuben) + scale(Flipflops), data = Daten)

    Schätzwerte:

    library(multcomp)
    
    ## Daten einlesen:
    Daten <- read.csv2("Daten6.csv")
    
    ## fit-Objekt speichern:
    fit <- lm(scale(Motorradfahrer) ~ scale(Sonnencremetuben) + scale(Flipflops), Daten)
    
    summary(fit)
    
    Residuals:
       Min     1Q Median     3Q    Max 
    -48.96 -12.20  -2.62  14.81  42.41 
    
    Coefficients:
                     Estimate Std. Error t value Pr(>|t|)    
    (Intercept)       98.8451    16.2207   6.094 1.45e-08 ***
    Sonnencremetuben  -0.1092     0.1176  -0.929   0.3549    
    Flipflops          0.2870     0.1233   2.327   0.0217 *  
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 18.95 on 117 degrees of freedom
    Multiple R-squared:  0.04826,  Adjusted R-squared:  0.032 
    F-statistic: 2.967 on 2 and 117 DF,  p-value: 0.05536
    ## KIs ausgeben:
    confint(fit)
                           2.5 %      97.5 %
    (Intercept)      66.72086054 130.9692804
    Sonnencremetuben -0.34211086   0.1236584
    Flipflops         0.04274961   0.5311912

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um -0.342 bis 0.124 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Sonnencremetuben um eine Standardabweichung erhöht und die Anzahl an Flipflops konstant bleibt.

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um 0.043 bis 0.531 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Flipflops um eine Standardabweichung erhöht und die Anzahl an Sonnencremetuben konstant bleibt.

  2. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.

    Hinweis

    Für das KI für \(\rho^{2}\) können Sie die Funktion ci.R2() aus dem MBESS package verwenden:

    ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße).

    library(MBESS)
    ci.R2(0.048, p = 2, N = 120)
    $Lower.Conf.Limit.R2
    [1] 0
    
    $Prob.Less.Lower
    [1] 0.025
    
    $Upper.Conf.Limit.R2
    [1] 0.136338
    
    $Prob.Greater.Upper
    [1] 0.025

    Wir gehen davon aus, dass 0 bis 13.6 % der Gesamtvarianz der Motorradfahrer in der Population durch die Sonnencremetuben und die Flipflops zusammen erklärt werden können.

  3. Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Sonnencremetuben}^{2}\) und \(\rho_{Flipflops}^{2}\) in R und interpretieren Sie dieses.

    \(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.048\) ist.

    Der Schätzwert für \(\rho_{- Sonnencremetuben}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Sonnencremetuben:

    fit2 <- lm(Motorradfahrer ~ Flipflops, Daten)
    summary(fit2)
    
    Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
    (Intercept)  89.0331    12.3023   7.237 5.03e-11 ***
    Flipflops     0.2765     0.1227   2.253   0.0261 *  
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 18.94 on 118 degrees of freedom
    Multiple R-squared:  0.04125,  Adjusted R-squared:  0.03312 
    F-statistic: 5.076 on 1 and 118 DF,  p-value: 0.0261

    Ein Schätzwert für die Effektstärke \(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Sonnencremetuben}^{2}\), in dem Fall also 0.048 - 0.041 = 0.007.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Flipflops hinweg nur durch die Sonnencremetuben erklärt werden kann, beträgt also 0.7 %.



    \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.048\) ist.

    Der Schätzwert für \(\rho_{- Flipflops}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Flipflops:

    fit3 <- lm(Motorradfahrer ~ Sonnencremetuben, Daten)
    summary(fit3)
    
    Coefficients:
                      Estimate Std. Error t value Pr(>|t|)    
    (Intercept)      124.84586   11.97704  10.424   <2e-16 ***
    Sonnencremetuben  -0.08427    0.11927  -0.706    0.481    
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 19.3 on 118 degrees of freedom
    Multiple R-squared:  0.004212, Adjusted R-squared:  -0.004227 
    F-statistic: 0.4991 on 1 and 118 DF,  p-value: 0.4813

    Ein Schätzwert für die Effektstärke \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Flipflops}^{2}\), in dem Fall also 0.048 - 0.004 = 0.044.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Sonnencremetuben hinweg nur durch die Flipflops erklärt werden kann, beträgt also 4.4 %.

  1. Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Freibadkarten in Tausend, die Anzahl der verkauften Flipflops in Tausend sowie die Anzahl der Motorradfahrer erhoben.
    Laden sie den Datensatz herunter und lesen Sie ihn als Objekt Daten ein.
  1. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Freibadkarten, Flipflops\) in R und interpretieren Sie dieses.

    Hinweis

    Für den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion scale() z-standardisiert werden. Diese kann direkt in der lm-Funktion angewandt werden: fit <- lm(scale(Motorradfahrer) ~ scale(Freibadkarten) + scale(Flipflops), data = Daten)

    Schätzwerte:

    library(multcomp)
    
    ## Daten einlesen:
    Daten <- read.csv2("Daten7.csv")
    
    ## fit-Objekt speichern:
    fit <- lm(scale(Motorradfahrer) ~ scale(Freibadkarten) + scale(Flipflops), Daten)
    
    summary(fit)
    
    Residuals:
        Min      1Q  Median      3Q     Max 
    -52.026 -14.728  -0.399  15.566  53.721 
    
    Coefficients:
                  Estimate Std. Error t value Pr(>|t|)    
    (Intercept)   129.7040    22.2191   5.838 4.84e-08 ***
    Freibadkarten   0.1007     0.1468   0.686    0.494    
    Flipflops       0.1590     0.1440   1.104    0.272    
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 22.47 on 117 degrees of freedom
    Multiple R-squared:  0.01287,  Adjusted R-squared:  -0.004003 
    F-statistic: 0.7627 on 2 and 117 DF,  p-value: 0.4687
    ## KIs ausgeben:
    confint(fit)
                       2.5 %      97.5 %
    (Intercept)   85.7002996 173.7077623
    Freibadkarten -0.1901342   0.3914417
    Flipflops     -0.1262227   0.4442634

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um -0.19 bis 0.391 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Freibadkarten um eine Standardabweichung erhöht und die Anzahl an Flipflops konstant bleibt.

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um -0.126 bis 0.444 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Flipflops um eine Standardabweichung erhöht und die Anzahl an Freibadkarten konstant bleibt.

  2. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.

    Hinweis

    Für das KI für \(\rho^{2}\) können Sie die Funktion ci.R2() aus dem MBESS package verwenden:

    ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße).

    library(MBESS)
    ci.R2(0.013, p = 2, N = 120)
    $Lower.Conf.Limit.R2
    [1] 0
    
    $Prob.Less.Lower
    [1] 0.025
    
    $Upper.Conf.Limit.R2
    [1] 0.06924525
    
    $Prob.Greater.Upper
    [1] 0.025

    Wir gehen davon aus, dass 0 bis 6.9 % der Gesamtvarianz der Motorradfahrer in der Population durch die Freibadkarten und die Flipflops zusammen erklärt werden können.

  3. Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Freibadkarten}^{2}\) und \(\rho_{Flipflops}^{2}\) in R und interpretieren Sie dieses.

    \(\rho_{Freibadkarten}^{2} = \rho^2 - \rho_{- Freibadkarten}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.013\) ist.

    Der Schätzwert für \(\rho_{- Freibadkarten}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Freibadkarten:

    fit2 <- lm(Motorradfahrer ~ Flipflops, Daten)
    summary(fit2)
    
    Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 141.2271    14.4977   9.741   <2e-16 ***
    Flipflops     0.1468     0.1426   1.030    0.305    
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 22.42 on 118 degrees of freedom
    Multiple R-squared:  0.008906, Adjusted R-squared:  0.0005067 
    F-statistic:  1.06 on 1 and 118 DF,  p-value: 0.3052

    Ein Schätzwert für die Effektstärke \(\rho_{Freibadkarten}^{2} = \rho^2 - \rho_{- Freibadkarten}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Freibadkarten}^{2}\), in dem Fall also 0.013 - 0.009 = 0.004.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Flipflops hinweg nur durch die Freibadkarten erklärt werden kann, beträgt also 0.4 %.



    \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.013\) ist.

    Der Schätzwert für \(\rho_{- Flipflops}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Flipflops:

    fit3 <- lm(Motorradfahrer ~ Freibadkarten, Daten)
    summary(fit3)
    
    Coefficients:
                   Estimate Std. Error t value Pr(>|t|)    
    (Intercept)   147.75292   15.06219   9.810   <2e-16 ***
    Freibadkarten   0.08067    0.14584   0.553    0.581    
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 22.49 on 118 degrees of freedom
    Multiple R-squared:  0.002586, Adjusted R-squared:  -0.005867 
    F-statistic: 0.3059 on 1 and 118 DF,  p-value: 0.5812

    Ein Schätzwert für die Effektstärke \(\rho_{Flipflops}^{2} = \rho^2 - \rho_{- Flipflops}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Flipflops}^{2}\), in dem Fall also 0.013 - 0.003 = 0.01.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Freibadkarten hinweg nur durch die Flipflops erklärt werden kann, beträgt also 1 %.

  1. Sie haben für den Sommer 2023 in 200 Städten auf der ganzen Welt die Anzahl der verkauften Cocktails in Tausend, die Anzahl der verkauften Sonnencremetuben in Tausend sowie die Anzahl der Motorradfahrer erhoben.
    Laden sie den Datensatz herunter und lesen Sie ihn als Objekt Daten ein.
  1. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannten Effektgrößen \(\beta_{z_{j}}\ \) mit \(j = Cocktails, Sonnencremetuben\) in R und interpretieren Sie dieses.

    Hinweis

    Für den Schätzwert und das KI für \(\beta_{z_{j}}\) müssen die Variablen mithilfe der Funktion scale() z-standardisiert werden. Diese kann direkt in der lm-Funktion angewandt werden: fit <- lm(scale(Motorradfahrer) ~ scale(Cocktails) + scale(Sonnencremetuben), data = Daten)

    Schätzwerte:

    library(multcomp)
    
    ## Daten einlesen:
    Daten <- read.csv2("Daten8.csv")
    
    ## fit-Objekt speichern:
    fit <- lm(scale(Motorradfahrer) ~ scale(Cocktails) + scale(Sonnencremetuben), Daten)
    
    summary(fit)
    
    Residuals:
        Min      1Q  Median      3Q     Max 
    -47.200 -11.640  -1.704  10.564  49.883 
    
    Coefficients:
                      Estimate Std. Error t value Pr(>|t|)    
    (Intercept)      1.246e+02  1.629e+01   7.647 6.32e-12 ***
    Cocktails        5.733e-03  1.148e-01   0.050    0.960    
    Sonnencremetuben 1.753e-01  1.215e-01   1.443    0.152    
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 20.02 on 117 degrees of freedom
    Multiple R-squared:  0.01762,  Adjusted R-squared:  0.0008244 
    F-statistic: 1.049 on 2 and 117 DF,  p-value: 0.3535
    ## KIs ausgeben:
    confint(fit)
                           2.5 %      97.5 %
    (Intercept)      92.33103639 156.8703855
    Cocktails        -0.22171532   0.2331805
    Sonnencremetuben -0.06522715   0.4158517

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um -0.222 bis 0.233 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Cocktails um eine Standardabweichung erhöht und die Anzahl an Sonnencremetuben konstant bleibt.

    Wir gehen davon aus, dass sich die Anzahl der Motorradfahrer im Mittel um -0.065 bis 0.416 Standardabweichungen erhöht, falls sich die Anzahl an verkauften Sonnencremetuben um eine Standardabweichung erhöht und die Anzahl an Cocktails konstant bleibt.

  2. Berechnen Sie ein 95%-Konfidenzintervall für die unbekannte Effektgröße \(\rho^{2}\) in R und interpretieren Sie dieses.

    Hinweis

    Für das KI für \(\rho^{2}\) können Sie die Funktion ci.R2() aus dem MBESS package verwenden:

    ci.R2(R2 = r-quadrat, p = Anzahl der Prädiktoren, N = Stichprobengröße).

    library(MBESS)
    ci.R2(0.018, p = 2, N = 120)
    $Lower.Conf.Limit.R2
    [1] 0
    
    $Prob.Less.Lower
    [1] 0.025
    
    $Upper.Conf.Limit.R2
    [1] 0.08116234
    
    $Prob.Greater.Upper
    [1] 0.025

    Wir gehen davon aus, dass 0 bis 8.1 % der Gesamtvarianz der Motorradfahrer in der Population durch die Cocktails und die Sonnencremetuben zusammen erklärt werden können.

  3. Berechnen Sie jeweils die Schätzwerte für die unbekannten Effektgrößen \(\rho_{Cocktails}^{2}\) und \(\rho_{Sonnencremetuben}^{2}\) in R und interpretieren Sie dieses.

    \(\rho_{Cocktails}^{2} = \rho^2 - \rho_{- Cocktails}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.018\) ist.

    Der Schätzwert für \(\rho_{- Cocktails}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Cocktails:

    fit2 <- lm(Motorradfahrer ~ Sonnencremetuben, Daten)
    summary(fit2)
    
    Coefficients:
                     Estimate Std. Error t value Pr(>|t|)    
    (Intercept)      125.1351    12.2312  10.231   <2e-16 ***
    Sonnencremetuben   0.1756     0.1208   1.454    0.149    
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 19.93 on 118 degrees of freedom
    Multiple R-squared:  0.0176,   Adjusted R-squared:  0.009271 
    F-statistic: 2.114 on 1 and 118 DF,  p-value: 0.1487

    Ein Schätzwert für die Effektstärke \(\rho_{Cocktails}^{2} = \rho^2 - \rho_{- Cocktails}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Cocktails}^{2}\), in dem Fall also 0.018 - 0.018 = 0.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Sonnencremetuben hinweg nur durch die Cocktails erklärt werden kann, beträgt also 0 %.



    \(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\)

    Aus Teilaufgabe b. wissen wir, dass der Punktschätzwert für \(\rho^2 = 0.018\) ist.

    Der Schätzwert für \(\rho_{- Sonnencremetuben}^{2}\) entspricht dem \(r^2\) aus dem Modell ohne den Prädiktor Sonnencremetuben:

    fit3 <- lm(Motorradfahrer ~ Cocktails, Daten)
    summary(fit3)
    
    Coefficients:
                 Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 141.34720   11.49318  12.298   <2e-16 ***
    Cocktails     0.01393    0.11523   0.121    0.904    
    ---
    Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
    
    Residual standard error: 20.11 on 118 degrees of freedom
    Multiple R-squared:  0.0001239,    Adjusted R-squared:  -0.00835 
    F-statistic: 0.01462 on 1 and 118 DF,  p-value: 0.904

    Ein Schätzwert für die Effektstärke \(\rho_{Sonnencremetuben}^{2} = \rho^2 - \rho_{- Sonnencremetuben}^{2}\) wäre also die Differenz der Schätzwerte für \(\rho^2\) und \(\rho_{- Sonnencremetuben}^{2}\), in dem Fall also 0.018 - 0 = 0.018.
    Der Anteil der Gesamtvarianz der Motorradfahrer, der über die Cocktails hinweg nur durch die Sonnencremetuben erklärt werden kann, beträgt also 1.8 %.