Residuals:
Min 1Q Median 3Q Max
-5.6267 -1.2721 -0.0616 1.2217 5.1200
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.64205 1.47540 6.535 1.69e-09 ***
Berufserfahrung 0.04222 0.01439 2.933 0.00403 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.076 on 118 degrees of freedom
Multiple R-squared: 0.06795, Adjusted R-squared: 0.06006
F-statistic: 8.603 on 1 and 118 DF, p-value: 0.004032
Übungsaufgaben
Einführung in die Regressionsanalyse
Die hier veröffentlichten Übungsaufgaben sind brandneu und deshalb noch nicht auf Herz und Nieren überprüft. Sollten Sie Fehler entdecken, geben Sie uns bitte unbedingt eine Rückmeldung an philipp.sckopke(at)psy.lmu.de, damit wir so bald wie möglich eine verbesserte Version online stellen können.
Sie vermuten, dass es einen linearen Zusammenhang zwischen der AV Stressresistenz und der UV Berufserfahrung gibt. Gegeben ist folgender R-Output:
summary(lm(Stressresistenz ~ Berufserfahrung, data = Daten))
(Hinweis: Sie können alle Annahmen des einfachen linearen Regressionsmodells als gegeben voraussetzen.)
Geben Sie die geschätzte Modellgleichung an und interpretieren Sie diese inhaltlich.
Lösunga = 9.642, b = 0.042, s = 2.076
Die geschätzte Modellgleichung ist also:
\[Y_{i} = 9.642 + 0.042X_{i} + \epsilon_{i} \text{ mit } \epsilon_{i}\sim N(0,\ {2.076}^{2})\]
Interpretation: Für Personen mit einer Berufserfahrung von 0 Jahren wird eine Stressresistenz von durchschnittlich 9.642 erwartet.
Unterscheiden sich Personen in ihrer Berufserfahrung um ein Jahr, so erwarten wir, dass diese Personen sich in ihrer Stressresistenz durchschnittlich um 0.042 unterscheiden.
Es wird ein gleichgerichteter Zusammenhang für Berufserfahrung und Stressresistenz geschätzt, bei dem höhere Werte der UV Berufserfahrung im Durchschnitt mit höheren Werten der AV Stressresistenz einhergehen. Dies ist jedoch nur eine Punktschätzung, über deren Genauigkeit man zunächst nichts aussagen kann. Dies ist nur mithilfe von Konfidenzintervallen möglich.
Angenommen, die Stichprobengröße wäre sehr, sehr groß und der Standardfehler bei der Schätzung der Parameter wäre sehr nahe an 0 (d.h. die Schätzwerte für die Modellparameter wären identisch mit den wahren Parameterwerten). Wie hoch wäre die Wahrscheinlichkeit, dass eine Person mit einer Berufserfahrung von 5 Jahren eine höhere Stressresistenz als 10 hat? Hinweis: Verwenden Sie zur Berechnung der Wahrscheinlichkeit die Annahme des regressionsanalytischen Modells \(Y_i|X_i \sim N(\mu_i , \sigma^2)\).
Lösung1 - pnorm(10, mean = 9.642 + 0.042 * 5, sd = 2.076)
[1] 0.472
Angenommen die Schätzwerte entsprechen den wahren Parameterwerten, dann ist die Stressresistenz bei einer Berufserfahrung von 5 normalverteilt mit Erwartungswert \(9.642 + 0.042 \cdot 5\) und Varianz \({2.076}^{2}\). Die Wahrscheinlichkeit, dass eine Person mit einer Berufserfahrung von 5 Jahren eine höhere Stressresistenz als 10 hat, beträgt ca. 0.472.
Können Sie auf der Basis des Hypothesentests für \(\beta\) aus dem Output von einem linearen Zusammenhang zwischen Stressresistenz und Berufserfahrung ausgehen? Verwenden Sie ein Signifikanzniveau von \(\alpha = 0.005\).
LösungDa \(p = 0.00403 < 0.005\) ist, entscheiden wir uns für die \(H_{1}: \beta \neq 0\). Wir gehen also davon aus, dass es zwischen der AV Stressresistenz und der UV Berufserfahrung einen linearen Zusammenhang gibt.
Mithilfe der Funktion
confint()
wurde das 0.95-Konfidenzintervall für \(\beta\) in R berechnet. Interpretieren Sie es inhaltlich.2.5 % 97.5 % (Intercept) 6.72034908 12.56374098 Berufserfahrung 0.01371626 0.07072776
LösungDie plausiblen Werte für \(\beta\) liegen zwischen 0.014 und 0.071. Wir gehen also davon aus, dass sich die durchschnittliche Ausprägung der AV Stressresistenz um 0.014 bis 0.071 Einheiten pro Jahr an Berufserfahrung erhöht.
Welche Stressresistenz erwarten Sie für eine durchschnittliche Berufserfahrung? Beantworten Sie die Frage mit Hilfe einer Zentrierung am Mittelwert.
$Berufserfahrung_c <- scale(Daten$Berufserfahrung, center = TRUE, scale = FALSE) Datensummary(lm(Stressresistenz ~ Berufserfahrung_c, data = Daten))
Residuals: Min 1Q Median 3Q Max -5.6267 -1.2721 -0.0616 1.2217 5.1200 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 13.93373 0.18954 73.513 < 2e-16 *** Berufserfahrung_c 0.04222 0.01439 2.933 0.00403 ** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 2.076 on 118 degrees of freedom Multiple R-squared: 0.06795, Adjusted R-squared: 0.06006 F-statistic: 8.603 on 1 and 118 DF, p-value: 0.004032
LösungFür Personen mit durchschnittlicher Berufserfahrung erwarten wir eine durchschnittliche Ausprägung der AV Stressresistenz von 13.934.
Sie vermuten, dass es einen linearen Zusammenhang zwischen der AV Krankheitstage und der UV Berufserfahrung gibt. Gegeben ist folgender R-Output:
summary(lm(Krankheitstage ~ Berufserfahrung, data = Daten))
Residuals:
Min 1Q Median 3Q Max
-4.2178 -1.6258 0.1677 1.3866 5.7202
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.05204 1.13317 8.871 9.26e-15 ***
Berufserfahrung 0.03967 0.01112 3.567 0.000523 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.06 on 118 degrees of freedom
Multiple R-squared: 0.09733, Adjusted R-squared: 0.08968
F-statistic: 12.72 on 1 and 118 DF, p-value: 0.000523
(Hinweis: Sie können alle Annahmen des einfachen linearen Regressionsmodells als gegeben voraussetzen.)
Geben Sie die geschätzte Modellgleichung an und interpretieren Sie diese inhaltlich.
Lösunga = 10.052, b = 0.04, s = 2.06
Die geschätzte Modellgleichung ist also:
\[Y_{i} = 10.052 + 0.04X_{i} + \epsilon_{i} \text{ mit } \epsilon_{i}\sim N(0,\ {2.06}^{2})\]
Interpretation: Für Personen mit einer Berufserfahrung von 0 Jahren wird eine Krankheitstage von durchschnittlich 10.052 erwartet.
Unterscheiden sich Personen in ihrer Berufserfahrung um ein Jahr, so erwarten wir, dass diese Personen sich in ihrer Krankheitstage durchschnittlich um 0.04 unterscheiden.
Es wird ein gleichgerichteter Zusammenhang für Berufserfahrung und Krankheitstage geschätzt, bei dem höhere Werte der UV Berufserfahrung im Durchschnitt mit höheren Werten der AV Krankheitstage einhergehen. Dies ist jedoch nur eine Punktschätzung, über deren Genauigkeit man zunächst nichts aussagen kann. Dies ist nur mithilfe von Konfidenzintervallen möglich.
Angenommen, die Stichprobengröße wäre sehr, sehr groß und der Standardfehler bei der Schätzung der Parameter wäre sehr nahe an 0 (d.h. die Schätzwerte für die Modellparameter wären identisch mit den wahren Parameterwerten). Wie hoch wäre die Wahrscheinlichkeit, dass eine Person mit einer Berufserfahrung von 10 Jahren eine niedrigere Krankheitstage als 15 hat? Hinweis: Verwenden Sie zur Berechnung der Wahrscheinlichkeit die Annahme des regressionsanalytischen Modells \(Y_i|X_i \sim N(\mu_i , \sigma^2)\).
Lösungpnorm(15, mean = 10.052 + 0.04 * 10, sd = 2.06)
[1] 0.986
Angenommen die Schätzwerte entsprechen den wahren Parameterwerten, dann ist die Krankheitstage bei einer Berufserfahrung von 10 normalverteilt mit Erwartungswert \(10.052 + 0.04 \cdot 10\) und Varianz \({2.06}^{2}\). Die Wahrscheinlichkeit, dass eine Person mit einer Berufserfahrung von 10 Jahren eine niedrigere Krankheitstage als 15 hat, beträgt ca. 0.986.
Können Sie auf der Basis des Hypothesentests für \(\beta\) aus dem Output von einem linearen Zusammenhang zwischen Krankheitstage und Berufserfahrung ausgehen? Verwenden Sie ein Signifikanzniveau von \(\alpha = 0.005\).
LösungDa \(p = 0.000523 < 0.005\) ist, entscheiden wir uns für die \(H_{1}: \beta \neq 0\). Wir gehen also davon aus, dass es zwischen der AV Krankheitstage und der UV Berufserfahrung einen linearen Zusammenhang gibt.
Mithilfe der Funktion
confint()
wurde das 0.95-Konfidenzintervall für \(\beta\) in R berechnet. Interpretieren Sie es inhaltlich.2.5 % 97.5 % (Intercept) 7.80805552 12.29602547 Berufserfahrung 0.01764553 0.06169182
LösungDie plausiblen Werte für \(\beta\) liegen zwischen 0.018 und 0.062. Wir gehen also davon aus, dass sich die durchschnittliche Ausprägung der AV Krankheitstage um 0.018 bis 0.062 Einheiten pro Jahr an Berufserfahrung erhöht.
Welche Krankheitstage erwarten Sie für eine durchschnittliche Berufserfahrung? Beantworten Sie die Frage mit Hilfe einer Zentrierung am Mittelwert.
$Berufserfahrung_c <- scale(Daten$Berufserfahrung, center = TRUE, scale = FALSE) Datensummary(lm(Krankheitstage ~ Berufserfahrung_c, data = Daten))
Residuals: Min 1Q Median 3Q Max -4.2178 -1.6258 0.1677 1.3866 5.7202 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 14.03794 0.18802 74.662 < 2e-16 *** Berufserfahrung_c 0.03967 0.01112 3.567 0.000523 *** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 2.06 on 118 degrees of freedom Multiple R-squared: 0.09733, Adjusted R-squared: 0.08968 F-statistic: 12.72 on 1 and 118 DF, p-value: 0.000523
LösungFür Personen mit durchschnittlicher Berufserfahrung erwarten wir eine durchschnittliche Ausprägung der AV Krankheitstage von 14.038.
Sie vermuten, dass es einen linearen Zusammenhang zwischen der AV Krankheitstage und der UV Bildschirmzeit gibt. Gegeben ist folgender R-Output:
summary(lm(Krankheitstage ~ Bildschirmzeit, data = Daten))
Residuals:
Min 1Q Median 3Q Max
-4.8650 -1.8212 -0.1249 1.5236 5.4465
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 11.34118 1.66545 6.810 4.35e-10 ***
Bildschirmzeit 0.02654 0.01648 1.611 0.11
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.268 on 118 degrees of freedom
Multiple R-squared: 0.02152, Adjusted R-squared: 0.01323
F-statistic: 2.595 on 1 and 118 DF, p-value: 0.1099
(Hinweis: Sie können alle Annahmen des einfachen linearen Regressionsmodells als gegeben voraussetzen.)
Geben Sie die geschätzte Modellgleichung an und interpretieren Sie diese inhaltlich.
Lösunga = 11.341, b = 0.027, s = 2.268
Die geschätzte Modellgleichung ist also:
\[Y_{i} = 11.341 + 0.027X_{i} + \epsilon_{i} \text{ mit } \epsilon_{i}\sim N(0,\ {2.268}^{2})\]
Interpretation: Für Personen mit einer Bildschirmzeit von 0 Stunden am Tag wird eine Krankheitstage von durchschnittlich 11.341 erwartet.
Unterscheiden sich Personen in ihrer Bildschirmzeit um eine Stunde, so erwarten wir, dass diese Personen sich in ihrer Krankheitstage durchschnittlich um 0.027 unterscheiden.
Es wird ein gleichgerichteter Zusammenhang für Bildschirmzeit und Krankheitstage geschätzt, bei dem höhere Werte der UV Bildschirmzeit im Durchschnitt mit höheren Werten der AV Krankheitstage einhergehen. Dies ist jedoch nur eine Punktschätzung, über deren Genauigkeit man zunächst nichts aussagen kann. Dies ist nur mithilfe von Konfidenzintervallen möglich.
Angenommen, die Stichprobengröße wäre sehr, sehr groß und der Standardfehler bei der Schätzung der Parameter wäre sehr nahe an 0 (d.h. die Schätzwerte für die Modellparameter wären identisch mit den wahren Parameterwerten). Wie hoch wäre die Wahrscheinlichkeit, dass eine Person mit einer Bildschirmzeit von 2 Stunden am Tag eine höhere Krankheitstage als 3 hat? Hinweis: Verwenden Sie zur Berechnung der Wahrscheinlichkeit die Annahme des regressionsanalytischen Modells \(Y_i|X_i \sim N(\mu_i , \sigma^2)\).
Lösung1 - pnorm(3, mean = 11.341 + 0.027 * 2, sd = 2.268)
[1] 1
Angenommen die Schätzwerte entsprechen den wahren Parameterwerten, dann ist die Krankheitstage bei einer Bildschirmzeit von 2 normalverteilt mit Erwartungswert \(11.341 + 0.027 \cdot 2\) und Varianz \({2.268}^{2}\). Die Wahrscheinlichkeit, dass eine Person mit einer Bildschirmzeit von 2 Stunden am Tag eine höhere Krankheitstage als 3 hat, beträgt ca. 1.
Können Sie auf der Basis des Hypothesentests für \(\beta\) aus dem Output von einem linearen Zusammenhang zwischen Krankheitstage und Bildschirmzeit ausgehen? Verwenden Sie ein Signifikanzniveau von \(\alpha = 0.005\).
LösungDa \(p = 0.110 > 0.005\) ist, entscheiden wir uns für die \(H_{0}: \beta = 0\). Wir gehen also davon aus, dass es zwischen der AV Krankheitstage und der UV Bildschirmzeit keinen linearen Zusammenhang gibt.
Mithilfe der Funktion
confint()
wurde das 0.95-Konfidenzintervall für \(\beta\) in R berechnet. Interpretieren Sie es inhaltlich.2.5 % 97.5 % (Intercept) 8.043140590 14.63921184 Bildschirmzeit -0.006084549 0.05917206
LösungDie plausiblen Werte für \(\beta\) liegen zwischen -0.006 und 0.059. Wir gehen also davon aus, dass sich die durchschnittliche Ausprägung der AV Krankheitstage um -0.006 bis 0.059 Einheiten pro Stunde am Tag verringert.
Welche Krankheitstage erwarten Sie für eine durchschnittliche Bildschirmzeit? Beantworten Sie die Frage mit Hilfe einer Zentrierung am Mittelwert.
$Bildschirmzeit_c <- scale(Daten$Bildschirmzeit, center = TRUE, scale = FALSE) Datensummary(lm(Krankheitstage ~ Bildschirmzeit_c, data = Daten))
Residuals: Min 1Q Median 3Q Max -4.8650 -1.8212 -0.1249 1.5236 5.4465 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 14.00339 0.20700 67.649 <2e-16 *** Bildschirmzeit_c 0.02654 0.01648 1.611 0.11 --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 2.268 on 118 degrees of freedom Multiple R-squared: 0.02152, Adjusted R-squared: 0.01323 F-statistic: 2.595 on 1 and 118 DF, p-value: 0.1099
LösungFür Personen mit durchschnittlicher Bildschirmzeit erwarten wir eine durchschnittliche Ausprägung der AV Krankheitstage von 14.003.
Sie vermuten, dass es einen linearen Zusammenhang zwischen der AV Arbeitszufriedenheit und der UV Bildschirmzeit gibt. Gegeben ist folgender R-Output:
summary(lm(Arbeitszufriedenheit ~ Bildschirmzeit, data = Daten))
Residuals:
Min 1Q Median 3Q Max
-4.8187 -1.3872 -0.1425 1.3678 4.2054
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.15981 1.37256 6.674 8.55e-10 ***
Bildschirmzeit 0.04706 0.01344 3.502 0.000652 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.014 on 118 degrees of freedom
Multiple R-squared: 0.09417, Adjusted R-squared: 0.08649
F-statistic: 12.27 on 1 and 118 DF, p-value: 0.0006519
(Hinweis: Sie können alle Annahmen des einfachen linearen Regressionsmodells als gegeben voraussetzen.)
Geben Sie die geschätzte Modellgleichung an und interpretieren Sie diese inhaltlich.
Lösunga = 9.16, b = 0.047, s = 2.014
Die geschätzte Modellgleichung ist also:
\[Y_{i} = 9.16 + 0.047X_{i} + \epsilon_{i} \text{ mit } \epsilon_{i}\sim N(0,\ {2.014}^{2})\]
Interpretation: Für Personen mit einer Bildschirmzeit von 0 Stunden am Tag wird eine Arbeitszufriedenheit von durchschnittlich 9.16 erwartet.
Unterscheiden sich Personen in ihrer Bildschirmzeit um eine Stunde, so erwarten wir, dass diese Personen sich in ihrer Arbeitszufriedenheit durchschnittlich um 0.047 unterscheiden.
Es wird ein gleichgerichteter Zusammenhang für Bildschirmzeit und Arbeitszufriedenheit geschätzt, bei dem höhere Werte der UV Bildschirmzeit im Durchschnitt mit höheren Werten der AV Arbeitszufriedenheit einhergehen. Dies ist jedoch nur eine Punktschätzung, über deren Genauigkeit man zunächst nichts aussagen kann. Dies ist nur mithilfe von Konfidenzintervallen möglich.
Angenommen, die Stichprobengröße wäre sehr, sehr groß und der Standardfehler bei der Schätzung der Parameter wäre sehr nahe an 0 (d.h. die Schätzwerte für die Modellparameter wären identisch mit den wahren Parameterwerten). Wie hoch wäre die Wahrscheinlichkeit, dass eine Person mit einer Bildschirmzeit von 15 Stunden am Tag eine niedrigere Arbeitszufriedenheit als 2 hat? Hinweis: Verwenden Sie zur Berechnung der Wahrscheinlichkeit die Annahme des regressionsanalytischen Modells \(Y_i|X_i \sim N(\mu_i , \sigma^2)\).
Lösungpnorm(2, mean = 9.16 + 0.047 * 15, sd = 2.014)
[1] 0
Angenommen die Schätzwerte entsprechen den wahren Parameterwerten, dann ist die Arbeitszufriedenheit bei einer Bildschirmzeit von 15 normalverteilt mit Erwartungswert \(9.16 + 0.047 \cdot 15\) und Varianz \({2.014}^{2}\). Die Wahrscheinlichkeit, dass eine Person mit einer Bildschirmzeit von 15 Stunden am Tag eine niedrigere Arbeitszufriedenheit als 2 hat, beträgt ca. 0.
Können Sie auf der Basis des Hypothesentests für \(\beta\) aus dem Output von einem linearen Zusammenhang zwischen Arbeitszufriedenheit und Bildschirmzeit ausgehen? Verwenden Sie ein Signifikanzniveau von \(\alpha = 0.005\).
LösungDa \(p = 0.000652 < 0.005\) ist, entscheiden wir uns für die \(H_{1}: \beta \neq 0\). Wir gehen also davon aus, dass es zwischen der AV Arbeitszufriedenheit und der UV Bildschirmzeit einen linearen Zusammenhang gibt.
Mithilfe der Funktion
confint()
wurde das 0.95-Konfidenzintervall für \(\beta\) in R berechnet. Interpretieren Sie es inhaltlich.2.5 % 97.5 % (Intercept) 6.44176196 11.87785380 Bildschirmzeit 0.02045345 0.07367032
LösungDie plausiblen Werte für \(\beta\) liegen zwischen 0.02 und 0.074. Wir gehen also davon aus, dass sich die durchschnittliche Ausprägung der AV Arbeitszufriedenheit um 0.02 bis 0.074 Einheiten pro Stunde am Tag erhöht.
Welche Arbeitszufriedenheit erwarten Sie für eine durchschnittliche Bildschirmzeit? Beantworten Sie die Frage mit Hilfe einer Zentrierung am Mittelwert.
$Bildschirmzeit_c <- scale(Daten$Bildschirmzeit, center = TRUE, scale = FALSE) Datensummary(lm(Arbeitszufriedenheit ~ Bildschirmzeit_c, data = Daten))
Residuals: Min 1Q Median 3Q Max -4.8187 -1.3872 -0.1425 1.3678 4.2054 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 13.92385 0.18385 75.733 < 2e-16 *** Bildschirmzeit_c 0.04706 0.01344 3.502 0.000652 *** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 2.014 on 118 degrees of freedom Multiple R-squared: 0.09417, Adjusted R-squared: 0.08649 F-statistic: 12.27 on 1 and 118 DF, p-value: 0.0006519
LösungFür Personen mit durchschnittlicher Bildschirmzeit erwarten wir eine durchschnittliche Ausprägung der AV Arbeitszufriedenheit von 13.924.
Sie vermuten, dass es einen linearen Zusammenhang zwischen der AV Stressresistenz und der UV Arbeitszeit gibt. Gegeben ist folgender R-Output:
summary(lm(Stressresistenz ~ Arbeitszeit, data = Daten))
Residuals:
Min 1Q Median 3Q Max
-7.197 -1.163 -0.159 1.480 4.524
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.31322 1.27753 7.290 3.84e-11 ***
Arbeitszeit 0.04745 0.01258 3.772 0.000254 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.037 on 118 degrees of freedom
Multiple R-squared: 0.1076, Adjusted R-squared: 0.1001
F-statistic: 14.23 on 1 and 118 DF, p-value: 0.0002543
(Hinweis: Sie können alle Annahmen des einfachen linearen Regressionsmodells als gegeben voraussetzen.)
Geben Sie die geschätzte Modellgleichung an und interpretieren Sie diese inhaltlich.
Lösunga = 9.313, b = 0.047, s = 2.037
Die geschätzte Modellgleichung ist also:
\[Y_{i} = 9.313 + 0.047X_{i} + \epsilon_{i} \text{ mit } \epsilon_{i}\sim N(0,\ {2.037}^{2})\]
Interpretation: Für Personen mit einer Arbeitszeit von 0 Stunden am Tag wird eine Stressresistenz von durchschnittlich 9.313 erwartet.
Unterscheiden sich Personen in ihrer Arbeitszeit um eine Stunde, so erwarten wir, dass diese Personen sich in ihrer Stressresistenz durchschnittlich um 0.047 unterscheiden.
Es wird ein gleichgerichteter Zusammenhang für Arbeitszeit und Stressresistenz geschätzt, bei dem höhere Werte der UV Arbeitszeit im Durchschnitt mit höheren Werten der AV Stressresistenz einhergehen. Dies ist jedoch nur eine Punktschätzung, über deren Genauigkeit man zunächst nichts aussagen kann. Dies ist nur mithilfe von Konfidenzintervallen möglich.
Angenommen, die Stichprobengröße wäre sehr, sehr groß und der Standardfehler bei der Schätzung der Parameter wäre sehr nahe an 0 (d.h. die Schätzwerte für die Modellparameter wären identisch mit den wahren Parameterwerten). Wie hoch wäre die Wahrscheinlichkeit, dass eine Person mit einer Arbeitszeit von 15 Stunden am Tag eine niedrigere Stressresistenz als 6 hat? Hinweis: Verwenden Sie zur Berechnung der Wahrscheinlichkeit die Annahme des regressionsanalytischen Modells \(Y_i|X_i \sim N(\mu_i , \sigma^2)\).
Lösungpnorm(6, mean = 9.313 + 0.047 * 15, sd = 2.037)
[1] 0.024
Angenommen die Schätzwerte entsprechen den wahren Parameterwerten, dann ist die Stressresistenz bei einer Arbeitszeit von 15 normalverteilt mit Erwartungswert \(9.313 + 0.047 \cdot 15\) und Varianz \({2.037}^{2}\). Die Wahrscheinlichkeit, dass eine Person mit einer Arbeitszeit von 15 Stunden am Tag eine niedrigere Stressresistenz als 6 hat, beträgt ca. 0.024.
Können Sie auf der Basis des Hypothesentests für \(\beta\) aus dem Output von einem linearen Zusammenhang zwischen Stressresistenz und Arbeitszeit ausgehen? Verwenden Sie ein Signifikanzniveau von \(\alpha = 0.005\).
LösungDa \(p = 0.000254 < 0.005\) ist, entscheiden wir uns für die \(H_{1}: \beta \neq 0\). Wir gehen also davon aus, dass es zwischen der AV Stressresistenz und der UV Arbeitszeit einen linearen Zusammenhang gibt.
Mithilfe der Funktion
confint()
wurde das 0.95-Konfidenzintervall für \(\beta\) in R berechnet. Interpretieren Sie es inhaltlich.2.5 % 97.5 % (Intercept) 6.78335876 11.84309014 Arbeitszeit 0.02254025 0.07235138
LösungDie plausiblen Werte für \(\beta\) liegen zwischen 0.023 und 0.072. Wir gehen also davon aus, dass sich die durchschnittliche Ausprägung der AV Stressresistenz um 0.023 bis 0.072 Einheiten pro Stunde am Tag erhöht.
Welche Stressresistenz erwarten Sie für eine durchschnittliche Arbeitszeit? Beantworten Sie die Frage mit Hilfe einer Zentrierung am Mittelwert.
$Arbeitszeit_c <- scale(Daten$Arbeitszeit, center = TRUE, scale = FALSE) Datensummary(lm(Stressresistenz ~ Arbeitszeit_c, data = Daten))
Residuals: Min 1Q Median 3Q Max -7.197 -1.163 -0.159 1.480 4.524 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 14.08137 0.18595 75.727 < 2e-16 *** Arbeitszeit_c 0.04745 0.01258 3.772 0.000254 *** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 2.037 on 118 degrees of freedom Multiple R-squared: 0.1076, Adjusted R-squared: 0.1001 F-statistic: 14.23 on 1 and 118 DF, p-value: 0.0002543
LösungFür Personen mit durchschnittlicher Arbeitszeit erwarten wir eine durchschnittliche Ausprägung der AV Stressresistenz von 14.081.
Sie vermuten, dass es einen linearen Zusammenhang zwischen der AV Stressresistenz und der UV Bildschirmzeit gibt. Gegeben ist folgender R-Output:
summary(lm(Stressresistenz ~ Bildschirmzeit, data = Daten))
Residuals:
Min 1Q Median 3Q Max
-4.7636 -1.2085 0.1065 1.3651 4.0556
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 8.74726 1.17044 7.473 1.50e-11 ***
Bildschirmzeit 0.05160 0.01166 4.427 2.15e-05 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.886 on 118 degrees of freedom
Multiple R-squared: 0.1424, Adjusted R-squared: 0.1352
F-statistic: 19.6 on 1 and 118 DF, p-value: 2.147e-05
(Hinweis: Sie können alle Annahmen des einfachen linearen Regressionsmodells als gegeben voraussetzen.)
Geben Sie die geschätzte Modellgleichung an und interpretieren Sie diese inhaltlich.
Lösunga = 8.747, b = 0.052, s = 1.886
Die geschätzte Modellgleichung ist also:
\[Y_{i} = 8.747 + 0.052X_{i} + \epsilon_{i} \text{ mit } \epsilon_{i}\sim N(0,\ {1.886}^{2})\]
Interpretation: Für Personen mit einer Bildschirmzeit von 0 Stunden am Tag wird eine Stressresistenz von durchschnittlich 8.747 erwartet.
Unterscheiden sich Personen in ihrer Bildschirmzeit um eine Stunde, so erwarten wir, dass diese Personen sich in ihrer Stressresistenz durchschnittlich um 0.052 unterscheiden.
Es wird ein gleichgerichteter Zusammenhang für Bildschirmzeit und Stressresistenz geschätzt, bei dem höhere Werte der UV Bildschirmzeit im Durchschnitt mit höheren Werten der AV Stressresistenz einhergehen. Dies ist jedoch nur eine Punktschätzung, über deren Genauigkeit man zunächst nichts aussagen kann. Dies ist nur mithilfe von Konfidenzintervallen möglich.
Angenommen, die Stichprobengröße wäre sehr, sehr groß und der Standardfehler bei der Schätzung der Parameter wäre sehr nahe an 0 (d.h. die Schätzwerte für die Modellparameter wären identisch mit den wahren Parameterwerten). Wie hoch wäre die Wahrscheinlichkeit, dass eine Person mit einer Bildschirmzeit von 5 Stunden am Tag eine niedrigere Stressresistenz als 8 hat? Hinweis: Verwenden Sie zur Berechnung der Wahrscheinlichkeit die Annahme des regressionsanalytischen Modells \(Y_i|X_i \sim N(\mu_i , \sigma^2)\).
Lösungpnorm(8, mean = 8.747 + 0.052 * 5, sd = 1.886)
[1] 0.297
Angenommen die Schätzwerte entsprechen den wahren Parameterwerten, dann ist die Stressresistenz bei einer Bildschirmzeit von 5 normalverteilt mit Erwartungswert \(8.747 + 0.052 \cdot 5\) und Varianz \({1.886}^{2}\). Die Wahrscheinlichkeit, dass eine Person mit einer Bildschirmzeit von 5 Stunden am Tag eine niedrigere Stressresistenz als 8 hat, beträgt ca. 0.297.
Können Sie auf der Basis des Hypothesentests für \(\beta\) aus dem Output von einem linearen Zusammenhang zwischen Stressresistenz und Bildschirmzeit ausgehen? Verwenden Sie ein Signifikanzniveau von \(\alpha = 0.005\).
LösungDa \(p = 2.15 \times 10^{-5} < 0.005\) ist, entscheiden wir uns für die \(H_{1}: \beta \neq 0\). Wir gehen also davon aus, dass es zwischen der AV Stressresistenz und der UV Bildschirmzeit einen linearen Zusammenhang gibt.
Mithilfe der Funktion
confint()
wurde das 0.95-Konfidenzintervall für \(\beta\) in R berechnet. Interpretieren Sie es inhaltlich.2.5 % 97.5 % (Intercept) 6.42945801 11.06505436 Bildschirmzeit 0.02851592 0.07467919
LösungDie plausiblen Werte für \(\beta\) liegen zwischen 0.029 und 0.075. Wir gehen also davon aus, dass sich die durchschnittliche Ausprägung der AV Stressresistenz um 0.029 bis 0.075 Einheiten pro Stunde am Tag erhöht.
Welche Stressresistenz erwarten Sie für eine durchschnittliche Bildschirmzeit? Beantworten Sie die Frage mit Hilfe einer Zentrierung am Mittelwert.
$Bildschirmzeit_c <- scale(Daten$Bildschirmzeit, center = TRUE, scale = FALSE) Datensummary(lm(Stressresistenz ~ Bildschirmzeit_c, data = Daten))
Residuals: Min 1Q Median 3Q Max -4.7636 -1.2085 0.1065 1.3651 4.0556 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 13.87219 0.17216 80.576 < 2e-16 *** Bildschirmzeit_c 0.05160 0.01166 4.427 2.15e-05 *** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 1.886 on 118 degrees of freedom Multiple R-squared: 0.1424, Adjusted R-squared: 0.1352 F-statistic: 19.6 on 1 and 118 DF, p-value: 2.147e-05
LösungFür Personen mit durchschnittlicher Bildschirmzeit erwarten wir eine durchschnittliche Ausprägung der AV Stressresistenz von 13.872.
Sie vermuten, dass es einen linearen Zusammenhang zwischen der AV Krankheitstage und der UV Arbeitszeit gibt. Gegeben ist folgender R-Output:
summary(lm(Krankheitstage ~ Arbeitszeit, data = Daten))
Residuals:
Min 1Q Median 3Q Max
-4.8704 -1.3003 0.0806 1.3154 4.5698
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 11.80006 1.28242 9.201 1.55e-15 ***
Arbeitszeit 0.02324 0.01242 1.872 0.0637 .
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.915 on 118 degrees of freedom
Multiple R-squared: 0.02884, Adjusted R-squared: 0.02061
F-statistic: 3.504 on 1 and 118 DF, p-value: 0.06371
(Hinweis: Sie können alle Annahmen des einfachen linearen Regressionsmodells als gegeben voraussetzen.)
Geben Sie die geschätzte Modellgleichung an und interpretieren Sie diese inhaltlich.
Lösunga = 11.8, b = 0.023, s = 1.915
Die geschätzte Modellgleichung ist also:
\[Y_{i} = 11.8 + 0.023X_{i} + \epsilon_{i} \text{ mit } \epsilon_{i}\sim N(0,\ {1.915}^{2})\]
Interpretation: Für Personen mit einer Arbeitszeit von 0 Stunden am Tag wird eine Krankheitstage von durchschnittlich 11.8 erwartet.
Unterscheiden sich Personen in ihrer Arbeitszeit um eine Stunde, so erwarten wir, dass diese Personen sich in ihrer Krankheitstage durchschnittlich um 0.023 unterscheiden.
Es wird ein gleichgerichteter Zusammenhang für Arbeitszeit und Krankheitstage geschätzt, bei dem höhere Werte der UV Arbeitszeit im Durchschnitt mit höheren Werten der AV Krankheitstage einhergehen. Dies ist jedoch nur eine Punktschätzung, über deren Genauigkeit man zunächst nichts aussagen kann. Dies ist nur mithilfe von Konfidenzintervallen möglich.
Angenommen, die Stichprobengröße wäre sehr, sehr groß und der Standardfehler bei der Schätzung der Parameter wäre sehr nahe an 0 (d.h. die Schätzwerte für die Modellparameter wären identisch mit den wahren Parameterwerten). Wie hoch wäre die Wahrscheinlichkeit, dass eine Person mit einer Arbeitszeit von 2 Stunden am Tag eine höhere Krankheitstage als 5 hat? Hinweis: Verwenden Sie zur Berechnung der Wahrscheinlichkeit die Annahme des regressionsanalytischen Modells \(Y_i|X_i \sim N(\mu_i , \sigma^2)\).
Lösung1 - pnorm(5, mean = 11.8 + 0.023 * 2, sd = 1.915)
[1] 1
Angenommen die Schätzwerte entsprechen den wahren Parameterwerten, dann ist die Krankheitstage bei einer Arbeitszeit von 2 normalverteilt mit Erwartungswert \(11.8 + 0.023 \cdot 2\) und Varianz \({1.915}^{2}\). Die Wahrscheinlichkeit, dass eine Person mit einer Arbeitszeit von 2 Stunden am Tag eine höhere Krankheitstage als 5 hat, beträgt ca. 1.
Können Sie auf der Basis des Hypothesentests für \(\beta\) aus dem Output von einem linearen Zusammenhang zwischen Krankheitstage und Arbeitszeit ausgehen? Verwenden Sie ein Signifikanzniveau von \(\alpha = 0.005\).
LösungDa \(p = 0.0637 > 0.005\) ist, entscheiden wir uns für die \(H_{0}: \beta = 0\). Wir gehen also davon aus, dass es zwischen der AV Krankheitstage und der UV Arbeitszeit keinen linearen Zusammenhang gibt.
Mithilfe der Funktion
confint()
wurde das 0.95-Konfidenzintervall für \(\beta\) in R berechnet. Interpretieren Sie es inhaltlich.2.5 % 97.5 % (Intercept) 9.260515856 14.33961195 Arbeitszeit -0.001346783 0.04783321
LösungDie plausiblen Werte für \(\beta\) liegen zwischen -0.001 und 0.048. Wir gehen also davon aus, dass sich die durchschnittliche Ausprägung der AV Krankheitstage um -0.001 bis 0.048 Einheiten pro Stunde am Tag verringert.
Welche Krankheitstage erwarten Sie für eine durchschnittliche Arbeitszeit? Beantworten Sie die Frage mit Hilfe einer Zentrierung am Mittelwert.
$Arbeitszeit_c <- scale(Daten$Arbeitszeit, center = TRUE, scale = FALSE) Datensummary(lm(Krankheitstage ~ Arbeitszeit_c, data = Daten))
Residuals: Min 1Q Median 3Q Max -4.8704 -1.3003 0.0806 1.3154 4.5698 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 14.17812 0.17479 81.114 <2e-16 *** Arbeitszeit_c 0.02324 0.01242 1.872 0.0637 . --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 1.915 on 118 degrees of freedom Multiple R-squared: 0.02884, Adjusted R-squared: 0.02061 F-statistic: 3.504 on 1 and 118 DF, p-value: 0.06371
LösungFür Personen mit durchschnittlicher Arbeitszeit erwarten wir eine durchschnittliche Ausprägung der AV Krankheitstage von 14.178.
Sie vermuten, dass es einen linearen Zusammenhang zwischen der AV Arbeitszufriedenheit und der UV Arbeitszeit gibt. Gegeben ist folgender R-Output:
summary(lm(Arbeitszufriedenheit ~ Arbeitszeit, data = Daten))
Residuals:
Min 1Q Median 3Q Max
-4.8355 -1.4682 0.1214 1.4654 4.8519
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.40316 1.15619 8.133 4.76e-13 ***
Arbeitszeit 0.04624 0.01159 3.989 0.000116 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.023 on 118 degrees of freedom
Multiple R-squared: 0.1188, Adjusted R-squared: 0.1113
F-statistic: 15.91 on 1 and 118 DF, p-value: 0.0001157
(Hinweis: Sie können alle Annahmen des einfachen linearen Regressionsmodells als gegeben voraussetzen.)
Geben Sie die geschätzte Modellgleichung an und interpretieren Sie diese inhaltlich.
Lösunga = 9.403, b = 0.046, s = 2.023
Die geschätzte Modellgleichung ist also:
\[Y_{i} = 9.403 + 0.046X_{i} + \epsilon_{i} \text{ mit } \epsilon_{i}\sim N(0,\ {2.023}^{2})\]
Interpretation: Für Personen mit einer Arbeitszeit von 0 Stunden am Tag wird eine Arbeitszufriedenheit von durchschnittlich 9.403 erwartet.
Unterscheiden sich Personen in ihrer Arbeitszeit um eine Stunde, so erwarten wir, dass diese Personen sich in ihrer Arbeitszufriedenheit durchschnittlich um 0.046 unterscheiden.
Es wird ein gleichgerichteter Zusammenhang für Arbeitszeit und Arbeitszufriedenheit geschätzt, bei dem höhere Werte der UV Arbeitszeit im Durchschnitt mit höheren Werten der AV Arbeitszufriedenheit einhergehen. Dies ist jedoch nur eine Punktschätzung, über deren Genauigkeit man zunächst nichts aussagen kann. Dies ist nur mithilfe von Konfidenzintervallen möglich.
Angenommen, die Stichprobengröße wäre sehr, sehr groß und der Standardfehler bei der Schätzung der Parameter wäre sehr nahe an 0 (d.h. die Schätzwerte für die Modellparameter wären identisch mit den wahren Parameterwerten). Wie hoch wäre die Wahrscheinlichkeit, dass eine Person mit einer Arbeitszeit von 11 Stunden am Tag eine höhere Arbeitszufriedenheit als 9 hat? Hinweis: Verwenden Sie zur Berechnung der Wahrscheinlichkeit die Annahme des regressionsanalytischen Modells \(Y_i|X_i \sim N(\mu_i , \sigma^2)\).
Lösung1 - pnorm(9, mean = 9.403 + 0.046 * 11, sd = 2.023)
[1] 0.673
Angenommen die Schätzwerte entsprechen den wahren Parameterwerten, dann ist die Arbeitszufriedenheit bei einer Arbeitszeit von 11 normalverteilt mit Erwartungswert \(9.403 + 0.046 \cdot 11\) und Varianz \({2.023}^{2}\). Die Wahrscheinlichkeit, dass eine Person mit einer Arbeitszeit von 11 Stunden am Tag eine höhere Arbeitszufriedenheit als 9 hat, beträgt ca. 0.673.
Können Sie auf der Basis des Hypothesentests für \(\beta\) aus dem Output von einem linearen Zusammenhang zwischen Arbeitszufriedenheit und Arbeitszeit ausgehen? Verwenden Sie ein Signifikanzniveau von \(\alpha = 0.005\).
LösungDa \(p = 0.000116 < 0.005\) ist, entscheiden wir uns für die \(H_{1}: \beta \neq 0\). Wir gehen also davon aus, dass es zwischen der AV Arbeitszufriedenheit und der UV Arbeitszeit einen linearen Zusammenhang gibt.
Mithilfe der Funktion
confint()
wurde das 0.95-Konfidenzintervall für \(\beta\) in R berechnet. Interpretieren Sie es inhaltlich.2.5 % 97.5 % (Intercept) 7.11358728 11.69274237 Arbeitszeit 0.02328124 0.06919219
LösungDie plausiblen Werte für \(\beta\) liegen zwischen 0.023 und 0.069. Wir gehen also davon aus, dass sich die durchschnittliche Ausprägung der AV Arbeitszufriedenheit um 0.023 bis 0.069 Einheiten pro Stunde am Tag erhöht.
Welche Arbeitszufriedenheit erwarten Sie für eine durchschnittliche Arbeitszeit? Beantworten Sie die Frage mit Hilfe einer Zentrierung am Mittelwert.
$Arbeitszeit_c <- scale(Daten$Arbeitszeit, center = TRUE, scale = FALSE) Datensummary(lm(Arbeitszufriedenheit ~ Arbeitszeit_c, data = Daten))
Residuals: Min 1Q Median 3Q Max -4.8355 -1.4682 0.1214 1.4654 4.8519 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 13.95561 0.18467 75.570 < 2e-16 *** Arbeitszeit_c 0.04624 0.01159 3.989 0.000116 *** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 2.023 on 118 degrees of freedom Multiple R-squared: 0.1188, Adjusted R-squared: 0.1113 F-statistic: 15.91 on 1 and 118 DF, p-value: 0.0001157
LösungFür Personen mit durchschnittlicher Arbeitszeit erwarten wir eine durchschnittliche Ausprägung der AV Arbeitszufriedenheit von 13.956.