Medienkonsum in Stunden/Tag | Schlaf in Stunden | |
---|---|---|
Schüler 1 | 4.7 | 7.8 |
Schüler 2 | 7.0 | 5.4 |
Schüler 3 | 4.7 | 7.0 |
Schüler 4 | 5.8 | 6.0 |
Schüler 5 | 5.2 | 7.2 |
Schüler 6 | 5.5 | 6.2 |
Übungsaufgaben
DESKRIPTIVE STATISTIK II: Korrelation
Die hier veröffentlichten Übungsaufgaben sind brandneu und deshalb noch nicht auf Herz und Nieren überprüft. Sollten Sie Fehler entdecken, geben Sie uns bitte unbedingt eine Rückmeldung an philipp.sckopke(at)psy.lmu.de, damit wir so bald wie möglich eine verbesserte Version online stellen können.
Ihnen liegen folgende Daten vor:
Welche Richtung hat der Zusammenhang? Drücken Sie diesen in Worten aus.
LösungEs liegt ein entgegengerichteter Zusammenhang vor. Je höher der tägliche Medienkonsum der Schüler ist, desto niedriger schlafen sie im Durchschnitt (bzw. umgekehrt).
Berechnen Sie die Kovarianz und interpretieren Sie diese.
Lösung\[\bar{x} = 5.48\]
\[\bar{y} = 6.6\]
\[ \begin{align*} {cov}_{emp}(x,\ y) &= \frac{1}{n}\sum_{i = 1}^{n}\left( x_{i} - \bar{x} \right)\left( y_{i} - \bar{y} \right) \\ &= \frac{1}{6}\sum_{i = 1}^{6}\left( x_{i} - 5.48 \right)\left( y_{i} - 6.6 \right) \\ &= \frac{1}{6}\left\lbrack \left( x_{1} - 5.48 \right)\left( y_{1} - 6.6 \right) + \left( x_{2} - 5.48 \right)\left( y_{2} - 6.6 \right) + \ldots + \left( x_{5} - 5.48 \right)\left( y_{5} - 6.6 \right) \right\rbrack \\ &= \frac{1}{6}\left\lbrack (4.7 - 5.48)(7.8 - 6.6) + (7 - 5.48)(5.4 - 6.6) + \ldots + (5.5 - 5.48)(6.2 - 6.6) \right\rbrack = -0.57 \end{align*} \] Da an der Kovarianz lediglich die Richtung des Zusammenhangs abgelesen werden kann, können wir nur sagen, dass ein gegengerichteter Zusammenhang der Variablen Medienkonsum und Schlaf vorliegt.
Berechnen Sie für die beiden Variablen jeweils die Standardabweichung \(s_{emp}\).
Lösung\[ \begin{align*} s_{emp_x} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (x_i - \bar{x})^2} \\ &= \sqrt{\frac{1}{6} [(4.7 - 5.48)^2 + (7 - 5.48)^2 + (4.7 - 5.48)^2 + (5.8 - 5.48)^2 + (5.2 - 5.48)^2 + (5.5 - 5.48)^2]} \\ &= \sqrt{\frac{1}{6} 3.72} \\ &= \sqrt{0.62} \\ &= 0.79 \\ s_{emp_y} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (y_i - \bar{y})^2} \\ &= \ ... \\ &= 0.81 \end{align*} \]
Z-standardisieren Sie beide Variablen.
Lösung\[ z_{x_i} = \frac{x_i - \bar{x}}{\sqrt{s^2_{emp_x}}} \text{ bzw. } z_{x_i} = \frac{y_i - \bar{y}}{\sqrt{s^2_{emp_y}}} \]
Also z.B. für \(x_1 = 4.7\), \(\bar{x} = 5.48\) und \(s_{emp_x} = 0.79\):
\[ z_{x_1} = \frac{x_1 - \bar{x}}{\sqrt{s^2_{emp_x}}} = \frac{4.7 - 5.48}{0.79} \approx -0.99 \]
Medienkonsum in Stunden/Tag \(z_{Medienkonsum}\) Schlaf in Stunden \(z_{Schlaf}\) Schüler 1 4.7 -0.99 7.8 1.48 Schüler 2 7.0 1.92 5.4 -1.48 Schüler 3 4.7 -0.99 7.0 0.49 Schüler 4 5.8 0.40 6.0 -0.74 Schüler 5 5.2 -0.36 7.2 0.74 Schüler 6 5.5 0.02 6.2 -0.49 Überprüfen Sie Ihr Ergebnis auch, indem Sie den Mittelwert der \(z\)-Werte \(z_{x_i}\) bzw. \(z_{y_i}\) berechnen. Welcher Wert sollte (nach Rundung ungefähr) dabei herauskommen?
Lösung\[\begin{align*} \bar{z}_x &= \frac{1}{6} \sum_{i = 1}^n z_{x_i} = \frac{1}{6} \cdot \lbrack (-0.99) + (1.92) + (-0.99) + (0.4) + (-0.36) + (0.02) \rbrack \approx 0 \\ \bar{z}_y &= \frac{1}{6} \sum_{i = 1}^n z_{y_i} = \frac{1}{6} \cdot \lbrack (1.48) + (-1.48) + (0.49) + (-0.74) + (0.74) + (-0.49) \rbrack \approx 0 \end{align*}\]
Berechnen Sie die Korrelation.
Lösung\[ \begin{align*} r_{xy} &= \frac{1}{n}\sum_{i = 1}^{n}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\sum_{i = 1}^{6}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\left\lbrack z_{x_{1}}\cdot z_{y_{1}} + z_{x_{2}}\cdot z_{y_{2}} + \ldots + z_{x_{6}}\cdot z_{y_{6}} \right\rbrack \\ &= \frac{1}{6}\left\lbrack (-0.99)\cdot (1.48) + (1.92)\cdot (-1.48) + \ldots + ((0.02)) \cdot ((-0.49)) \right\rbrack = -0.9 \end{align*} \]
BONUS: Überprüfen Sie Ihre Ergebnisse aus allen Teilaufgaben in R.
Lösungx <- c(4.7, 7, 4.7, 5.8, 5.2, 5.5)
y <- c(7.8, 5.4, 7, 6, 7.2, 6.2)
mean(x)
[1] 5.483333
mean(y)
[1] 6.6
# Kovarianz von x und y # VORSICHT! Der Befehl cov() berechnet nicht die empirische Kovarianz! # Deshalb muss die Formel hier selbst nachgebaut werden: <- sum((x - mean(x)) * (y - mean(y))) / 6 cov_xy cov_xy
[1] -0.5733333
# VORSICHT! Der Befehl sd() berechnet nicht die empirische Standardabweichung! # Deshalb muss die Formel hier selbst nachgebaut werden: <- sum((x - mean(x))^2) / 6 var_x <- sqrt(var_x) sd_x sd_x
[1] 0.7861651
<- sum((y - mean(y))^2) / 6 var_y <- sqrt(var_y) sd_y sd_y
[1] 0.8082904
# z-Standardisierung für x - mean(x)) / sd_x (x
[1] -0.99639801 1.92919614 -0.99639801 0.40279919 -0.36039928 0.02119996
# z-Standardisierung für y - mean(y)) / sd_y (y
[1] 1.4846150 -1.4846150 0.4948717 -0.7423075 0.7423075 -0.4948717
# Korrelation von x und y cor(x,y)
[1] -0.9022482
Medienkonsum in Stunden/Tag | Schlaf in Stunden | |
---|---|---|
Schüler 1 | 3.8 | 8.0 |
Schüler 2 | 6.2 | 5.9 |
Schüler 3 | 4.8 | 7.6 |
Schüler 4 | 3.9 | 8.1 |
Schüler 5 | 5.0 | 7.0 |
Schüler 6 | 7.8 | 4.3 |
Welche Richtung hat der Zusammenhang? Drücken Sie diesen in Worten aus.
LösungEs liegt ein entgegengerichteter Zusammenhang vor. Je höher der tägliche Medienkonsum der Schüler ist, desto niedriger schlafen sie im Durchschnitt (bzw. umgekehrt).
Berechnen Sie die Kovarianz und interpretieren Sie diese.
Lösung\[\bar{x} = 5.25\]
\[\bar{y} = 6.82\]
\[ \begin{align*} {cov}_{emp}(x,\ y) &= \frac{1}{n}\sum_{i = 1}^{n}\left( x_{i} - \bar{x} \right)\left( y_{i} - \bar{y} \right) \\ &= \frac{1}{6}\sum_{i = 1}^{6}\left( x_{i} - 5.25 \right)\left( y_{i} - 6.82 \right) \\ &= \frac{1}{6}\left\lbrack \left( x_{1} - 5.25 \right)\left( y_{1} - 6.82 \right) + \left( x_{2} - 5.25 \right)\left( y_{2} - 6.82 \right) + \ldots + \left( x_{5} - 5.25 \right)\left( y_{5} - 6.82 \right) \right\rbrack \\ &= \frac{1}{6}\left\lbrack (3.8 - 5.25)(8 - 6.82) + (6.2 - 5.25)(5.9 - 6.82) + \ldots + (7.8 - 5.25)(4.3 - 6.82) \right\rbrack = -1.86 \end{align*} \] Da an der Kovarianz lediglich die Richtung des Zusammenhangs abgelesen werden kann, können wir nur sagen, dass ein gegengerichteter Zusammenhang der Variablen Medienkonsum und Schlaf vorliegt.
Berechnen Sie für die beiden Variablen jeweils die Standardabweichung \(s_{emp}\).
Lösung\[ \begin{align*} s_{emp_x} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (x_i - \bar{x})^2} \\ &= \sqrt{\frac{1}{6} [(3.8 - 5.25)^2 + (6.2 - 5.25)^2 + (4.8 - 5.25)^2 + (3.9 - 5.25)^2 + (5 - 5.25)^2 + (7.8 - 5.25)^2]} \\ &= \sqrt{\frac{1}{6} 11.58} \\ &= \sqrt{1.93} \\ &= 1.39 \\ s_{emp_y} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (y_i - \bar{y})^2} \\ &= \ ... \\ &= 1.35 \end{align*} \]
Z-standardisieren Sie beide Variablen.
Lösung\[ z_{x_i} = \frac{x_i - \bar{x}}{\sqrt{s^2_{emp_x}}} \text{ bzw. } z_{x_i} = \frac{y_i - \bar{y}}{\sqrt{s^2_{emp_y}}} \]
Also z.B. für \(x_1 = 3.8\), \(\bar{x} = 5.25\) und \(s_{emp_x} = 1.39\):
\[ z_{x_1} = \frac{x_1 - \bar{x}}{\sqrt{s^2_{emp_x}}} = \frac{3.8 - 5.25}{1.39} \approx -1.04 \]
Medienkonsum in Stunden/Tag \(z_{Medienkonsum}\) Schlaf in Stunden \(z_{Schlaf}\) Schüler 1 3.8 -1.04 8.0 0.88 Schüler 2 6.2 0.68 5.9 -0.68 Schüler 3 4.8 -0.32 7.6 0.58 Schüler 4 3.9 -0.97 8.1 0.95 Schüler 5 5.0 -0.18 7.0 0.14 Schüler 6 7.8 1.83 4.3 -1.86 Überprüfen Sie Ihr Ergebnis auch, indem Sie den Mittelwert der \(z\)-Werte \(z_{x_i}\) bzw. \(z_{y_i}\) berechnen. Welcher Wert sollte (nach Rundung ungefähr) dabei herauskommen?
Lösung\[\begin{align*} \bar{z}_x &= \frac{1}{6} \sum_{i = 1}^n z_{x_i} = \frac{1}{6} \cdot \lbrack (-1.04) + (0.68) + (-0.32) + (-0.97) + (-0.18) + (1.83) \rbrack \approx 0 \\ \bar{z}_y &= \frac{1}{6} \sum_{i = 1}^n z_{y_i} = \frac{1}{6} \cdot \lbrack (0.88) + (-0.68) + (0.58) + (0.95) + (0.14) + (-1.86) \rbrack \approx 0 \end{align*}\]
Berechnen Sie die Korrelation.
Lösung\[ \begin{align*} r_{xy} &= \frac{1}{n}\sum_{i = 1}^{n}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\sum_{i = 1}^{6}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\left\lbrack z_{x_{1}}\cdot z_{y_{1}} + z_{x_{2}}\cdot z_{y_{2}} + \ldots + z_{x_{6}}\cdot z_{y_{6}} \right\rbrack \\ &= \frac{1}{6}\left\lbrack (-1.04)\cdot (0.88) + (0.68)\cdot (-0.68) + \ldots + ((1.83)) \cdot ((-1.86)) \right\rbrack = -0.99 \end{align*} \]
BONUS: Überprüfen Sie Ihre Ergebnisse aus allen Teilaufgaben in R.
Lösungx <- c(3.8, 6.2, 4.8, 3.9, 5, 7.8)
y <- c(8, 5.9, 7.6, 8.1, 7, 4.3)
mean(x)
[1] 5.25
mean(y)
[1] 6.816667
# Kovarianz von x und y # VORSICHT! Der Befehl cov() berechnet nicht die empirische Kovarianz! # Deshalb muss die Formel hier selbst nachgebaut werden: <- sum((x - mean(x)) * (y - mean(y))) / 6 cov_xy cov_xy
[1] -1.855833
# VORSICHT! Der Befehl sd() berechnet nicht die empirische Standardabweichung! # Deshalb muss die Formel hier selbst nachgebaut werden: <- sum((x - mean(x))^2) / 6 var_x <- sqrt(var_x) sd_x sd_x
[1] 1.390144
<- sum((y - mean(y))^2) / 6 var_y <- sqrt(var_y) sd_y sd_y
[1] 1.345878
# z-Standardisierung für x - mean(x)) / sd_x (x
[1] -1.0430575 0.6833825 -0.3237075 -0.9711225 -0.1798375 1.8343425
# z-Standardisierung für y - mean(y)) / sd_y (y
[1] 0.8792275 -0.6810917 0.5820238 0.9535284 0.1362183 -1.8699063
# Korrelation von x und y cor(x,y)
[1] -0.9919125
Medienkonsum in Stunden/Tag | Schlaf in Stunden | |
---|---|---|
Schüler 1 | 5.5 | 6.7 |
Schüler 2 | 3.9 | 7.7 |
Schüler 3 | 4.5 | 7.0 |
Schüler 4 | 4.9 | 7.6 |
Schüler 5 | 6.4 | 5.7 |
Schüler 6 | 3.7 | 8.2 |
Welche Richtung hat der Zusammenhang? Drücken Sie diesen in Worten aus.
LösungEs liegt ein entgegengerichteter Zusammenhang vor. Je höher der tägliche Medienkonsum der Schüler ist, desto niedriger schlafen sie im Durchschnitt (bzw. umgekehrt).
Berechnen Sie die Kovarianz und interpretieren Sie diese.
Lösung\[\bar{x} = 4.82\]
\[\bar{y} = 7.15\]
\[ \begin{align*} {cov}_{emp}(x,\ y) &= \frac{1}{n}\sum_{i = 1}^{n}\left( x_{i} - \bar{x} \right)\left( y_{i} - \bar{y} \right) \\ &= \frac{1}{6}\sum_{i = 1}^{6}\left( x_{i} - 4.82 \right)\left( y_{i} - 7.15 \right) \\ &= \frac{1}{6}\left\lbrack \left( x_{1} - 4.82 \right)\left( y_{1} - 7.15 \right) + \left( x_{2} - 4.82 \right)\left( y_{2} - 7.15 \right) + \ldots + \left( x_{5} - 4.82 \right)\left( y_{5} - 7.15 \right) \right\rbrack \\ &= \frac{1}{6}\left\lbrack (5.5 - 4.82)(6.7 - 7.15) + (3.9 - 4.82)(7.7 - 7.15) + \ldots + (3.7 - 4.82)(8.2 - 7.15) \right\rbrack = -0.7 \end{align*} \] Da an der Kovarianz lediglich die Richtung des Zusammenhangs abgelesen werden kann, können wir nur sagen, dass ein gegengerichteter Zusammenhang der Variablen Medienkonsum und Schlaf vorliegt.
Berechnen Sie für die beiden Variablen jeweils die Standardabweichung \(s_{emp}\).
Lösung\[ \begin{align*} s_{emp_x} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (x_i - \bar{x})^2} \\ &= \sqrt{\frac{1}{6} [(5.5 - 4.82)^2 + (3.9 - 4.82)^2 + (4.5 - 4.82)^2 + (4.9 - 4.82)^2 + (6.4 - 4.82)^2 + (3.7 - 4.82)^2]} \\ &= \sqrt{\frac{1}{6} 5.16} \\ &= \sqrt{0.86} \\ &= 0.93 \\ s_{emp_y} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (y_i - \bar{y})^2} \\ &= \ ... \\ &= 0.81 \end{align*} \]
Z-standardisieren Sie beide Variablen.
Lösung\[ z_{x_i} = \frac{x_i - \bar{x}}{\sqrt{s^2_{emp_x}}} \text{ bzw. } z_{x_i} = \frac{y_i - \bar{y}}{\sqrt{s^2_{emp_y}}} \]
Also z.B. für \(x_1 = 5.5\), \(\bar{x} = 4.82\) und \(s_{emp_x} = 0.93\):
\[ z_{x_1} = \frac{x_1 - \bar{x}}{\sqrt{s^2_{emp_x}}} = \frac{5.5 - 4.82}{0.93} \approx 0.73 \]
Medienkonsum in Stunden/Tag \(z_{Medienkonsum}\) Schlaf in Stunden \(z_{Schlaf}\) Schüler 1 5.5 0.73 6.7 -0.56 Schüler 2 3.9 -0.99 7.7 0.68 Schüler 3 4.5 -0.34 7.0 -0.19 Schüler 4 4.9 0.09 7.6 0.56 Schüler 5 6.4 1.70 5.7 -1.79 Schüler 6 3.7 -1.20 8.2 1.30 Überprüfen Sie Ihr Ergebnis auch, indem Sie den Mittelwert der \(z\)-Werte \(z_{x_i}\) bzw. \(z_{y_i}\) berechnen. Welcher Wert sollte (nach Rundung ungefähr) dabei herauskommen?
Lösung\[\begin{align*} \bar{z}_x &= \frac{1}{6} \sum_{i = 1}^n z_{x_i} = \frac{1}{6} \cdot \lbrack (0.73) + (-0.99) + (-0.34) + (0.09) + (1.7) + (-1.2) \rbrack \approx 0 \\ \bar{z}_y &= \frac{1}{6} \sum_{i = 1}^n z_{y_i} = \frac{1}{6} \cdot \lbrack (-0.56) + (0.68) + (-0.19) + (0.56) + (-1.79) + (1.3) \rbrack \approx 0 \end{align*}\]
Berechnen Sie die Korrelation.
Lösung\[ \begin{align*} r_{xy} &= \frac{1}{n}\sum_{i = 1}^{n}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\sum_{i = 1}^{6}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\left\lbrack z_{x_{1}}\cdot z_{y_{1}} + z_{x_{2}}\cdot z_{y_{2}} + \ldots + z_{x_{6}}\cdot z_{y_{6}} \right\rbrack \\ &= \frac{1}{6}\left\lbrack (0.73)\cdot (-0.56) + (-0.99)\cdot (0.68) + \ldots + ((-1.2)) \cdot ((1.3)) \right\rbrack = -0.93 \end{align*} \]
BONUS: Überprüfen Sie Ihre Ergebnisse aus allen Teilaufgaben in R.
Lösungx <- c(5.5, 3.9, 4.5, 4.9, 6.4, 3.7)
y <- c(6.7, 7.7, 7, 7.6, 5.7, 8.2)
mean(x)
[1] 4.816667
mean(y)
[1] 7.15
# Kovarianz von x und y # VORSICHT! Der Befehl cov() berechnet nicht die empirische Kovarianz! # Deshalb muss die Formel hier selbst nachgebaut werden: <- sum((x - mean(x)) * (y - mean(y))) / 6 cov_xy cov_xy
[1] -0.6991667
# VORSICHT! Der Befehl sd() berechnet nicht die empirische Standardabweichung! # Deshalb muss die Formel hier selbst nachgebaut werden: <- sum((x - mean(x))^2) / 6 var_x <- sqrt(var_x) sd_x sd_x
[1] 0.9281104
<- sum((y - mean(y))^2) / 6 var_y <- sqrt(var_y) sd_y sd_y
[1] 0.8098354
# z-Standardisierung für x - mean(x)) / sd_x (x
[1] 0.73626300 -0.98766987 -0.34119505 0.08978817 1.70597523 -1.20316148
# z-Standardisierung für y - mean(y)) / sd_y (y
[1] -0.5556685 0.6791504 -0.1852228 0.5556685 -1.7904874 1.2965598
# Korrelation von x und y cor(x,y)
[1] -0.9302171
Medienkonsum in Stunden/Tag | Schlaf in Stunden | |
---|---|---|
Schüler 1 | 3.6 | 5.7 |
Schüler 2 | 5.2 | 7.2 |
Schüler 3 | 5.5 | 7.0 |
Schüler 4 | 5.6 | 7.4 |
Schüler 5 | 4.0 | 5.2 |
Schüler 6 | 4.9 | 6.6 |
Welche Richtung hat der Zusammenhang? Drücken Sie diesen in Worten aus.
LösungEs liegt ein gleichgerichteter Zusammenhang vor. Je höher der tägliche Medienkonsum der Schüler ist, desto höher schlafen sie im Durchschnitt (bzw. umgekehrt).
Berechnen Sie die Kovarianz und interpretieren Sie diese.
Lösung\[\bar{x} = 4.8\]
\[\bar{y} = 6.52\]
\[ \begin{align*} {cov}_{emp}(x,\ y) &= \frac{1}{n}\sum_{i = 1}^{n}\left( x_{i} - \bar{x} \right)\left( y_{i} - \bar{y} \right) \\ &= \frac{1}{6}\sum_{i = 1}^{6}\left( x_{i} - 4.8 \right)\left( y_{i} - 6.52 \right) \\ &= \frac{1}{6}\left\lbrack \left( x_{1} - 4.8 \right)\left( y_{1} - 6.52 \right) + \left( x_{2} - 4.8 \right)\left( y_{2} - 6.52 \right) + \ldots + \left( x_{5} - 4.8 \right)\left( y_{5} - 6.52 \right) \right\rbrack \\ &= \frac{1}{6}\left\lbrack (3.6 - 4.8)(5.7 - 6.52) + (5.2 - 4.8)(7.2 - 6.52) + \ldots + (4.9 - 4.8)(6.6 - 6.52) \right\rbrack = 0.56 \end{align*} \] Da an der Kovarianz lediglich die Richtung des Zusammenhangs abgelesen werden kann, können wir nur sagen, dass ein gleichgerichteter Zusammenhang der Variablen Medienkonsum und Schlaf vorliegt.
Berechnen Sie für die beiden Variablen jeweils die Standardabweichung \(s_{emp}\).
Lösung\[ \begin{align*} s_{emp_x} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (x_i - \bar{x})^2} \\ &= \sqrt{\frac{1}{6} [(3.6 - 4.8)^2 + (5.2 - 4.8)^2 + (5.5 - 4.8)^2 + (5.6 - 4.8)^2 + (4 - 4.8)^2 + (4.9 - 4.8)^2]} \\ &= \sqrt{\frac{1}{6} 3.36} \\ &= \sqrt{0.56} \\ &= 0.75 \\ s_{emp_y} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (y_i - \bar{y})^2} \\ &= \ ... \\ &= 0.81 \end{align*} \]
Z-standardisieren Sie beide Variablen.
Lösung\[ z_{x_i} = \frac{x_i - \bar{x}}{\sqrt{s^2_{emp_x}}} \text{ bzw. } z_{x_i} = \frac{y_i - \bar{y}}{\sqrt{s^2_{emp_y}}} \]
Also z.B. für \(x_1 = 3.6\), \(\bar{x} = 4.8\) und \(s_{emp_x} = 0.75\):
\[ z_{x_1} = \frac{x_1 - \bar{x}}{\sqrt{s^2_{emp_x}}} = \frac{3.6 - 4.8}{0.75} \approx -1.6 \]
Medienkonsum in Stunden/Tag \(z_{Medienkonsum}\) Schlaf in Stunden \(z_{Schlaf}\) Schüler 1 3.6 -1.60 5.7 -1.01 Schüler 2 5.2 0.53 7.2 0.84 Schüler 3 5.5 0.93 7.0 0.60 Schüler 4 5.6 1.07 7.4 1.09 Schüler 5 4.0 -1.07 5.2 -1.63 Schüler 6 4.9 0.13 6.6 0.10 Überprüfen Sie Ihr Ergebnis auch, indem Sie den Mittelwert der \(z\)-Werte \(z_{x_i}\) bzw. \(z_{y_i}\) berechnen. Welcher Wert sollte (nach Rundung ungefähr) dabei herauskommen?
Lösung\[\begin{align*} \bar{z}_x &= \frac{1}{6} \sum_{i = 1}^n z_{x_i} = \frac{1}{6} \cdot \lbrack (-1.6) + (0.53) + (0.93) + (1.07) + (-1.07) + (0.13) \rbrack \approx 0 \\ \bar{z}_y &= \frac{1}{6} \sum_{i = 1}^n z_{y_i} = \frac{1}{6} \cdot \lbrack (-1.01) + (0.84) + (0.6) + (1.09) + (-1.63) + (0.1) \rbrack \approx 0 \end{align*}\]
Berechnen Sie die Korrelation.
Lösung\[ \begin{align*} r_{xy} &= \frac{1}{n}\sum_{i = 1}^{n}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\sum_{i = 1}^{6}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\left\lbrack z_{x_{1}}\cdot z_{y_{1}} + z_{x_{2}}\cdot z_{y_{2}} + \ldots + z_{x_{6}}\cdot z_{y_{6}} \right\rbrack \\ &= \frac{1}{6}\left\lbrack (-1.6)\cdot (-1.01) + (0.53)\cdot (0.84) + \ldots + ((0.13)) \cdot ((0.1)) \right\rbrack = 0.92 \end{align*} \]
BONUS: Überprüfen Sie Ihre Ergebnisse aus allen Teilaufgaben in R.
Lösungx <- c(3.6, 5.2, 5.5, 5.6, 4, 4.9)
y <- c(5.7, 7.2, 7, 7.4, 5.2, 6.6)
mean(x)
[1] 4.8
mean(y)
[1] 6.516667
# Kovarianz von x und y # VORSICHT! Der Befehl cov() berechnet nicht die empirische Kovarianz! # Deshalb muss die Formel hier selbst nachgebaut werden: <- sum((x - mean(x)) * (y - mean(y))) / 6 cov_xy cov_xy
[1] 0.56
# VORSICHT! Der Befehl sd() berechnet nicht die empirische Standardabweichung! # Deshalb muss die Formel hier selbst nachgebaut werden: <- sum((x - mean(x))^2) / 6 var_x <- sqrt(var_x) sd_x sd_x
[1] 0.7505553
<- sum((y - mean(y))^2) / 6 var_y <- sqrt(var_y) sd_y sd_y
[1] 0.805019
# z-Standardisierung für x - mean(x)) / sd_x (x
[1] -1.5988161 0.5329387 0.9326427 1.0658774 -1.0658774 0.1332347
# z-Standardisierung für y - mean(y)) / sd_y (y
[1] -1.0144688 0.8488413 0.6003999 1.0972826 -1.6355722 0.1035172
# Korrelation von x und y cor(x,y)
[1] 0.9268281
Medienkonsum in Stunden/Tag | Schlaf in Stunden | |
---|---|---|
Schüler 1 | 4.6 | 6.6 |
Schüler 2 | 5.1 | 7.1 |
Schüler 3 | 4.3 | 5.9 |
Schüler 4 | 3.0 | 4.8 |
Schüler 5 | 5.0 | 6.6 |
Schüler 6 | 3.1 | 4.7 |
Welche Richtung hat der Zusammenhang? Drücken Sie diesen in Worten aus.
LösungEs liegt ein gleichgerichteter Zusammenhang vor. Je höher der tägliche Medienkonsum der Schüler ist, desto höher schlafen sie im Durchschnitt (bzw. umgekehrt).
Berechnen Sie die Kovarianz und interpretieren Sie diese.
Lösung\[\bar{x} = 4.18\]
\[\bar{y} = 5.95\]
\[ \begin{align*} {cov}_{emp}(x,\ y) &= \frac{1}{n}\sum_{i = 1}^{n}\left( x_{i} - \bar{x} \right)\left( y_{i} - \bar{y} \right) \\ &= \frac{1}{6}\sum_{i = 1}^{6}\left( x_{i} - 4.18 \right)\left( y_{i} - 5.95 \right) \\ &= \frac{1}{6}\left\lbrack \left( x_{1} - 4.18 \right)\left( y_{1} - 5.95 \right) + \left( x_{2} - 4.18 \right)\left( y_{2} - 5.95 \right) + \ldots + \left( x_{5} - 4.18 \right)\left( y_{5} - 5.95 \right) \right\rbrack \\ &= \frac{1}{6}\left\lbrack (4.6 - 4.18)(6.6 - 5.95) + (5.1 - 4.18)(7.1 - 5.95) + \ldots + (3.1 - 4.18)(4.7 - 5.95) \right\rbrack = 0.76 \end{align*} \] Da an der Kovarianz lediglich die Richtung des Zusammenhangs abgelesen werden kann, können wir nur sagen, dass ein gleichgerichteter Zusammenhang der Variablen Medienkonsum und Schlaf vorliegt.
Berechnen Sie für die beiden Variablen jeweils die Standardabweichung \(s_{emp}\).
Lösung\[ \begin{align*} s_{emp_x} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (x_i - \bar{x})^2} \\ &= \sqrt{\frac{1}{6} [(4.6 - 4.18)^2 + (5.1 - 4.18)^2 + (4.3 - 4.18)^2 + (3 - 4.18)^2 + (5 - 4.18)^2 + (3.1 - 4.18)^2]} \\ &= \sqrt{\frac{1}{6} 4.26} \\ &= \sqrt{0.71} \\ &= 0.84 \\ s_{emp_y} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (y_i - \bar{y})^2} \\ &= \ ... \\ &= 0.92 \end{align*} \]
Z-standardisieren Sie beide Variablen.
Lösung\[ z_{x_i} = \frac{x_i - \bar{x}}{\sqrt{s^2_{emp_x}}} \text{ bzw. } z_{x_i} = \frac{y_i - \bar{y}}{\sqrt{s^2_{emp_y}}} \]
Also z.B. für \(x_1 = 4.6\), \(\bar{x} = 4.18\) und \(s_{emp_x} = 0.84\):
\[ z_{x_1} = \frac{x_1 - \bar{x}}{\sqrt{s^2_{emp_x}}} = \frac{4.6 - 4.18}{0.84} \approx 0.5 \]
Medienkonsum in Stunden/Tag \(z_{Medienkonsum}\) Schlaf in Stunden \(z_{Schlaf}\) Schüler 1 4.6 0.50 6.6 0.71 Schüler 2 5.1 1.09 7.1 1.25 Schüler 3 4.3 0.14 5.9 -0.05 Schüler 4 3.0 -1.41 4.8 -1.25 Schüler 5 5.0 0.97 6.6 0.71 Schüler 6 3.1 -1.29 4.7 -1.36 Überprüfen Sie Ihr Ergebnis auch, indem Sie den Mittelwert der \(z\)-Werte \(z_{x_i}\) bzw. \(z_{y_i}\) berechnen. Welcher Wert sollte (nach Rundung ungefähr) dabei herauskommen?
Lösung\[\begin{align*} \bar{z}_x &= \frac{1}{6} \sum_{i = 1}^n z_{x_i} = \frac{1}{6} \cdot \lbrack (0.5) + (1.09) + (0.14) + (-1.41) + (0.97) + (-1.29) \rbrack \approx 0 \\ \bar{z}_y &= \frac{1}{6} \sum_{i = 1}^n z_{y_i} = \frac{1}{6} \cdot \lbrack (0.71) + (1.25) + (-0.05) + (-1.25) + (0.71) + (-1.36) \rbrack \approx 0 \end{align*}\]
Berechnen Sie die Korrelation.
Lösung\[ \begin{align*} r_{xy} &= \frac{1}{n}\sum_{i = 1}^{n}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\sum_{i = 1}^{6}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\left\lbrack z_{x_{1}}\cdot z_{y_{1}} + z_{x_{2}}\cdot z_{y_{2}} + \ldots + z_{x_{6}}\cdot z_{y_{6}} \right\rbrack \\ &= \frac{1}{6}\left\lbrack (0.5)\cdot (0.71) + (1.09)\cdot (1.25) + \ldots + ((-1.29)) \cdot ((-1.36)) \right\rbrack = 0.98 \end{align*} \]
BONUS: Überprüfen Sie Ihre Ergebnisse aus allen Teilaufgaben in R.
Lösungx <- c(4.6, 5.1, 4.3, 3, 5, 3.1)
y <- c(6.6, 7.1, 5.9, 4.8, 6.6, 4.7)
mean(x)
[1] 4.183333
mean(y)
[1] 5.95
# Kovarianz von x und y # VORSICHT! Der Befehl cov() berechnet nicht die empirische Kovarianz! # Deshalb muss die Formel hier selbst nachgebaut werden: <- sum((x - mean(x)) * (y - mean(y))) / 6 cov_xy cov_xy
[1] 0.7608333
# VORSICHT! Der Befehl sd() berechnet nicht die empirische Standardabweichung! # Deshalb muss die Formel hier selbst nachgebaut werden: <- sum((x - mean(x))^2) / 6 var_x <- sqrt(var_x) sd_x sd_x
[1] 0.8434387
<- sum((y - mean(y))^2) / 6 var_y <- sqrt(var_y) sd_y sd_y
[1] 0.917878
# z-Standardisierung für x - mean(x)) / sd_x (x
[1] 0.4940094 1.0868207 0.1383226 -1.4029867 0.9682584 -1.2844245
# z-Standardisierung für y - mean(y)) / sd_y (y
[1] 0.70815512 1.25288983 -0.05447347 -1.25288983 0.70815512 -1.36183678
# Korrelation von x und y cor(x,y)
[1] 0.9827681
Medienkonsum in Stunden/Tag | Schlaf in Stunden | |
---|---|---|
Schüler 1 | 5.4 | 7.4 |
Schüler 2 | 5.7 | 7.5 |
Schüler 3 | 5.6 | 7.4 |
Schüler 4 | 6.7 | 8.2 |
Schüler 5 | 5.3 | 7.4 |
Schüler 6 | 5.1 | 7.1 |
Welche Richtung hat der Zusammenhang? Drücken Sie diesen in Worten aus.
LösungEs liegt ein gleichgerichteter Zusammenhang vor. Je höher der tägliche Medienkonsum der Schüler ist, desto höher schlafen sie im Durchschnitt (bzw. umgekehrt).
Berechnen Sie die Kovarianz und interpretieren Sie diese.
Lösung\[\bar{x} = 5.63\]
\[\bar{y} = 7.5\]
\[ \begin{align*} {cov}_{emp}(x,\ y) &= \frac{1}{n}\sum_{i = 1}^{n}\left( x_{i} - \bar{x} \right)\left( y_{i} - \bar{y} \right) \\ &= \frac{1}{6}\sum_{i = 1}^{6}\left( x_{i} - 5.63 \right)\left( y_{i} - 7.5 \right) \\ &= \frac{1}{6}\left\lbrack \left( x_{1} - 5.63 \right)\left( y_{1} - 7.5 \right) + \left( x_{2} - 5.63 \right)\left( y_{2} - 7.5 \right) + \ldots + \left( x_{5} - 5.63 \right)\left( y_{5} - 7.5 \right) \right\rbrack \\ &= \frac{1}{6}\left\lbrack (5.4 - 5.63)(7.4 - 7.5) + (5.7 - 5.63)(7.5 - 7.5) + \ldots + (5.1 - 5.63)(7.1 - 7.5) \right\rbrack = 0.17 \end{align*} \] Da an der Kovarianz lediglich die Richtung des Zusammenhangs abgelesen werden kann, können wir nur sagen, dass ein gleichgerichteter Zusammenhang der Variablen Medienkonsum und Schlaf vorliegt.
Berechnen Sie für die beiden Variablen jeweils die Standardabweichung \(s_{emp}\).
Lösung\[ \begin{align*} s_{emp_x} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (x_i - \bar{x})^2} \\ &= \sqrt{\frac{1}{6} [(5.4 - 5.63)^2 + (5.7 - 5.63)^2 + (5.6 - 5.63)^2 + (6.7 - 5.63)^2 + (5.3 - 5.63)^2 + (5.1 - 5.63)^2]} \\ &= \sqrt{\frac{1}{6} 1.56} \\ &= \sqrt{0.26} \\ &= 0.51 \\ s_{emp_y} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (y_i - \bar{y})^2} \\ &= \ ... \\ &= 0.33 \end{align*} \]
Z-standardisieren Sie beide Variablen.
Lösung\[ z_{x_i} = \frac{x_i - \bar{x}}{\sqrt{s^2_{emp_x}}} \text{ bzw. } z_{x_i} = \frac{y_i - \bar{y}}{\sqrt{s^2_{emp_y}}} \]
Also z.B. für \(x_1 = 5.4\), \(\bar{x} = 5.63\) und \(s_{emp_x} = 0.51\):
\[ z_{x_1} = \frac{x_1 - \bar{x}}{\sqrt{s^2_{emp_x}}} = \frac{5.4 - 5.63}{0.51} \approx -0.46 \]
Medienkonsum in Stunden/Tag \(z_{Medienkonsum}\) Schlaf in Stunden \(z_{Schlaf}\) Schüler 1 5.4 -0.46 7.4 -0.30 Schüler 2 5.7 0.13 7.5 0.00 Schüler 3 5.6 -0.07 7.4 -0.30 Schüler 4 6.7 2.09 8.2 2.12 Schüler 5 5.3 -0.65 7.4 -0.30 Schüler 6 5.1 -1.05 7.1 -1.21 Überprüfen Sie Ihr Ergebnis auch, indem Sie den Mittelwert der \(z\)-Werte \(z_{x_i}\) bzw. \(z_{y_i}\) berechnen. Welcher Wert sollte (nach Rundung ungefähr) dabei herauskommen?
Lösung\[\begin{align*} \bar{z}_x &= \frac{1}{6} \sum_{i = 1}^n z_{x_i} = \frac{1}{6} \cdot \lbrack (-0.46) + (0.13) + (-0.07) + (2.09) + (-0.65) + (-1.05) \rbrack \approx 0 \\ \bar{z}_y &= \frac{1}{6} \sum_{i = 1}^n z_{y_i} = \frac{1}{6} \cdot \lbrack (-0.3) + (0) + (-0.3) + (2.12) + (-0.3) + (-1.21) \rbrack \approx 0 \end{align*}\]
Berechnen Sie die Korrelation.
Lösung\[ \begin{align*} r_{xy} &= \frac{1}{n}\sum_{i = 1}^{n}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\sum_{i = 1}^{6}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\left\lbrack z_{x_{1}}\cdot z_{y_{1}} + z_{x_{2}}\cdot z_{y_{2}} + \ldots + z_{x_{6}}\cdot z_{y_{6}} \right\rbrack \\ &= \frac{1}{6}\left\lbrack (-0.46)\cdot (-0.3) + (0.13)\cdot (0) + \ldots + ((-1.05)) \cdot ((-1.21)) \right\rbrack = 1.01 \end{align*} \]
BONUS: Überprüfen Sie Ihre Ergebnisse aus allen Teilaufgaben in R.
Lösungx <- c(5.4, 5.7, 5.6, 6.7, 5.3, 5.1)
y <- c(7.4, 7.5, 7.4, 8.2, 7.4, 7.1)
mean(x)
[1] 5.633333
mean(y)
[1] 7.5
# Kovarianz von x und y # VORSICHT! Der Befehl cov() berechnet nicht die empirische Kovarianz! # Deshalb muss die Formel hier selbst nachgebaut werden: <- sum((x - mean(x)) * (y - mean(y))) / 6 cov_xy cov_xy
[1] 0.17
# VORSICHT! Der Befehl sd() berechnet nicht die empirische Standardabweichung! # Deshalb muss die Formel hier selbst nachgebaut werden: <- sum((x - mean(x))^2) / 6 var_x <- sqrt(var_x) sd_x sd_x
[1] 0.5153208
<- sum((y - mean(y))^2) / 6 var_y <- sqrt(var_y) sd_y sd_y
[1] 0.3366502
# z-Standardisierung für x - mean(x)) / sd_x (x
[1] -0.45279236 0.12936925 -0.06468462 2.06990793 -0.64684623 -1.03495396
# z-Standardisierung für y - mean(y)) / sd_y (y
[1] -0.2970443 0.0000000 -0.2970443 2.0793098 -0.2970443 -1.1881771
# Korrelation von x und y cor(x,y)
[1] 0.979924
Medienkonsum in Stunden/Tag | Schlaf in Stunden | |
---|---|---|
Schüler 1 | 4.0 | 7.7 |
Schüler 2 | 3.3 | 8.8 |
Schüler 3 | 5.3 | 6.1 |
Schüler 4 | 3.8 | 7.8 |
Schüler 5 | 5.2 | 7.0 |
Schüler 6 | 4.9 | 6.8 |
Welche Richtung hat der Zusammenhang? Drücken Sie diesen in Worten aus.
LösungEs liegt ein entgegengerichteter Zusammenhang vor. Je höher der tägliche Medienkonsum der Schüler ist, desto niedriger schlafen sie im Durchschnitt (bzw. umgekehrt).
Berechnen Sie die Kovarianz und interpretieren Sie diese.
Lösung\[\bar{x} = 4.42\]
\[\bar{y} = 7.37\]
\[ \begin{align*} {cov}_{emp}(x,\ y) &= \frac{1}{n}\sum_{i = 1}^{n}\left( x_{i} - \bar{x} \right)\left( y_{i} - \bar{y} \right) \\ &= \frac{1}{6}\sum_{i = 1}^{6}\left( x_{i} - 4.42 \right)\left( y_{i} - 7.37 \right) \\ &= \frac{1}{6}\left\lbrack \left( x_{1} - 4.42 \right)\left( y_{1} - 7.37 \right) + \left( x_{2} - 4.42 \right)\left( y_{2} - 7.37 \right) + \ldots + \left( x_{5} - 4.42 \right)\left( y_{5} - 7.37 \right) \right\rbrack \\ &= \frac{1}{6}\left\lbrack (4 - 4.42)(7.7 - 7.37) + (3.3 - 4.42)(8.8 - 7.37) + \ldots + (4.9 - 4.42)(6.8 - 7.37) \right\rbrack = -0.61 \end{align*} \] Da an der Kovarianz lediglich die Richtung des Zusammenhangs abgelesen werden kann, können wir nur sagen, dass ein gegengerichteter Zusammenhang der Variablen Medienkonsum und Schlaf vorliegt.
Berechnen Sie für die beiden Variablen jeweils die Standardabweichung \(s_{emp}\).
Lösung\[ \begin{align*} s_{emp_x} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (x_i - \bar{x})^2} \\ &= \sqrt{\frac{1}{6} [(4 - 4.42)^2 + (3.3 - 4.42)^2 + (5.3 - 4.42)^2 + (3.8 - 4.42)^2 + (5.2 - 4.42)^2 + (4.9 - 4.42)^2]} \\ &= \sqrt{\frac{1}{6} 3.42} \\ &= \sqrt{0.57} \\ &= 0.75 \\ s_{emp_y} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (y_i - \bar{y})^2} \\ &= \ ... \\ &= 0.85 \end{align*} \]
Z-standardisieren Sie beide Variablen.
Lösung\[ z_{x_i} = \frac{x_i - \bar{x}}{\sqrt{s^2_{emp_x}}} \text{ bzw. } z_{x_i} = \frac{y_i - \bar{y}}{\sqrt{s^2_{emp_y}}} \]
Also z.B. für \(x_1 = 4\), \(\bar{x} = 4.42\) und \(s_{emp_x} = 0.75\):
\[ z_{x_1} = \frac{x_1 - \bar{x}}{\sqrt{s^2_{emp_x}}} = \frac{4 - 4.42}{0.75} \approx -0.56 \]
Medienkonsum in Stunden/Tag \(z_{Medienkonsum}\) Schlaf in Stunden \(z_{Schlaf}\) Schüler 1 4.0 -0.56 7.7 0.39 Schüler 2 3.3 -1.49 8.8 1.69 Schüler 3 5.3 1.18 6.1 -1.49 Schüler 4 3.8 -0.82 7.8 0.51 Schüler 5 5.2 1.04 7.0 -0.43 Schüler 6 4.9 0.64 6.8 -0.67 Überprüfen Sie Ihr Ergebnis auch, indem Sie den Mittelwert der \(z\)-Werte \(z_{x_i}\) bzw. \(z_{y_i}\) berechnen. Welcher Wert sollte (nach Rundung ungefähr) dabei herauskommen?
Lösung\[\begin{align*} \bar{z}_x &= \frac{1}{6} \sum_{i = 1}^n z_{x_i} = \frac{1}{6} \cdot \lbrack (-0.56) + (-1.49) + (1.18) + (-0.82) + (1.04) + (0.64) \rbrack \approx 0 \\ \bar{z}_y &= \frac{1}{6} \sum_{i = 1}^n z_{y_i} = \frac{1}{6} \cdot \lbrack (0.39) + (1.69) + (-1.49) + (0.51) + (-0.43) + (-0.67) \rbrack \approx 0 \end{align*}\]
Berechnen Sie die Korrelation.
Lösung\[ \begin{align*} r_{xy} &= \frac{1}{n}\sum_{i = 1}^{n}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\sum_{i = 1}^{6}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\left\lbrack z_{x_{1}}\cdot z_{y_{1}} + z_{x_{2}}\cdot z_{y_{2}} + \ldots + z_{x_{6}}\cdot z_{y_{6}} \right\rbrack \\ &= \frac{1}{6}\left\lbrack (-0.56)\cdot (0.39) + (-1.49)\cdot (1.69) + \ldots + ((0.64)) \cdot ((-0.67)) \right\rbrack = -0.97 \end{align*} \]
BONUS: Überprüfen Sie Ihre Ergebnisse aus allen Teilaufgaben in R.
Lösungx <- c(4, 3.3, 5.3, 3.8, 5.2, 4.9)
y <- c(7.7, 8.8, 6.1, 7.8, 7, 6.8)
mean(x)
[1] 4.416667
mean(y)
[1] 7.366667
# Kovarianz von x und y # VORSICHT! Der Befehl cov() berechnet nicht die empirische Kovarianz! # Deshalb muss die Formel hier selbst nachgebaut werden: <- sum((x - mean(x)) * (y - mean(y))) / 6 cov_xy cov_xy
[1] -0.6144444
# VORSICHT! Der Befehl sd() berechnet nicht die empirische Standardabweichung! # Deshalb muss die Formel hier selbst nachgebaut werden: <- sum((x - mean(x))^2) / 6 var_x <- sqrt(var_x) sd_x sd_x
[1] 0.7559027
<- sum((y - mean(y))^2) / 6 var_y <- sqrt(var_y) sd_y sd_y
[1] 0.8576454
# z-Standardisierung für x - mean(x)) / sd_x (x
[1] -0.5512173 -1.4772624 1.1685807 -0.8158016 1.0362886 0.6394121
# z-Standardisierung für y - mean(y)) / sd_y (y
[1] 0.3886610 1.6712425 -1.4769119 0.5052593 -0.4275271 -0.6607238
# Korrelation von x und y cor(x,y)
[1] -0.9477832
Medienkonsum in Stunden/Tag | Schlaf in Stunden | |
---|---|---|
Schüler 1 | 5.0 | 7.8 |
Schüler 2 | 5.2 | 6.7 |
Schüler 3 | 3.0 | 9.1 |
Schüler 4 | 6.0 | 6.2 |
Schüler 5 | 5.9 | 5.6 |
Schüler 6 | 5.2 | 6.0 |
Welche Richtung hat der Zusammenhang? Drücken Sie diesen in Worten aus.
LösungEs liegt ein entgegengerichteter Zusammenhang vor. Je höher der tägliche Medienkonsum der Schüler ist, desto niedriger schlafen sie im Durchschnitt (bzw. umgekehrt).
Berechnen Sie die Kovarianz und interpretieren Sie diese.
Lösung\[\bar{x} = 5.05\]
\[\bar{y} = 6.9\]
\[ \begin{align*} {cov}_{emp}(x,\ y) &= \frac{1}{n}\sum_{i = 1}^{n}\left( x_{i} - \bar{x} \right)\left( y_{i} - \bar{y} \right) \\ &= \frac{1}{6}\sum_{i = 1}^{6}\left( x_{i} - 5.05 \right)\left( y_{i} - 6.9 \right) \\ &= \frac{1}{6}\left\lbrack \left( x_{1} - 5.05 \right)\left( y_{1} - 6.9 \right) + \left( x_{2} - 5.05 \right)\left( y_{2} - 6.9 \right) + \ldots + \left( x_{5} - 5.05 \right)\left( y_{5} - 6.9 \right) \right\rbrack \\ &= \frac{1}{6}\left\lbrack (5 - 5.05)(7.8 - 6.9) + (5.2 - 5.05)(6.7 - 6.9) + \ldots + (5.2 - 5.05)(6 - 6.9) \right\rbrack = -1.08 \end{align*} \] Da an der Kovarianz lediglich die Richtung des Zusammenhangs abgelesen werden kann, können wir nur sagen, dass ein gegengerichteter Zusammenhang der Variablen Medienkonsum und Schlaf vorliegt.
Berechnen Sie für die beiden Variablen jeweils die Standardabweichung \(s_{emp}\).
Lösung\[ \begin{align*} s_{emp_x} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (x_i - \bar{x})^2} \\ &= \sqrt{\frac{1}{6} [(5 - 5.05)^2 + (5.2 - 5.05)^2 + (3 - 5.05)^2 + (6 - 5.05)^2 + (5.9 - 5.05)^2 + (5.2 - 5.05)^2]} \\ &= \sqrt{\frac{1}{6} 5.88} \\ &= \sqrt{0.98} \\ &= 0.99 \\ s_{emp_y} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (y_i - \bar{y})^2} \\ &= \ ... \\ &= 1.2 \end{align*} \]
Z-standardisieren Sie beide Variablen.
Lösung\[ z_{x_i} = \frac{x_i - \bar{x}}{\sqrt{s^2_{emp_x}}} \text{ bzw. } z_{x_i} = \frac{y_i - \bar{y}}{\sqrt{s^2_{emp_y}}} \]
Also z.B. für \(x_1 = 5\), \(\bar{x} = 5.05\) und \(s_{emp_x} = 0.99\):
\[ z_{x_1} = \frac{x_1 - \bar{x}}{\sqrt{s^2_{emp_x}}} = \frac{5 - 5.05}{0.99} \approx -0.05 \]
Medienkonsum in Stunden/Tag \(z_{Medienkonsum}\) Schlaf in Stunden \(z_{Schlaf}\) Schüler 1 5.0 -0.05 7.8 0.75 Schüler 2 5.2 0.15 6.7 -0.17 Schüler 3 3.0 -2.07 9.1 1.83 Schüler 4 6.0 0.96 6.2 -0.58 Schüler 5 5.9 0.86 5.6 -1.08 Schüler 6 5.2 0.15 6.0 -0.75 Überprüfen Sie Ihr Ergebnis auch, indem Sie den Mittelwert der \(z\)-Werte \(z_{x_i}\) bzw. \(z_{y_i}\) berechnen. Welcher Wert sollte (nach Rundung ungefähr) dabei herauskommen?
Lösung\[\begin{align*} \bar{z}_x &= \frac{1}{6} \sum_{i = 1}^n z_{x_i} = \frac{1}{6} \cdot \lbrack (-0.05) + (0.15) + (-2.07) + (0.96) + (0.86) + (0.15) \rbrack \approx 0 \\ \bar{z}_y &= \frac{1}{6} \sum_{i = 1}^n z_{y_i} = \frac{1}{6} \cdot \lbrack (0.75) + (-0.17) + (1.83) + (-0.58) + (-1.08) + (-0.75) \rbrack \approx 0 \end{align*}\]
Berechnen Sie die Korrelation.
Lösung\[ \begin{align*} r_{xy} &= \frac{1}{n}\sum_{i = 1}^{n}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\sum_{i = 1}^{6}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\left\lbrack z_{x_{1}}\cdot z_{y_{1}} + z_{x_{2}}\cdot z_{y_{2}} + \ldots + z_{x_{6}}\cdot z_{y_{6}} \right\rbrack \\ &= \frac{1}{6}\left\lbrack (-0.05)\cdot (0.75) + (0.15)\cdot (-0.17) + \ldots + ((0.15)) \cdot ((-0.75)) \right\rbrack = -0.91 \end{align*} \]
BONUS: Überprüfen Sie Ihre Ergebnisse aus allen Teilaufgaben in R.
Lösungx <- c(5, 5.2, 3, 6, 5.9, 5.2)
y <- c(7.8, 6.7, 9.1, 6.2, 5.6, 6)
mean(x)
[1] 5.05
mean(y)
[1] 6.9
# Kovarianz von x und y # VORSICHT! Der Befehl cov() berechnet nicht die empirische Kovarianz! # Deshalb muss die Formel hier selbst nachgebaut werden: <- sum((x - mean(x)) * (y - mean(y))) / 6 cov_xy cov_xy
[1] -1.081667
# VORSICHT! Der Befehl sd() berechnet nicht die empirische Standardabweichung! # Deshalb muss die Formel hier selbst nachgebaut werden: <- sum((x - mean(x))^2) / 6 var_x <- sqrt(var_x) sd_x sd_x
[1] 0.9895285
<- sum((y - mean(y))^2) / 6 var_y <- sqrt(var_y) sd_y sd_y
[1] 1.202775
# z-Standardisierung für x - mean(x)) / sd_x (x
[1] -0.05052912 0.15158735 -2.07169373 0.96005319 0.85899496 0.15158735
# z-Standardisierung für y - mean(y)) / sd_y (y
[1] 0.7482699 -0.1662822 1.8291042 -0.5819877 -1.0808343 -0.7482699
# Korrelation von x und y cor(x,y)
[1] -0.9088263