Übungsaufgaben

DESKRIPTIVE STATISTIK II: Korrelation

Hinweis

Die hier veröffentlichten Übungsaufgaben sind brandneu und deshalb noch nicht auf Herz und Nieren überprüft. Sollten Sie Fehler entdecken, geben Sie uns bitte unbedingt eine Rückmeldung an philipp.sckopke(at)psy.lmu.de, damit wir so bald wie möglich eine verbesserte Version online stellen können.

Ihnen liegen folgende Daten vor:

Medienkonsum in Stunden/Tag Schlaf in Stunden
Schüler 1 4.7 7.8
Schüler 2 7.0 5.4
Schüler 3 4.7 7.0
Schüler 4 5.8 6.0
Schüler 5 5.2 7.2
Schüler 6 5.5 6.2

Streudiagramm
  1. Welche Richtung hat der Zusammenhang? Drücken Sie diesen in Worten aus.

    Es liegt ein entgegengerichteter Zusammenhang vor. Je höher der tägliche Medienkonsum der Schüler ist, desto niedriger schlafen sie im Durchschnitt (bzw. umgekehrt).

  2. Berechnen Sie die Kovarianz und interpretieren Sie diese.

    \[\bar{x} = 5.48\]

    \[\bar{y} = 6.6\]

    \[ \begin{align*} {cov}_{emp}(x,\ y) &= \frac{1}{n}\sum_{i = 1}^{n}\left( x_{i} - \bar{x} \right)\left( y_{i} - \bar{y} \right) \\ &= \frac{1}{6}\sum_{i = 1}^{6}\left( x_{i} - 5.48 \right)\left( y_{i} - 6.6 \right) \\ &= \frac{1}{6}\left\lbrack \left( x_{1} - 5.48 \right)\left( y_{1} - 6.6 \right) + \left( x_{2} - 5.48 \right)\left( y_{2} - 6.6 \right) + \ldots + \left( x_{5} - 5.48 \right)\left( y_{5} - 6.6 \right) \right\rbrack \\ &= \frac{1}{6}\left\lbrack (4.7 - 5.48)(7.8 - 6.6) + (7 - 5.48)(5.4 - 6.6) + \ldots + (5.5 - 5.48)(6.2 - 6.6) \right\rbrack = -0.57 \end{align*} \] Da an der Kovarianz lediglich die Richtung des Zusammenhangs abgelesen werden kann, können wir nur sagen, dass ein gegengerichteter Zusammenhang der Variablen Medienkonsum und Schlaf vorliegt.

  3. Berechnen Sie für die beiden Variablen jeweils die Standardabweichung \(s_{emp}\).

    \[ \begin{align*} s_{emp_x} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (x_i - \bar{x})^2} \\ &= \sqrt{\frac{1}{6} [(4.7 - 5.48)^2 + (7 - 5.48)^2 + (4.7 - 5.48)^2 + (5.8 - 5.48)^2 + (5.2 - 5.48)^2 + (5.5 - 5.48)^2]} \\ &= \sqrt{\frac{1}{6} 3.72} \\ &= \sqrt{0.62} \\ &= 0.79 \\ s_{emp_y} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (y_i - \bar{y})^2} \\ &= \ ... \\ &= 0.81 \end{align*} \]

  4. Z-standardisieren Sie beide Variablen.

    \[ z_{x_i} = \frac{x_i - \bar{x}}{\sqrt{s^2_{emp_x}}} \text{ bzw. } z_{x_i} = \frac{y_i - \bar{y}}{\sqrt{s^2_{emp_y}}} \]

    Also z.B. für \(x_1 = 4.7\), \(\bar{x} = 5.48\) und \(s_{emp_x} = 0.79\):

    \[ z_{x_1} = \frac{x_1 - \bar{x}}{\sqrt{s^2_{emp_x}}} = \frac{4.7 - 5.48}{0.79} \approx -0.99 \]

    Medienkonsum in Stunden/Tag \(z_{Medienkonsum}\) Schlaf in Stunden \(z_{Schlaf}\)
    Schüler 1 4.7 -0.99 7.8 1.48
    Schüler 2 7.0 1.92 5.4 -1.48
    Schüler 3 4.7 -0.99 7.0 0.49
    Schüler 4 5.8 0.40 6.0 -0.74
    Schüler 5 5.2 -0.36 7.2 0.74
    Schüler 6 5.5 0.02 6.2 -0.49
  5. Überprüfen Sie Ihr Ergebnis auch, indem Sie den Mittelwert der \(z\)-Werte \(z_{x_i}\) bzw. \(z_{y_i}\) berechnen. Welcher Wert sollte (nach Rundung ungefähr) dabei herauskommen?

    \[\begin{align*} \bar{z}_x &= \frac{1}{6} \sum_{i = 1}^n z_{x_i} = \frac{1}{6} \cdot \lbrack (-0.99) + (1.92) + (-0.99) + (0.4) + (-0.36) + (0.02) \rbrack \approx 0 \\ \bar{z}_y &= \frac{1}{6} \sum_{i = 1}^n z_{y_i} = \frac{1}{6} \cdot \lbrack (1.48) + (-1.48) + (0.49) + (-0.74) + (0.74) + (-0.49) \rbrack \approx 0 \end{align*}\]

  6. Berechnen Sie die Korrelation.

    \[ \begin{align*} r_{xy} &= \frac{1}{n}\sum_{i = 1}^{n}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\sum_{i = 1}^{6}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\left\lbrack z_{x_{1}}\cdot z_{y_{1}} + z_{x_{2}}\cdot z_{y_{2}} + \ldots + z_{x_{6}}\cdot z_{y_{6}} \right\rbrack \\ &= \frac{1}{6}\left\lbrack (-0.99)\cdot (1.48) + (1.92)\cdot (-1.48) + \ldots + ((0.02)) \cdot ((-0.49)) \right\rbrack = -0.9 \end{align*} \]

  7. BONUS: Überprüfen Sie Ihre Ergebnisse aus allen Teilaufgaben in R.

    x <- c(4.7, 7, 4.7, 5.8, 5.2, 5.5)

    y <- c(7.8, 5.4, 7, 6, 7.2, 6.2)

    mean(x)
    [1] 5.483333
    mean(y)
    [1] 6.6
    # Kovarianz von x und y
    # VORSICHT! Der Befehl cov() berechnet nicht die empirische Kovarianz!
    # Deshalb muss die Formel hier selbst nachgebaut werden:
    cov_xy <- sum((x - mean(x)) * (y - mean(y))) / 6
    cov_xy
    [1] -0.5733333
    # VORSICHT! Der Befehl sd() berechnet nicht die empirische Standardabweichung!
    # Deshalb muss die Formel hier selbst nachgebaut werden:
    
    var_x <- sum((x - mean(x))^2) / 6
    sd_x <- sqrt(var_x)
    sd_x
    [1] 0.7861651
    var_y <- sum((y - mean(y))^2) / 6
    sd_y <- sqrt(var_y)
    sd_y
    [1] 0.8082904
    # z-Standardisierung für x
    (x - mean(x)) / sd_x
    [1] -0.99639801  1.92919614 -0.99639801  0.40279919 -0.36039928  0.02119996
    # z-Standardisierung für y
    (y - mean(y)) / sd_y
    [1]  1.4846150 -1.4846150  0.4948717 -0.7423075  0.7423075 -0.4948717
    # Korrelation von x und y
    cor(x,y)
    [1] -0.9022482
Medienkonsum in Stunden/Tag Schlaf in Stunden
Schüler 1 3.8 8.0
Schüler 2 6.2 5.9
Schüler 3 4.8 7.6
Schüler 4 3.9 8.1
Schüler 5 5.0 7.0
Schüler 6 7.8 4.3

Streudiagramm
  1. Welche Richtung hat der Zusammenhang? Drücken Sie diesen in Worten aus.

    Es liegt ein entgegengerichteter Zusammenhang vor. Je höher der tägliche Medienkonsum der Schüler ist, desto niedriger schlafen sie im Durchschnitt (bzw. umgekehrt).

  2. Berechnen Sie die Kovarianz und interpretieren Sie diese.

    \[\bar{x} = 5.25\]

    \[\bar{y} = 6.82\]

    \[ \begin{align*} {cov}_{emp}(x,\ y) &= \frac{1}{n}\sum_{i = 1}^{n}\left( x_{i} - \bar{x} \right)\left( y_{i} - \bar{y} \right) \\ &= \frac{1}{6}\sum_{i = 1}^{6}\left( x_{i} - 5.25 \right)\left( y_{i} - 6.82 \right) \\ &= \frac{1}{6}\left\lbrack \left( x_{1} - 5.25 \right)\left( y_{1} - 6.82 \right) + \left( x_{2} - 5.25 \right)\left( y_{2} - 6.82 \right) + \ldots + \left( x_{5} - 5.25 \right)\left( y_{5} - 6.82 \right) \right\rbrack \\ &= \frac{1}{6}\left\lbrack (3.8 - 5.25)(8 - 6.82) + (6.2 - 5.25)(5.9 - 6.82) + \ldots + (7.8 - 5.25)(4.3 - 6.82) \right\rbrack = -1.86 \end{align*} \] Da an der Kovarianz lediglich die Richtung des Zusammenhangs abgelesen werden kann, können wir nur sagen, dass ein gegengerichteter Zusammenhang der Variablen Medienkonsum und Schlaf vorliegt.

  3. Berechnen Sie für die beiden Variablen jeweils die Standardabweichung \(s_{emp}\).

    \[ \begin{align*} s_{emp_x} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (x_i - \bar{x})^2} \\ &= \sqrt{\frac{1}{6} [(3.8 - 5.25)^2 + (6.2 - 5.25)^2 + (4.8 - 5.25)^2 + (3.9 - 5.25)^2 + (5 - 5.25)^2 + (7.8 - 5.25)^2]} \\ &= \sqrt{\frac{1}{6} 11.58} \\ &= \sqrt{1.93} \\ &= 1.39 \\ s_{emp_y} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (y_i - \bar{y})^2} \\ &= \ ... \\ &= 1.35 \end{align*} \]

  4. Z-standardisieren Sie beide Variablen.

    \[ z_{x_i} = \frac{x_i - \bar{x}}{\sqrt{s^2_{emp_x}}} \text{ bzw. } z_{x_i} = \frac{y_i - \bar{y}}{\sqrt{s^2_{emp_y}}} \]

    Also z.B. für \(x_1 = 3.8\), \(\bar{x} = 5.25\) und \(s_{emp_x} = 1.39\):

    \[ z_{x_1} = \frac{x_1 - \bar{x}}{\sqrt{s^2_{emp_x}}} = \frac{3.8 - 5.25}{1.39} \approx -1.04 \]

    Medienkonsum in Stunden/Tag \(z_{Medienkonsum}\) Schlaf in Stunden \(z_{Schlaf}\)
    Schüler 1 3.8 -1.04 8.0 0.88
    Schüler 2 6.2 0.68 5.9 -0.68
    Schüler 3 4.8 -0.32 7.6 0.58
    Schüler 4 3.9 -0.97 8.1 0.95
    Schüler 5 5.0 -0.18 7.0 0.14
    Schüler 6 7.8 1.83 4.3 -1.86
  5. Überprüfen Sie Ihr Ergebnis auch, indem Sie den Mittelwert der \(z\)-Werte \(z_{x_i}\) bzw. \(z_{y_i}\) berechnen. Welcher Wert sollte (nach Rundung ungefähr) dabei herauskommen?

    \[\begin{align*} \bar{z}_x &= \frac{1}{6} \sum_{i = 1}^n z_{x_i} = \frac{1}{6} \cdot \lbrack (-1.04) + (0.68) + (-0.32) + (-0.97) + (-0.18) + (1.83) \rbrack \approx 0 \\ \bar{z}_y &= \frac{1}{6} \sum_{i = 1}^n z_{y_i} = \frac{1}{6} \cdot \lbrack (0.88) + (-0.68) + (0.58) + (0.95) + (0.14) + (-1.86) \rbrack \approx 0 \end{align*}\]

  6. Berechnen Sie die Korrelation.

    \[ \begin{align*} r_{xy} &= \frac{1}{n}\sum_{i = 1}^{n}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\sum_{i = 1}^{6}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\left\lbrack z_{x_{1}}\cdot z_{y_{1}} + z_{x_{2}}\cdot z_{y_{2}} + \ldots + z_{x_{6}}\cdot z_{y_{6}} \right\rbrack \\ &= \frac{1}{6}\left\lbrack (-1.04)\cdot (0.88) + (0.68)\cdot (-0.68) + \ldots + ((1.83)) \cdot ((-1.86)) \right\rbrack = -0.99 \end{align*} \]

  7. BONUS: Überprüfen Sie Ihre Ergebnisse aus allen Teilaufgaben in R.

    x <- c(3.8, 6.2, 4.8, 3.9, 5, 7.8)

    y <- c(8, 5.9, 7.6, 8.1, 7, 4.3)

    mean(x)
    [1] 5.25
    mean(y)
    [1] 6.816667
    # Kovarianz von x und y
    # VORSICHT! Der Befehl cov() berechnet nicht die empirische Kovarianz!
    # Deshalb muss die Formel hier selbst nachgebaut werden:
    cov_xy <- sum((x - mean(x)) * (y - mean(y))) / 6
    cov_xy
    [1] -1.855833
    # VORSICHT! Der Befehl sd() berechnet nicht die empirische Standardabweichung!
    # Deshalb muss die Formel hier selbst nachgebaut werden:
    
    var_x <- sum((x - mean(x))^2) / 6
    sd_x <- sqrt(var_x)
    sd_x
    [1] 1.390144
    var_y <- sum((y - mean(y))^2) / 6
    sd_y <- sqrt(var_y)
    sd_y
    [1] 1.345878
    # z-Standardisierung für x
    (x - mean(x)) / sd_x
    [1] -1.0430575  0.6833825 -0.3237075 -0.9711225 -0.1798375  1.8343425
    # z-Standardisierung für y
    (y - mean(y)) / sd_y
    [1]  0.8792275 -0.6810917  0.5820238  0.9535284  0.1362183 -1.8699063
    # Korrelation von x und y
    cor(x,y)
    [1] -0.9919125
Medienkonsum in Stunden/Tag Schlaf in Stunden
Schüler 1 5.5 6.7
Schüler 2 3.9 7.7
Schüler 3 4.5 7.0
Schüler 4 4.9 7.6
Schüler 5 6.4 5.7
Schüler 6 3.7 8.2

Streudiagramm
  1. Welche Richtung hat der Zusammenhang? Drücken Sie diesen in Worten aus.

    Es liegt ein entgegengerichteter Zusammenhang vor. Je höher der tägliche Medienkonsum der Schüler ist, desto niedriger schlafen sie im Durchschnitt (bzw. umgekehrt).

  2. Berechnen Sie die Kovarianz und interpretieren Sie diese.

    \[\bar{x} = 4.82\]

    \[\bar{y} = 7.15\]

    \[ \begin{align*} {cov}_{emp}(x,\ y) &= \frac{1}{n}\sum_{i = 1}^{n}\left( x_{i} - \bar{x} \right)\left( y_{i} - \bar{y} \right) \\ &= \frac{1}{6}\sum_{i = 1}^{6}\left( x_{i} - 4.82 \right)\left( y_{i} - 7.15 \right) \\ &= \frac{1}{6}\left\lbrack \left( x_{1} - 4.82 \right)\left( y_{1} - 7.15 \right) + \left( x_{2} - 4.82 \right)\left( y_{2} - 7.15 \right) + \ldots + \left( x_{5} - 4.82 \right)\left( y_{5} - 7.15 \right) \right\rbrack \\ &= \frac{1}{6}\left\lbrack (5.5 - 4.82)(6.7 - 7.15) + (3.9 - 4.82)(7.7 - 7.15) + \ldots + (3.7 - 4.82)(8.2 - 7.15) \right\rbrack = -0.7 \end{align*} \] Da an der Kovarianz lediglich die Richtung des Zusammenhangs abgelesen werden kann, können wir nur sagen, dass ein gegengerichteter Zusammenhang der Variablen Medienkonsum und Schlaf vorliegt.

  3. Berechnen Sie für die beiden Variablen jeweils die Standardabweichung \(s_{emp}\).

    \[ \begin{align*} s_{emp_x} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (x_i - \bar{x})^2} \\ &= \sqrt{\frac{1}{6} [(5.5 - 4.82)^2 + (3.9 - 4.82)^2 + (4.5 - 4.82)^2 + (4.9 - 4.82)^2 + (6.4 - 4.82)^2 + (3.7 - 4.82)^2]} \\ &= \sqrt{\frac{1}{6} 5.16} \\ &= \sqrt{0.86} \\ &= 0.93 \\ s_{emp_y} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (y_i - \bar{y})^2} \\ &= \ ... \\ &= 0.81 \end{align*} \]

  4. Z-standardisieren Sie beide Variablen.

    \[ z_{x_i} = \frac{x_i - \bar{x}}{\sqrt{s^2_{emp_x}}} \text{ bzw. } z_{x_i} = \frac{y_i - \bar{y}}{\sqrt{s^2_{emp_y}}} \]

    Also z.B. für \(x_1 = 5.5\), \(\bar{x} = 4.82\) und \(s_{emp_x} = 0.93\):

    \[ z_{x_1} = \frac{x_1 - \bar{x}}{\sqrt{s^2_{emp_x}}} = \frac{5.5 - 4.82}{0.93} \approx 0.73 \]

    Medienkonsum in Stunden/Tag \(z_{Medienkonsum}\) Schlaf in Stunden \(z_{Schlaf}\)
    Schüler 1 5.5 0.73 6.7 -0.56
    Schüler 2 3.9 -0.99 7.7 0.68
    Schüler 3 4.5 -0.34 7.0 -0.19
    Schüler 4 4.9 0.09 7.6 0.56
    Schüler 5 6.4 1.70 5.7 -1.79
    Schüler 6 3.7 -1.20 8.2 1.30
  5. Überprüfen Sie Ihr Ergebnis auch, indem Sie den Mittelwert der \(z\)-Werte \(z_{x_i}\) bzw. \(z_{y_i}\) berechnen. Welcher Wert sollte (nach Rundung ungefähr) dabei herauskommen?

    \[\begin{align*} \bar{z}_x &= \frac{1}{6} \sum_{i = 1}^n z_{x_i} = \frac{1}{6} \cdot \lbrack (0.73) + (-0.99) + (-0.34) + (0.09) + (1.7) + (-1.2) \rbrack \approx 0 \\ \bar{z}_y &= \frac{1}{6} \sum_{i = 1}^n z_{y_i} = \frac{1}{6} \cdot \lbrack (-0.56) + (0.68) + (-0.19) + (0.56) + (-1.79) + (1.3) \rbrack \approx 0 \end{align*}\]

  6. Berechnen Sie die Korrelation.

    \[ \begin{align*} r_{xy} &= \frac{1}{n}\sum_{i = 1}^{n}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\sum_{i = 1}^{6}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\left\lbrack z_{x_{1}}\cdot z_{y_{1}} + z_{x_{2}}\cdot z_{y_{2}} + \ldots + z_{x_{6}}\cdot z_{y_{6}} \right\rbrack \\ &= \frac{1}{6}\left\lbrack (0.73)\cdot (-0.56) + (-0.99)\cdot (0.68) + \ldots + ((-1.2)) \cdot ((1.3)) \right\rbrack = -0.93 \end{align*} \]

  7. BONUS: Überprüfen Sie Ihre Ergebnisse aus allen Teilaufgaben in R.

    x <- c(5.5, 3.9, 4.5, 4.9, 6.4, 3.7)

    y <- c(6.7, 7.7, 7, 7.6, 5.7, 8.2)

    mean(x)
    [1] 4.816667
    mean(y)
    [1] 7.15
    # Kovarianz von x und y
    # VORSICHT! Der Befehl cov() berechnet nicht die empirische Kovarianz!
    # Deshalb muss die Formel hier selbst nachgebaut werden:
    cov_xy <- sum((x - mean(x)) * (y - mean(y))) / 6
    cov_xy
    [1] -0.6991667
    # VORSICHT! Der Befehl sd() berechnet nicht die empirische Standardabweichung!
    # Deshalb muss die Formel hier selbst nachgebaut werden:
    
    var_x <- sum((x - mean(x))^2) / 6
    sd_x <- sqrt(var_x)
    sd_x
    [1] 0.9281104
    var_y <- sum((y - mean(y))^2) / 6
    sd_y <- sqrt(var_y)
    sd_y
    [1] 0.8098354
    # z-Standardisierung für x
    (x - mean(x)) / sd_x
    [1]  0.73626300 -0.98766987 -0.34119505  0.08978817  1.70597523 -1.20316148
    # z-Standardisierung für y
    (y - mean(y)) / sd_y
    [1] -0.5556685  0.6791504 -0.1852228  0.5556685 -1.7904874  1.2965598
    # Korrelation von x und y
    cor(x,y)
    [1] -0.9302171
Medienkonsum in Stunden/Tag Schlaf in Stunden
Schüler 1 3.6 5.7
Schüler 2 5.2 7.2
Schüler 3 5.5 7.0
Schüler 4 5.6 7.4
Schüler 5 4.0 5.2
Schüler 6 4.9 6.6

Streudiagramm
  1. Welche Richtung hat der Zusammenhang? Drücken Sie diesen in Worten aus.

    Es liegt ein gleichgerichteter Zusammenhang vor. Je höher der tägliche Medienkonsum der Schüler ist, desto höher schlafen sie im Durchschnitt (bzw. umgekehrt).

  2. Berechnen Sie die Kovarianz und interpretieren Sie diese.

    \[\bar{x} = 4.8\]

    \[\bar{y} = 6.52\]

    \[ \begin{align*} {cov}_{emp}(x,\ y) &= \frac{1}{n}\sum_{i = 1}^{n}\left( x_{i} - \bar{x} \right)\left( y_{i} - \bar{y} \right) \\ &= \frac{1}{6}\sum_{i = 1}^{6}\left( x_{i} - 4.8 \right)\left( y_{i} - 6.52 \right) \\ &= \frac{1}{6}\left\lbrack \left( x_{1} - 4.8 \right)\left( y_{1} - 6.52 \right) + \left( x_{2} - 4.8 \right)\left( y_{2} - 6.52 \right) + \ldots + \left( x_{5} - 4.8 \right)\left( y_{5} - 6.52 \right) \right\rbrack \\ &= \frac{1}{6}\left\lbrack (3.6 - 4.8)(5.7 - 6.52) + (5.2 - 4.8)(7.2 - 6.52) + \ldots + (4.9 - 4.8)(6.6 - 6.52) \right\rbrack = 0.56 \end{align*} \] Da an der Kovarianz lediglich die Richtung des Zusammenhangs abgelesen werden kann, können wir nur sagen, dass ein gleichgerichteter Zusammenhang der Variablen Medienkonsum und Schlaf vorliegt.

  3. Berechnen Sie für die beiden Variablen jeweils die Standardabweichung \(s_{emp}\).

    \[ \begin{align*} s_{emp_x} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (x_i - \bar{x})^2} \\ &= \sqrt{\frac{1}{6} [(3.6 - 4.8)^2 + (5.2 - 4.8)^2 + (5.5 - 4.8)^2 + (5.6 - 4.8)^2 + (4 - 4.8)^2 + (4.9 - 4.8)^2]} \\ &= \sqrt{\frac{1}{6} 3.36} \\ &= \sqrt{0.56} \\ &= 0.75 \\ s_{emp_y} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (y_i - \bar{y})^2} \\ &= \ ... \\ &= 0.81 \end{align*} \]

  4. Z-standardisieren Sie beide Variablen.

    \[ z_{x_i} = \frac{x_i - \bar{x}}{\sqrt{s^2_{emp_x}}} \text{ bzw. } z_{x_i} = \frac{y_i - \bar{y}}{\sqrt{s^2_{emp_y}}} \]

    Also z.B. für \(x_1 = 3.6\), \(\bar{x} = 4.8\) und \(s_{emp_x} = 0.75\):

    \[ z_{x_1} = \frac{x_1 - \bar{x}}{\sqrt{s^2_{emp_x}}} = \frac{3.6 - 4.8}{0.75} \approx -1.6 \]

    Medienkonsum in Stunden/Tag \(z_{Medienkonsum}\) Schlaf in Stunden \(z_{Schlaf}\)
    Schüler 1 3.6 -1.60 5.7 -1.01
    Schüler 2 5.2 0.53 7.2 0.84
    Schüler 3 5.5 0.93 7.0 0.60
    Schüler 4 5.6 1.07 7.4 1.09
    Schüler 5 4.0 -1.07 5.2 -1.63
    Schüler 6 4.9 0.13 6.6 0.10
  5. Überprüfen Sie Ihr Ergebnis auch, indem Sie den Mittelwert der \(z\)-Werte \(z_{x_i}\) bzw. \(z_{y_i}\) berechnen. Welcher Wert sollte (nach Rundung ungefähr) dabei herauskommen?

    \[\begin{align*} \bar{z}_x &= \frac{1}{6} \sum_{i = 1}^n z_{x_i} = \frac{1}{6} \cdot \lbrack (-1.6) + (0.53) + (0.93) + (1.07) + (-1.07) + (0.13) \rbrack \approx 0 \\ \bar{z}_y &= \frac{1}{6} \sum_{i = 1}^n z_{y_i} = \frac{1}{6} \cdot \lbrack (-1.01) + (0.84) + (0.6) + (1.09) + (-1.63) + (0.1) \rbrack \approx 0 \end{align*}\]

  6. Berechnen Sie die Korrelation.

    \[ \begin{align*} r_{xy} &= \frac{1}{n}\sum_{i = 1}^{n}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\sum_{i = 1}^{6}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\left\lbrack z_{x_{1}}\cdot z_{y_{1}} + z_{x_{2}}\cdot z_{y_{2}} + \ldots + z_{x_{6}}\cdot z_{y_{6}} \right\rbrack \\ &= \frac{1}{6}\left\lbrack (-1.6)\cdot (-1.01) + (0.53)\cdot (0.84) + \ldots + ((0.13)) \cdot ((0.1)) \right\rbrack = 0.92 \end{align*} \]

  7. BONUS: Überprüfen Sie Ihre Ergebnisse aus allen Teilaufgaben in R.

    x <- c(3.6, 5.2, 5.5, 5.6, 4, 4.9)

    y <- c(5.7, 7.2, 7, 7.4, 5.2, 6.6)

    mean(x)
    [1] 4.8
    mean(y)
    [1] 6.516667
    # Kovarianz von x und y
    # VORSICHT! Der Befehl cov() berechnet nicht die empirische Kovarianz!
    # Deshalb muss die Formel hier selbst nachgebaut werden:
    cov_xy <- sum((x - mean(x)) * (y - mean(y))) / 6
    cov_xy
    [1] 0.56
    # VORSICHT! Der Befehl sd() berechnet nicht die empirische Standardabweichung!
    # Deshalb muss die Formel hier selbst nachgebaut werden:
    
    var_x <- sum((x - mean(x))^2) / 6
    sd_x <- sqrt(var_x)
    sd_x
    [1] 0.7505553
    var_y <- sum((y - mean(y))^2) / 6
    sd_y <- sqrt(var_y)
    sd_y
    [1] 0.805019
    # z-Standardisierung für x
    (x - mean(x)) / sd_x
    [1] -1.5988161  0.5329387  0.9326427  1.0658774 -1.0658774  0.1332347
    # z-Standardisierung für y
    (y - mean(y)) / sd_y
    [1] -1.0144688  0.8488413  0.6003999  1.0972826 -1.6355722  0.1035172
    # Korrelation von x und y
    cor(x,y)
    [1] 0.9268281
Medienkonsum in Stunden/Tag Schlaf in Stunden
Schüler 1 4.6 6.6
Schüler 2 5.1 7.1
Schüler 3 4.3 5.9
Schüler 4 3.0 4.8
Schüler 5 5.0 6.6
Schüler 6 3.1 4.7

Streudiagramm
  1. Welche Richtung hat der Zusammenhang? Drücken Sie diesen in Worten aus.

    Es liegt ein gleichgerichteter Zusammenhang vor. Je höher der tägliche Medienkonsum der Schüler ist, desto höher schlafen sie im Durchschnitt (bzw. umgekehrt).

  2. Berechnen Sie die Kovarianz und interpretieren Sie diese.

    \[\bar{x} = 4.18\]

    \[\bar{y} = 5.95\]

    \[ \begin{align*} {cov}_{emp}(x,\ y) &= \frac{1}{n}\sum_{i = 1}^{n}\left( x_{i} - \bar{x} \right)\left( y_{i} - \bar{y} \right) \\ &= \frac{1}{6}\sum_{i = 1}^{6}\left( x_{i} - 4.18 \right)\left( y_{i} - 5.95 \right) \\ &= \frac{1}{6}\left\lbrack \left( x_{1} - 4.18 \right)\left( y_{1} - 5.95 \right) + \left( x_{2} - 4.18 \right)\left( y_{2} - 5.95 \right) + \ldots + \left( x_{5} - 4.18 \right)\left( y_{5} - 5.95 \right) \right\rbrack \\ &= \frac{1}{6}\left\lbrack (4.6 - 4.18)(6.6 - 5.95) + (5.1 - 4.18)(7.1 - 5.95) + \ldots + (3.1 - 4.18)(4.7 - 5.95) \right\rbrack = 0.76 \end{align*} \] Da an der Kovarianz lediglich die Richtung des Zusammenhangs abgelesen werden kann, können wir nur sagen, dass ein gleichgerichteter Zusammenhang der Variablen Medienkonsum und Schlaf vorliegt.

  3. Berechnen Sie für die beiden Variablen jeweils die Standardabweichung \(s_{emp}\).

    \[ \begin{align*} s_{emp_x} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (x_i - \bar{x})^2} \\ &= \sqrt{\frac{1}{6} [(4.6 - 4.18)^2 + (5.1 - 4.18)^2 + (4.3 - 4.18)^2 + (3 - 4.18)^2 + (5 - 4.18)^2 + (3.1 - 4.18)^2]} \\ &= \sqrt{\frac{1}{6} 4.26} \\ &= \sqrt{0.71} \\ &= 0.84 \\ s_{emp_y} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (y_i - \bar{y})^2} \\ &= \ ... \\ &= 0.92 \end{align*} \]

  4. Z-standardisieren Sie beide Variablen.

    \[ z_{x_i} = \frac{x_i - \bar{x}}{\sqrt{s^2_{emp_x}}} \text{ bzw. } z_{x_i} = \frac{y_i - \bar{y}}{\sqrt{s^2_{emp_y}}} \]

    Also z.B. für \(x_1 = 4.6\), \(\bar{x} = 4.18\) und \(s_{emp_x} = 0.84\):

    \[ z_{x_1} = \frac{x_1 - \bar{x}}{\sqrt{s^2_{emp_x}}} = \frac{4.6 - 4.18}{0.84} \approx 0.5 \]

    Medienkonsum in Stunden/Tag \(z_{Medienkonsum}\) Schlaf in Stunden \(z_{Schlaf}\)
    Schüler 1 4.6 0.50 6.6 0.71
    Schüler 2 5.1 1.09 7.1 1.25
    Schüler 3 4.3 0.14 5.9 -0.05
    Schüler 4 3.0 -1.41 4.8 -1.25
    Schüler 5 5.0 0.97 6.6 0.71
    Schüler 6 3.1 -1.29 4.7 -1.36
  5. Überprüfen Sie Ihr Ergebnis auch, indem Sie den Mittelwert der \(z\)-Werte \(z_{x_i}\) bzw. \(z_{y_i}\) berechnen. Welcher Wert sollte (nach Rundung ungefähr) dabei herauskommen?

    \[\begin{align*} \bar{z}_x &= \frac{1}{6} \sum_{i = 1}^n z_{x_i} = \frac{1}{6} \cdot \lbrack (0.5) + (1.09) + (0.14) + (-1.41) + (0.97) + (-1.29) \rbrack \approx 0 \\ \bar{z}_y &= \frac{1}{6} \sum_{i = 1}^n z_{y_i} = \frac{1}{6} \cdot \lbrack (0.71) + (1.25) + (-0.05) + (-1.25) + (0.71) + (-1.36) \rbrack \approx 0 \end{align*}\]

  6. Berechnen Sie die Korrelation.

    \[ \begin{align*} r_{xy} &= \frac{1}{n}\sum_{i = 1}^{n}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\sum_{i = 1}^{6}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\left\lbrack z_{x_{1}}\cdot z_{y_{1}} + z_{x_{2}}\cdot z_{y_{2}} + \ldots + z_{x_{6}}\cdot z_{y_{6}} \right\rbrack \\ &= \frac{1}{6}\left\lbrack (0.5)\cdot (0.71) + (1.09)\cdot (1.25) + \ldots + ((-1.29)) \cdot ((-1.36)) \right\rbrack = 0.98 \end{align*} \]

  7. BONUS: Überprüfen Sie Ihre Ergebnisse aus allen Teilaufgaben in R.

    x <- c(4.6, 5.1, 4.3, 3, 5, 3.1)

    y <- c(6.6, 7.1, 5.9, 4.8, 6.6, 4.7)

    mean(x)
    [1] 4.183333
    mean(y)
    [1] 5.95
    # Kovarianz von x und y
    # VORSICHT! Der Befehl cov() berechnet nicht die empirische Kovarianz!
    # Deshalb muss die Formel hier selbst nachgebaut werden:
    cov_xy <- sum((x - mean(x)) * (y - mean(y))) / 6
    cov_xy
    [1] 0.7608333
    # VORSICHT! Der Befehl sd() berechnet nicht die empirische Standardabweichung!
    # Deshalb muss die Formel hier selbst nachgebaut werden:
    
    var_x <- sum((x - mean(x))^2) / 6
    sd_x <- sqrt(var_x)
    sd_x
    [1] 0.8434387
    var_y <- sum((y - mean(y))^2) / 6
    sd_y <- sqrt(var_y)
    sd_y
    [1] 0.917878
    # z-Standardisierung für x
    (x - mean(x)) / sd_x
    [1]  0.4940094  1.0868207  0.1383226 -1.4029867  0.9682584 -1.2844245
    # z-Standardisierung für y
    (y - mean(y)) / sd_y
    [1]  0.70815512  1.25288983 -0.05447347 -1.25288983  0.70815512 -1.36183678
    # Korrelation von x und y
    cor(x,y)
    [1] 0.9827681
Medienkonsum in Stunden/Tag Schlaf in Stunden
Schüler 1 5.4 7.4
Schüler 2 5.7 7.5
Schüler 3 5.6 7.4
Schüler 4 6.7 8.2
Schüler 5 5.3 7.4
Schüler 6 5.1 7.1

Streudiagramm
  1. Welche Richtung hat der Zusammenhang? Drücken Sie diesen in Worten aus.

    Es liegt ein gleichgerichteter Zusammenhang vor. Je höher der tägliche Medienkonsum der Schüler ist, desto höher schlafen sie im Durchschnitt (bzw. umgekehrt).

  2. Berechnen Sie die Kovarianz und interpretieren Sie diese.

    \[\bar{x} = 5.63\]

    \[\bar{y} = 7.5\]

    \[ \begin{align*} {cov}_{emp}(x,\ y) &= \frac{1}{n}\sum_{i = 1}^{n}\left( x_{i} - \bar{x} \right)\left( y_{i} - \bar{y} \right) \\ &= \frac{1}{6}\sum_{i = 1}^{6}\left( x_{i} - 5.63 \right)\left( y_{i} - 7.5 \right) \\ &= \frac{1}{6}\left\lbrack \left( x_{1} - 5.63 \right)\left( y_{1} - 7.5 \right) + \left( x_{2} - 5.63 \right)\left( y_{2} - 7.5 \right) + \ldots + \left( x_{5} - 5.63 \right)\left( y_{5} - 7.5 \right) \right\rbrack \\ &= \frac{1}{6}\left\lbrack (5.4 - 5.63)(7.4 - 7.5) + (5.7 - 5.63)(7.5 - 7.5) + \ldots + (5.1 - 5.63)(7.1 - 7.5) \right\rbrack = 0.17 \end{align*} \] Da an der Kovarianz lediglich die Richtung des Zusammenhangs abgelesen werden kann, können wir nur sagen, dass ein gleichgerichteter Zusammenhang der Variablen Medienkonsum und Schlaf vorliegt.

  3. Berechnen Sie für die beiden Variablen jeweils die Standardabweichung \(s_{emp}\).

    \[ \begin{align*} s_{emp_x} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (x_i - \bar{x})^2} \\ &= \sqrt{\frac{1}{6} [(5.4 - 5.63)^2 + (5.7 - 5.63)^2 + (5.6 - 5.63)^2 + (6.7 - 5.63)^2 + (5.3 - 5.63)^2 + (5.1 - 5.63)^2]} \\ &= \sqrt{\frac{1}{6} 1.56} \\ &= \sqrt{0.26} \\ &= 0.51 \\ s_{emp_y} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (y_i - \bar{y})^2} \\ &= \ ... \\ &= 0.33 \end{align*} \]

  4. Z-standardisieren Sie beide Variablen.

    \[ z_{x_i} = \frac{x_i - \bar{x}}{\sqrt{s^2_{emp_x}}} \text{ bzw. } z_{x_i} = \frac{y_i - \bar{y}}{\sqrt{s^2_{emp_y}}} \]

    Also z.B. für \(x_1 = 5.4\), \(\bar{x} = 5.63\) und \(s_{emp_x} = 0.51\):

    \[ z_{x_1} = \frac{x_1 - \bar{x}}{\sqrt{s^2_{emp_x}}} = \frac{5.4 - 5.63}{0.51} \approx -0.46 \]

    Medienkonsum in Stunden/Tag \(z_{Medienkonsum}\) Schlaf in Stunden \(z_{Schlaf}\)
    Schüler 1 5.4 -0.46 7.4 -0.30
    Schüler 2 5.7 0.13 7.5 0.00
    Schüler 3 5.6 -0.07 7.4 -0.30
    Schüler 4 6.7 2.09 8.2 2.12
    Schüler 5 5.3 -0.65 7.4 -0.30
    Schüler 6 5.1 -1.05 7.1 -1.21
  5. Überprüfen Sie Ihr Ergebnis auch, indem Sie den Mittelwert der \(z\)-Werte \(z_{x_i}\) bzw. \(z_{y_i}\) berechnen. Welcher Wert sollte (nach Rundung ungefähr) dabei herauskommen?

    \[\begin{align*} \bar{z}_x &= \frac{1}{6} \sum_{i = 1}^n z_{x_i} = \frac{1}{6} \cdot \lbrack (-0.46) + (0.13) + (-0.07) + (2.09) + (-0.65) + (-1.05) \rbrack \approx 0 \\ \bar{z}_y &= \frac{1}{6} \sum_{i = 1}^n z_{y_i} = \frac{1}{6} \cdot \lbrack (-0.3) + (0) + (-0.3) + (2.12) + (-0.3) + (-1.21) \rbrack \approx 0 \end{align*}\]

  6. Berechnen Sie die Korrelation.

    \[ \begin{align*} r_{xy} &= \frac{1}{n}\sum_{i = 1}^{n}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\sum_{i = 1}^{6}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\left\lbrack z_{x_{1}}\cdot z_{y_{1}} + z_{x_{2}}\cdot z_{y_{2}} + \ldots + z_{x_{6}}\cdot z_{y_{6}} \right\rbrack \\ &= \frac{1}{6}\left\lbrack (-0.46)\cdot (-0.3) + (0.13)\cdot (0) + \ldots + ((-1.05)) \cdot ((-1.21)) \right\rbrack = 1.01 \end{align*} \]

  7. BONUS: Überprüfen Sie Ihre Ergebnisse aus allen Teilaufgaben in R.

    x <- c(5.4, 5.7, 5.6, 6.7, 5.3, 5.1)

    y <- c(7.4, 7.5, 7.4, 8.2, 7.4, 7.1)

    mean(x)
    [1] 5.633333
    mean(y)
    [1] 7.5
    # Kovarianz von x und y
    # VORSICHT! Der Befehl cov() berechnet nicht die empirische Kovarianz!
    # Deshalb muss die Formel hier selbst nachgebaut werden:
    cov_xy <- sum((x - mean(x)) * (y - mean(y))) / 6
    cov_xy
    [1] 0.17
    # VORSICHT! Der Befehl sd() berechnet nicht die empirische Standardabweichung!
    # Deshalb muss die Formel hier selbst nachgebaut werden:
    
    var_x <- sum((x - mean(x))^2) / 6
    sd_x <- sqrt(var_x)
    sd_x
    [1] 0.5153208
    var_y <- sum((y - mean(y))^2) / 6
    sd_y <- sqrt(var_y)
    sd_y
    [1] 0.3366502
    # z-Standardisierung für x
    (x - mean(x)) / sd_x
    [1] -0.45279236  0.12936925 -0.06468462  2.06990793 -0.64684623 -1.03495396
    # z-Standardisierung für y
    (y - mean(y)) / sd_y
    [1] -0.2970443  0.0000000 -0.2970443  2.0793098 -0.2970443 -1.1881771
    # Korrelation von x und y
    cor(x,y)
    [1] 0.979924
Medienkonsum in Stunden/Tag Schlaf in Stunden
Schüler 1 4.0 7.7
Schüler 2 3.3 8.8
Schüler 3 5.3 6.1
Schüler 4 3.8 7.8
Schüler 5 5.2 7.0
Schüler 6 4.9 6.8

Streudiagramm
  1. Welche Richtung hat der Zusammenhang? Drücken Sie diesen in Worten aus.

    Es liegt ein entgegengerichteter Zusammenhang vor. Je höher der tägliche Medienkonsum der Schüler ist, desto niedriger schlafen sie im Durchschnitt (bzw. umgekehrt).

  2. Berechnen Sie die Kovarianz und interpretieren Sie diese.

    \[\bar{x} = 4.42\]

    \[\bar{y} = 7.37\]

    \[ \begin{align*} {cov}_{emp}(x,\ y) &= \frac{1}{n}\sum_{i = 1}^{n}\left( x_{i} - \bar{x} \right)\left( y_{i} - \bar{y} \right) \\ &= \frac{1}{6}\sum_{i = 1}^{6}\left( x_{i} - 4.42 \right)\left( y_{i} - 7.37 \right) \\ &= \frac{1}{6}\left\lbrack \left( x_{1} - 4.42 \right)\left( y_{1} - 7.37 \right) + \left( x_{2} - 4.42 \right)\left( y_{2} - 7.37 \right) + \ldots + \left( x_{5} - 4.42 \right)\left( y_{5} - 7.37 \right) \right\rbrack \\ &= \frac{1}{6}\left\lbrack (4 - 4.42)(7.7 - 7.37) + (3.3 - 4.42)(8.8 - 7.37) + \ldots + (4.9 - 4.42)(6.8 - 7.37) \right\rbrack = -0.61 \end{align*} \] Da an der Kovarianz lediglich die Richtung des Zusammenhangs abgelesen werden kann, können wir nur sagen, dass ein gegengerichteter Zusammenhang der Variablen Medienkonsum und Schlaf vorliegt.

  3. Berechnen Sie für die beiden Variablen jeweils die Standardabweichung \(s_{emp}\).

    \[ \begin{align*} s_{emp_x} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (x_i - \bar{x})^2} \\ &= \sqrt{\frac{1}{6} [(4 - 4.42)^2 + (3.3 - 4.42)^2 + (5.3 - 4.42)^2 + (3.8 - 4.42)^2 + (5.2 - 4.42)^2 + (4.9 - 4.42)^2]} \\ &= \sqrt{\frac{1}{6} 3.42} \\ &= \sqrt{0.57} \\ &= 0.75 \\ s_{emp_y} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (y_i - \bar{y})^2} \\ &= \ ... \\ &= 0.85 \end{align*} \]

  4. Z-standardisieren Sie beide Variablen.

    \[ z_{x_i} = \frac{x_i - \bar{x}}{\sqrt{s^2_{emp_x}}} \text{ bzw. } z_{x_i} = \frac{y_i - \bar{y}}{\sqrt{s^2_{emp_y}}} \]

    Also z.B. für \(x_1 = 4\), \(\bar{x} = 4.42\) und \(s_{emp_x} = 0.75\):

    \[ z_{x_1} = \frac{x_1 - \bar{x}}{\sqrt{s^2_{emp_x}}} = \frac{4 - 4.42}{0.75} \approx -0.56 \]

    Medienkonsum in Stunden/Tag \(z_{Medienkonsum}\) Schlaf in Stunden \(z_{Schlaf}\)
    Schüler 1 4.0 -0.56 7.7 0.39
    Schüler 2 3.3 -1.49 8.8 1.69
    Schüler 3 5.3 1.18 6.1 -1.49
    Schüler 4 3.8 -0.82 7.8 0.51
    Schüler 5 5.2 1.04 7.0 -0.43
    Schüler 6 4.9 0.64 6.8 -0.67
  5. Überprüfen Sie Ihr Ergebnis auch, indem Sie den Mittelwert der \(z\)-Werte \(z_{x_i}\) bzw. \(z_{y_i}\) berechnen. Welcher Wert sollte (nach Rundung ungefähr) dabei herauskommen?

    \[\begin{align*} \bar{z}_x &= \frac{1}{6} \sum_{i = 1}^n z_{x_i} = \frac{1}{6} \cdot \lbrack (-0.56) + (-1.49) + (1.18) + (-0.82) + (1.04) + (0.64) \rbrack \approx 0 \\ \bar{z}_y &= \frac{1}{6} \sum_{i = 1}^n z_{y_i} = \frac{1}{6} \cdot \lbrack (0.39) + (1.69) + (-1.49) + (0.51) + (-0.43) + (-0.67) \rbrack \approx 0 \end{align*}\]

  6. Berechnen Sie die Korrelation.

    \[ \begin{align*} r_{xy} &= \frac{1}{n}\sum_{i = 1}^{n}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\sum_{i = 1}^{6}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\left\lbrack z_{x_{1}}\cdot z_{y_{1}} + z_{x_{2}}\cdot z_{y_{2}} + \ldots + z_{x_{6}}\cdot z_{y_{6}} \right\rbrack \\ &= \frac{1}{6}\left\lbrack (-0.56)\cdot (0.39) + (-1.49)\cdot (1.69) + \ldots + ((0.64)) \cdot ((-0.67)) \right\rbrack = -0.97 \end{align*} \]

  7. BONUS: Überprüfen Sie Ihre Ergebnisse aus allen Teilaufgaben in R.

    x <- c(4, 3.3, 5.3, 3.8, 5.2, 4.9)

    y <- c(7.7, 8.8, 6.1, 7.8, 7, 6.8)

    mean(x)
    [1] 4.416667
    mean(y)
    [1] 7.366667
    # Kovarianz von x und y
    # VORSICHT! Der Befehl cov() berechnet nicht die empirische Kovarianz!
    # Deshalb muss die Formel hier selbst nachgebaut werden:
    cov_xy <- sum((x - mean(x)) * (y - mean(y))) / 6
    cov_xy
    [1] -0.6144444
    # VORSICHT! Der Befehl sd() berechnet nicht die empirische Standardabweichung!
    # Deshalb muss die Formel hier selbst nachgebaut werden:
    
    var_x <- sum((x - mean(x))^2) / 6
    sd_x <- sqrt(var_x)
    sd_x
    [1] 0.7559027
    var_y <- sum((y - mean(y))^2) / 6
    sd_y <- sqrt(var_y)
    sd_y
    [1] 0.8576454
    # z-Standardisierung für x
    (x - mean(x)) / sd_x
    [1] -0.5512173 -1.4772624  1.1685807 -0.8158016  1.0362886  0.6394121
    # z-Standardisierung für y
    (y - mean(y)) / sd_y
    [1]  0.3886610  1.6712425 -1.4769119  0.5052593 -0.4275271 -0.6607238
    # Korrelation von x und y
    cor(x,y)
    [1] -0.9477832
Medienkonsum in Stunden/Tag Schlaf in Stunden
Schüler 1 5.0 7.8
Schüler 2 5.2 6.7
Schüler 3 3.0 9.1
Schüler 4 6.0 6.2
Schüler 5 5.9 5.6
Schüler 6 5.2 6.0

Streudiagramm
  1. Welche Richtung hat der Zusammenhang? Drücken Sie diesen in Worten aus.

    Es liegt ein entgegengerichteter Zusammenhang vor. Je höher der tägliche Medienkonsum der Schüler ist, desto niedriger schlafen sie im Durchschnitt (bzw. umgekehrt).

  2. Berechnen Sie die Kovarianz und interpretieren Sie diese.

    \[\bar{x} = 5.05\]

    \[\bar{y} = 6.9\]

    \[ \begin{align*} {cov}_{emp}(x,\ y) &= \frac{1}{n}\sum_{i = 1}^{n}\left( x_{i} - \bar{x} \right)\left( y_{i} - \bar{y} \right) \\ &= \frac{1}{6}\sum_{i = 1}^{6}\left( x_{i} - 5.05 \right)\left( y_{i} - 6.9 \right) \\ &= \frac{1}{6}\left\lbrack \left( x_{1} - 5.05 \right)\left( y_{1} - 6.9 \right) + \left( x_{2} - 5.05 \right)\left( y_{2} - 6.9 \right) + \ldots + \left( x_{5} - 5.05 \right)\left( y_{5} - 6.9 \right) \right\rbrack \\ &= \frac{1}{6}\left\lbrack (5 - 5.05)(7.8 - 6.9) + (5.2 - 5.05)(6.7 - 6.9) + \ldots + (5.2 - 5.05)(6 - 6.9) \right\rbrack = -1.08 \end{align*} \] Da an der Kovarianz lediglich die Richtung des Zusammenhangs abgelesen werden kann, können wir nur sagen, dass ein gegengerichteter Zusammenhang der Variablen Medienkonsum und Schlaf vorliegt.

  3. Berechnen Sie für die beiden Variablen jeweils die Standardabweichung \(s_{emp}\).

    \[ \begin{align*} s_{emp_x} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (x_i - \bar{x})^2} \\ &= \sqrt{\frac{1}{6} [(5 - 5.05)^2 + (5.2 - 5.05)^2 + (3 - 5.05)^2 + (6 - 5.05)^2 + (5.9 - 5.05)^2 + (5.2 - 5.05)^2]} \\ &= \sqrt{\frac{1}{6} 5.88} \\ &= \sqrt{0.98} \\ &= 0.99 \\ s_{emp_y} &= \sqrt{\frac{1}{n} \sum_{i = 1}^n (y_i - \bar{y})^2} \\ &= \ ... \\ &= 1.2 \end{align*} \]

  4. Z-standardisieren Sie beide Variablen.

    \[ z_{x_i} = \frac{x_i - \bar{x}}{\sqrt{s^2_{emp_x}}} \text{ bzw. } z_{x_i} = \frac{y_i - \bar{y}}{\sqrt{s^2_{emp_y}}} \]

    Also z.B. für \(x_1 = 5\), \(\bar{x} = 5.05\) und \(s_{emp_x} = 0.99\):

    \[ z_{x_1} = \frac{x_1 - \bar{x}}{\sqrt{s^2_{emp_x}}} = \frac{5 - 5.05}{0.99} \approx -0.05 \]

    Medienkonsum in Stunden/Tag \(z_{Medienkonsum}\) Schlaf in Stunden \(z_{Schlaf}\)
    Schüler 1 5.0 -0.05 7.8 0.75
    Schüler 2 5.2 0.15 6.7 -0.17
    Schüler 3 3.0 -2.07 9.1 1.83
    Schüler 4 6.0 0.96 6.2 -0.58
    Schüler 5 5.9 0.86 5.6 -1.08
    Schüler 6 5.2 0.15 6.0 -0.75
  5. Überprüfen Sie Ihr Ergebnis auch, indem Sie den Mittelwert der \(z\)-Werte \(z_{x_i}\) bzw. \(z_{y_i}\) berechnen. Welcher Wert sollte (nach Rundung ungefähr) dabei herauskommen?

    \[\begin{align*} \bar{z}_x &= \frac{1}{6} \sum_{i = 1}^n z_{x_i} = \frac{1}{6} \cdot \lbrack (-0.05) + (0.15) + (-2.07) + (0.96) + (0.86) + (0.15) \rbrack \approx 0 \\ \bar{z}_y &= \frac{1}{6} \sum_{i = 1}^n z_{y_i} = \frac{1}{6} \cdot \lbrack (0.75) + (-0.17) + (1.83) + (-0.58) + (-1.08) + (-0.75) \rbrack \approx 0 \end{align*}\]

  6. Berechnen Sie die Korrelation.

    \[ \begin{align*} r_{xy} &= \frac{1}{n}\sum_{i = 1}^{n}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\sum_{i = 1}^{6}{z_{x_{i}}\cdot z_{y_{i}}} \\ &= \frac{1}{6}\left\lbrack z_{x_{1}}\cdot z_{y_{1}} + z_{x_{2}}\cdot z_{y_{2}} + \ldots + z_{x_{6}}\cdot z_{y_{6}} \right\rbrack \\ &= \frac{1}{6}\left\lbrack (-0.05)\cdot (0.75) + (0.15)\cdot (-0.17) + \ldots + ((0.15)) \cdot ((-0.75)) \right\rbrack = -0.91 \end{align*} \]

  7. BONUS: Überprüfen Sie Ihre Ergebnisse aus allen Teilaufgaben in R.

    x <- c(5, 5.2, 3, 6, 5.9, 5.2)

    y <- c(7.8, 6.7, 9.1, 6.2, 5.6, 6)

    mean(x)
    [1] 5.05
    mean(y)
    [1] 6.9
    # Kovarianz von x und y
    # VORSICHT! Der Befehl cov() berechnet nicht die empirische Kovarianz!
    # Deshalb muss die Formel hier selbst nachgebaut werden:
    cov_xy <- sum((x - mean(x)) * (y - mean(y))) / 6
    cov_xy
    [1] -1.081667
    # VORSICHT! Der Befehl sd() berechnet nicht die empirische Standardabweichung!
    # Deshalb muss die Formel hier selbst nachgebaut werden:
    
    var_x <- sum((x - mean(x))^2) / 6
    sd_x <- sqrt(var_x)
    sd_x
    [1] 0.9895285
    var_y <- sum((y - mean(y))^2) / 6
    sd_y <- sqrt(var_y)
    sd_y
    [1] 1.202775
    # z-Standardisierung für x
    (x - mean(x)) / sd_x
    [1] -0.05052912  0.15158735 -2.07169373  0.96005319  0.85899496  0.15158735
    # z-Standardisierung für y
    (y - mean(y)) / sd_y
    [1]  0.7482699 -0.1662822  1.8291042 -0.5819877 -1.0808343 -0.7482699
    # Korrelation von x und y
    cor(x,y)
    [1] -0.9088263