Übungsblatt 0

Wiederholung Statistik I

  1. Geben Sie jeweils Definition und Bedeutung der folgenden statistischen Größen an.

    \(\bar{x}\)

    \(\bar{x} = \frac{1}{n}\sum_{i = 1}^{n}x_{i}\ \ \)
    Mittelwert, Lagemaß, Schätzwert für \(\pi\) bzw.\(\ \mu\).

    \(r\)

    \(r = \frac{1}{n}\frac{\sum_{i = 1}^{n}{(x_{i} - \bar{x})(y_{i} - \bar{y})}}{s_{emp\ x} \cdot s_{emp\ y}}\)
    Pearson-Korrelation, Maß zur Beschreibung des linearen Zusammenhangs zwischen zwei Variablen.

    \(\sigma^{2}\)

    \(\sigma^{2}\) ist ein Parameter der Normalverteilung. Er entspricht der Varianz einer normalverteilten Zufallsvariable und legt die Breite der Dichtefunktion fest.

    \(\mu\)

    \(\mu\) ist ein Parameter der Normalverteilung. Er entspricht dem Erwartungswert einer normalverteilten Zufallsvariable und legt fest, an welcher Stelle der \(x\)-Achse sich das Maximum der Dichtefunktion befindet.

    \(\bar{X}\ \)

    \(\bar{X} = \frac{1}{n}\sum_{i = 1}^{n}X_{i}\)
    Mittelwert (als Zufallsvariable), Schätzfunktion für \(\pi\) bzw. \(\mu\).

    \(S^{2}\)

    \(S^{2} = \frac{1}{n - 1}\sum_{i = 1}^{n}{(X_{i} - \bar{X})}^{2}\)
    “Korrigierte” Varianz (als Zufallsvariable), dadurch erwartungstreue Schätzfunktion für \(\sigma^{2}\).

  2. Was ist der Unterschied zwischen einer Schätzfunktion und einer Teststatistik? Arbeiten Sie den Unterschied am Beispiel einer einfachen Zufallsstichprobe mit \(n\) unabhängigen Bernoulli-verteilten Zufallsvariablen\(\ X_{i}\ \sim Be(\pi)\ \)mit unbekanntem Parameter \(\pi\) heraus.

    Sowohl Schätzfunktionen als auch Teststatistiken sind Zufallsvariablen, deren Realisationen wir in der von uns gezogenen Stichprobe beobachten können. Die Realisationen von Schätzfunktionen verwenden wir als (Punkt-)Schätzwerte für unbekannte Parameter. Die Realisationen von Teststatistiken verwenden zur Überprüfung von Hypothesen über unbekannte Parameter.

    Bezogen auf das Beispiel:
    Wollen wir wissen, welchen Wert der unbekannte Parameter \(\pi\) hat, müssen wir ihn aus den Stichprobendaten schätzen. Als Schätzfunktion verwenden wir in diesem Fall

    \[\widehat{\pi} = \frac{1}{n}\sum_{i = 1}^{n}X_{i}\]

    Die Realisation dieser Schätzfunktion ist der Mittelwert \(\bar{x}\) in der Stichprobe, welcher in diesem Fall der relativen Häufigkeit der interessierenden Messwertausprägung in der Stichprobe entspricht. \(\bar{x}\) ist unser Schätzwert für den unbekannten Parameter \(\pi\).

    Wollen wir hingegen z.B. die Nullhypothese überprüfen, ob der unbekannte Parameter \(\pi\) gleich einem vorab spezifizierten Wert \(\pi_{0}\) ist, benötigen wir eine Teststatistik, deren Wahrscheinlichkeitsverteilung unter der Nullhypothese bekannt ist. Als Teststatistik verwenden wir in diesem Fall

    \[T = \sum_{i = 1}^{n}X_{i}\]

    Diese Teststatistik folgt unter der Bedingung, dass die Nullhypothese gilt, einer Binomialverteilung mit den Parametern \(n\) und \(\pi_{0}\). Ihre Realisation \(t\) ist die absolute Häufigkeit der interessierenden Messwertausprägung in der Stichprobe. Auf der Basis dieser Realisation können wir nach der Bestimmung des kritischen Bereichs oder nach der Berechnung des p-Werts eine Testentscheidung treffen.

  3. Was versteht man unter dem Signifikanzniveau \(\alpha\)? Was versteht man unter dem \(p\)-Wert?

    • Das Signifikanzniveau \(\alpha\) ist die (maximale) Wahrscheinlichkeit dafür, dass sich die Teststatistik unter der Bedingung, dass die Nullhypothese gilt, im kritischen Bereich realisiert.

    • Der \(p\)-Wert ist die (maximale) Wahrscheinlichkeit dafür, dass sich die Teststatistik unter der Bedingung, dass die Nullhypothese gilt, in dem realisierten Wert oder einem extremeren Wert in Richtung der Alternativhypothese realisiert.

  4. Welche drei Größen bestimmen die Power eines statistischen Hypothesentests? Erklären Sie jeweils den Zusammenhang zwischen diesen Größen und der Power. Weshalb ist eine hohe Power wichtig?

    • Effektgröße -> Je größer der Effekt, desto größer ist die Power.
    • Signifikanzniveau -> Je größer das Signifikanzniveau, desto größer ist die Power.
    • Stichprobengröße -> Je größer der Umfang der Zufallsstichprobe, desto größer ist die Power.

    Eine hohe Power verringert die Abhängigkeit der FDR von der Basisrate.

  5. Es sollen mithilfe eines t-Tests für unabhängige Stichproben mit \(n_{1} = n_{2} = 500\) die folgenden statistischen Hypothesen überprüft werden:

    \[H_{0}:\mu_{1} - \mu_{2} \geq 0\]

    \[H_{1}:\mu_{1} - \mu_{2} < 0\]

    Es liegen folgende Werte aus den Stichproben vor:

    \[{\bar{x}}_{1} = 105.5\ \ \ \ \ \ \ \ s_{1}^{2} = 23\]

    \[{\bar{x}}_{2} = 107.5\ \ \ \ \ \ \ \ s_{2}^{2} = 29\]

    Berechnen Sie die Realisation der Teststatistik und ermitteln Sie den kritischen Wert für ein Signifikanzniveau von \(\alpha = 0.005\). Entscheiden Sie sich für die Nullhypothese oder für die Alternativhypothese?

    \[t = \frac{({\bar{x}}_{1} - {\bar{x}}_{2}) - \mu_{0}}{\sqrt{\frac{s_{pool}^{2}}{n_{1}} + \frac{s_{pool}^{2}}{n_{2}}}} = \frac{(105.5 - 107.5) - 0}{\sqrt{\frac{26}{500} + \frac{26}{500}}} = - 6.20\]

    qt(0.005, df=998)
    [1] -2.580765

    Da die Realisation der Teststatistik kleiner als der kritische Wert ist, entscheiden wir uns für die Alternativhypothese.

  6. Ihnen liegt der folgende R-Output vor. Welche Testentscheidung treffen Sie bei einem Signifikanzniveau von \(\alpha = 0.005\)?

    
        Two Sample t-test
    
    data:  Liegestuetz_prae by Altersgruppe
    t = 0.65218, df = 29, p-value = 0.2597
    alternative hypothesis: true difference in means between group 12-13Jahre and group 11Jahre is greater than 0
    95 percent confidence interval:
     -1.429921       Inf
    sample estimates:
    mean in group 12-13Jahre    mean in group 11Jahre 
                    13.17647                 12.28571 

    Es handelt sich um einen t-Test für unabhängige Stichproben, der eingesetzt wurde, um gerichtete Hypothesen zu überprüfen. Der mithilfe von R ermittelte \(p\)-Wert beträgt \(p = 0.2597\). Da \(p = 0.2597 > \alpha = 0.005\) entscheiden wir uns für die Nullhypothese.

  7. Sie wollen auf Basis von zwei unabhängigen Zufallsstichproben darauf schließen, wie stark sich zwei Populationen im Durchschnitt in einem stetigen Merkmal unterscheiden. Für welches statistische Verfahren entscheiden Sie sich?

    • Konfidenzintervall für \(\mu_{1} - \mu_{2}\) bei unabhängigen Stichproben, da wir uns für die Größe des Unterschieds interessieren.

    • Alternativ: Konfidenzintervall für Cohen’s \(\delta\) bei unabhängigen Stichproben, da wir uns für die Größe des Unterschieds interessieren.

  8. Sie wollen den Stichprobenumfang für eine geplante Studie mit Messwiederholung ermitteln. Es soll dabei ein zweiseitiger t-Tests für abhängige Stichproben mit den folgenden Eigenschaften verwendet werden:

    \[\alpha = 0.005\]

    \[1 - \beta = 0.9\]

    Sie legen den Mindesteffekt, den der Test erkennen soll, auf \(\delta = 0.1\) fest. Ermitteln Sie mithilfe von R den notwendigen Mindeststichprobenumfang.

    library(pwr)
    pwr.t.test(d = 0.1, sig.level = 0.005, power = 0.9, 
               type = 'paired', alternative = 'two.sided')
    
         Paired t test power calculation 
    
                  n = 1675.594
                  d = 0.1
          sig.level = 0.005
              power = 0.9
        alternative = two.sided
    
    NOTE: n is number of *pairs*

    Es müssen mindestens 1676 Versuchspersonen erhoben werden.