Machine Learning mit dem R Paket mlr3
Die folgende Einführung stellt die Grundlage für alle Seminarsitzungen zum Thema Machine Learning dar. Es wird nicht erwartet, dass Sie alles bis nächste Woche bearbeitet haben. In den nächsten beiden Wochen folgen noch weitere kürzere Übungsaufgaben. Die weiteren Übungsaufgaben sind etwas einfacher und vom Schwierigkeitsgrad her repräsentativer für die Prüfung als die Exercises hier.
Einführung Teil 1, 2 und 3:
Bearbeiten Sie selbstständig die drei Abschnitte Practical Exercises I - III aus unserem Tutorial Paper
Best Practices in Supervised Machine Learning: A Tutorial for Psychologists.
Um es Ihnen einfacher zu machen sich zurecht zu finden, haben wir die drei Exercises im Folgenden nochmal in unsere OER Webseite integriert (und im Vergleich zum Paper minimal adaptiert). Wenn Sie die Hintergründe zum verwendeten Datensatz nachlesen wollen, finden Sie alle Informationen im Tutorial Paper.
- Practical Exercise I: Performance Evaluation with K-fold Cross-Validation
- Practical Exercise II: Train a Random Forest and Estimate Predictive Performance
- Practical Exercise III: Model Comparisons with Benchmark Experiments
Hinweise:
- Sie benötigen für die drei Abschnitte die R Pakete mlr3verse, ranger, glmnet, future und precrec.
- Der verwendete Datensatz ist die vollständige Version des PhoneStudy Datensatzes, den Sie aus der Vorlesung im Wintersemester kennen. Bei Interesse finden Sie Informationen zum Datensatz im Abschnitt “Datasets Used in Practical Exercises” des Tutorial Papers.
- Im Tutorial Paper werden einige Machine Learning Begriffe verwendet, die Sie eventuell unter anderem Namen kennen. Eine kurze Übersicht finden Sie im Tutorial Paper in Table 1.
- Die Bedienung des mlr3 Pakets ist am Anfang ziemlich ungewohnt, weil es anders funktioniert als die meisten anderen Pakete in R. Wenn die Beschreibungen zu den mlr3 Funktionen im Tutorial für Ihr Verständnis nicht ausreichen, empfehlen wir das mlr3-Ebook, das auch im Paper immer wieder erwähnt wird. Besonders relevant sind die Kapitel 2 und 3.