| Bericht
Der viertägige Workshop (1.-4. März 2010) mit Sascha Wolfer und Lars Konieczny führte ein in die Datenarbeit mit R.
Angefangen von Installation und dem Umgang mit R bis zu Visualisierung und statistischer Modellierung von Daten bot der Kurs einen umfassenden Einblick sowohl in die Möglichkeiten der Software als auch in grundlegende Themen der Statistik.
Der Kurs schloss an an die Einführung in die Statistik im Wintersemester 2009/2010, in dem grundlegende Kenntnisse auf der Basis von SPSS vermittelt worden waren. Ziel des Workshops war nun einerseits, diese Kenntnisse in R umzusetzen und darüber hinaus weitergehende Analysetechniken einzuführen. Der Workshop diente damit gleichzeitig als Vorbereitung auf den Workshop mit Harald Baayen.
Zunächst wurde die Installation von R und die grundlegende Funktionsweise der Programmiersprache demonstriert: Welche Datentypen und Operatoren gibt es, und wie lassen sich damit Daten erzeugen, umwandeln und bearbeiten? Wie lassen sich eigene Funktionen und Skripte erstellen, mithilfe derer bestimmte Schritte der Datenaufbereitung und Analyse automatisiert werden können? Ein Schwerpunkt lag dabei auch auf den vielfältigen Möglichkeiten der Visualisierung, die sowohl zur Orientierung in den Daten als auch zur Darstellung der Analyseergebnisse zur Verfügung stehen.
Auf dieser Grundlage wurden dann zunächst die Durchführung statistischer Verfahren (t-test, chi-Quadrat-Test, ANOVA), die aus dem vorherigen Kurs bekannt waren, in R vorgestellt und eingeübt. Darauf aufbauend wurden komplexere Methoden der Datenmodellierung besprochen wie Lineare und Logistische Regression und Gemischte Lineare Modelle.
Der Kurs bot insgesamt eine kompakte und trotz der Informationsmenge anschauliche Einführung in die Möglichkeiten der linguistischen Arbeit mit R und bereitete die anwesenden KollegiatInnen und Gäste ansprechend auf den Workshop mit Harald Baayen vor. |