DE | EN

Daten

 

 

In mehreren abgeschlossenen wie auch in aktuell laufenden und zukünftigen Promotionsvorhaben werden Korpora und Messdaten erzeugt, die zum Teil einzigartige Ressourcen darstellen und eine Archivierung und Aufbereitung in Hinblick auf Nachnutzung für weitere Forschungen sinnvoll machen.

Stellvertretend seien hier genannt die Gesprächsdaten deutsch-russischer Jugendlicher, die Nikolay Khakimov erhoben hat, das für die Gewinnung von Imperativ-Formen maßgeschneiderte, aus dem Web generierte "Walk-through"-Korpus von Computerspiel-Gruppen (Anne Krause) oder die erstmalige linguistische Nutzung von am Klinikum Freiburg erhobenen zeitalignierten elektrokortikographischen Aufzeichnungen der sprachlichen Äußerungen von Epilepsiepatienten in der Arbeit von Olga Iljina.

Datenkorpora, die im GRK selbst entstehen und Potential für weitere Forschungen haben, werden, vorrangig in Zusammenarbeit mit der Universitätsbibliothek Freiburg, nach Klärung der urheberrechtlichen und ethischen Fragen einem interessierten Benutzerkreis zur Verfügung stehen. Da mit Christian Mair und Stefan Pfänder als aktuelle GRK-Sprecher im Rahmen der "Fachspezifischen Arbeitsgruppe Fremdsprachige Philologien" im CLARIN-D Zentrenverbund mitarbeiten  werden derzeit einschlägige Angebote für das GRK entwickelt und geprüft werden.

Die Aufbereitung von Datenkorpora für die Archivierung und Nachnutzung ist im Übrigen eine arbeitsintensive Aufgabe, die sinnvollerweise nicht den einzelnen Promovierenden allein aufgebürdet werden darf, sondern im Rahmen eines Qualitätsmanagement-Systems als Gesamtaufgabe des Kollegs verstanden werden muss – insbesondere in der zweiten und abschließenden Förderphase. An dieser Aufgabe beteiligen sich die KoordinatorInnen des GRK unter der Federführung von Daniel Alcón (Datenbank moca3). Zuarbeit leisten u.a. studentische und wissenschaftliche Hilfskräfte bei der Aufarbeitung der deutschen, englischen, italienischen, französischen, spanischen, russischen Daten (Philipp Bödingmeier, Dennis Dressel, Hugo Doucelin, Philipp Freyburger, Daniel Muz, Robin Oldenzeel, Manuel Tietze, Simon Titze). Nach Klärung urheberrechtlicher und ethischer Fragen wollen wir unsere Daten einem breitest möglichen wissenschaftlichen Nutzerkreis zur Verfügung stellen, und zwar über die Laufzeit der Förderung hinaus.  Im Rahmen des Möglichen orientieren wir uns beim Aufbau und der Annotation der Datenarchive und Korpora ebenfalls an CLARIN-D und seinen Projektzielen der integrierten, interoperablen und skalierbaren Datenarchitekturen.

moca3 - data representation

Moca3 - Representation of the data (Corpora - Event - Transcription -Tier) in the system.

moca3 - data representation

Moca3 - Representation of the data (Corpora - Event - Transcription -Tier) in the system.

moca3 - data representation

Moca3 - Online edition of the transcriptions.

moca3 - data representation

Moca3 - Online video streaming.