• Schreiben Sie uns!
  • Seite empfehlen
  • Druckansicht

Die Annotation der Modalpartikeln im GeWiss-Korpus
Eine syntaktische und semantisch-pragmatische Analyse der PTKMA-Annotation

Der vorliegende Aufsatz befasst sich mit der automatischen Annotation von acht deutschen Modalpartikeln in zwei Teilkorpora des GeWiss-Korpus, die aus den Prüfungsgesprächen im deutschen akademischen Kontext bei den L1- und L2-Prüflingen stammen. Aufgrund der geringen Zuverlässigkeit der automatischen Verfahren zum POS-Tagging in Bezug auf gesprochene Sprachdaten werden die Modalpartikeln ja, eben, halt, einfach, aber, mal, doch und denn mittels Kriterienlisten manuell auf ihre Korrektheit geprüft. Ferner werden auch die sprachlichen Einheiten ja, eben, halt, einfach, aber, mal, doch und denn, die nicht mit einer Modalpartikel-Annotation versehen, sondern mit einem anderen POS-Tag automatisch annotiert sind, auf fehlerhafte Annotationen und MP-Eigenschaften hin untersucht und entsprechende Verwendungen von diesen als Modalpartikel annotiert. Die Ergebnisse zeigen, dass das POS-Tagging-System bei den automatischen Annotationen der obigen Modalpartikeln eine sehr hohe Fehlerquote von 19,2% aufweist und dass es die Partikeln mit einer stark variierenden Zuverlässigkeit annotiert, die sich von 100% falsch bis hin zu 100% richtig spannt. Das Prüfen der Nicht-PTKMA (Modal- und Abtönungspartikel) Types ja, eben, halt, einfach, aber, mal, doch und denn auf MP-Eigenschaften zeigt, dass mehrere Token diese Eigenschaft aufwiesen.

This article examines the automatic annotation of eight German modal particles in two sub-corpora of the GeWiss Corpus, which originate from the oral examinations of L1 and L2 examinees in a German academic context. Because of the poor reliability of automatic methods for POS tagging of spoken language data, the modal particles were checked manually for correctness using lists of criteria. In addition, the linguistic units ja, eben, halt, einfach, aber, mal, doch and denn which did not have a modal particle annotation, but had been automatically annotated with a different POS tag, were also checked for incorrect annotations, their modal particle properties were examined and the uses of these as modal particles were annotated. The results show that the POS tagging system has a very high error rate of 19,2% in the automatic annotations of the above-mentioned modal particles, and that it annotates the particles with widely varying reliability, ranging from 100% incorrect to 100% correct. Checking the non-PTKMA (modal and modulating particles) types ja, eben, halt, einfach, aber, mal, doch and denn for MP properties shows that several tokens exhibited this property.

DOI: https://doi.org/10.37307/j.1868-775X.2022.02.03
Lizenz: ESV-Lizenz
ISSN: 1868-775X
Ausgabe / Jahr: 2 / 2022
Veröffentlicht: 2022-06-09
Dokument Die Annotation der Modalpartikeln im GeWiss-Korpus