grammis 2.0
das grammatische informationssystem des instituts für deutsche sprache (ids)
                                                                                              Mitarbeiter Literatur
Korpusgrammatik Grammatik in
Fragen und Antworten
Systematische
Grammatik
Grammatische
Fachbegriffe
Grammatisches
Wörterbuch
Grammatische
Bibliografie
                                                                             
                                   
Datenbasis für Untersuchungen zur grammatischen Variabilität im Standarddeutschen Statistische Methoden der Korpusgrammatik Verlässlichkeit grammatischer Annotationen Vorhersage von Fugenelementen in nominalen Komposita Variation der starken Genitivmarkierung AcI-Konstruktionen und Wie-Komplementsätze Ressource: GenitivDB

[Impressum] [Datenschutzerklärung]

                                                                           
Schlagwörter: Präposition Tagger

Fazit der Tagger-Evaluation

Wer erwartet, dass ihm die hier betrachteten Tagger bei der Evaluation von Aussagen zur deutschen Grammatik und zu Variationsphänomenen mit niedriger Frequenz von großer Hilfe sein könnten, wird sich enttäuscht sehen. Man mag zwar vermuten, dass die oft geringe Zahl an false positives brauchbare Untersuchungen zur Variation – etwa der Rektion einzelner Präpositionen – zulässt, doch bevor man davon ausgeht, sollte man zumindest prüfen, ob nicht bestimmte Varianten bevorzugt unter den false negatives zu finden sind.

Präpositionenerkennung mit TreeTagger und Connexor - Vergleich

Wer gar die Entdeckung bislang verkannter Strukturen durch Recherchen in getaggten Textkorpora für möglich hielt, wird erkennen, dass sich zwar Strukturen finden, die in „intelligenten“ Grammatiken nicht beschrieben werden, dass es sich dabei jedoch weit bis weitest gehend um Erscheinungen handelt, die fehlerhaften Annotationen geschuldet sind, was sie ohne intensive Überprüfung unbrauchbar macht.

Intensive Überprüfung könnte jedoch das Schlüsselwort für eine dennoch sinnvolle Nutzung getaggter Korpora sein, denn die echten und die vermeintlichen Fehler der Tagger sind keinesfalls reine Zufallsprodukte, sondern haben System. Sie gründen zum einen in einer unzureichenden Auswertung der Kontexte, in denen die zu taggenden Wortformen stehen, zum anderen aber auch in prinzipiellen Schwierigkeiten bei der Bestimmung von Wortklassen, Schwierigkeiten, wie sie sich bei allen Grammatiken zeigen. Typische Beispiele hierfür sind etwa die Unterscheidung von

adverbialem und prädikativem Adjektiv:

Der Schnitt war tief. – Der Schnitt ging tief.

Adverb und Fokuspartikel:

Das kränkte mich sehr. – Das kränkte mich schon.

prädikativem Adjektiv und Präposition:

Ich war damals noch ledig. – Ich war endlich aller Sorgen ledig.

Eine genauere Betrachtung von Erscheinungen, bei denen Tagger zu anderen Entscheidungen kommen als von Theoretikern erwartet, ist nicht allein für Korpuslinguisten von Interesse, sie kann auch für eher traditionalistisch eingestellte Grammatiker als heuristische Methode von Nutzen sein, wenn sie ihre Analysen ernstlich empirisch überprüfen wollen.

© IDS Mannheim. Zuletzt geändert am 05.05.2017 16:56.