grammis 2.0
das grammatische informationssystem des instituts für deutsche sprache (ids)
                                                                                              Mitarbeiter Literatur
Korpusgrammatik Grammatik in
Fragen und Antworten
Systematische
Grammatik
Grammatische
Fachbegriffe
Grammatisches
Wörterbuch
Grammatische
Bibliografie
                                                                             
                                   
Datenbasis für Untersuchungen zur grammatischen Variabilität im Standarddeutschen Statistische Methoden der Korpusgrammatik Verlässlichkeit grammatischer Annotationen Vorhersage von Fugenelementen in nominalen Komposita Variation der starken Genitivmarkierung AcI-Konstruktionen und Wie-Komplementsätze Ressource: GenitivDB

[Impressum] [Datenschutzerklärung]

                                                                           
Schlagwörter: Tagger Wort

Die Wortformen meine/Meine

Laut GDS

Auf der Basis der Grammatik der deutschen Sprache (GDS) kann man den Wortformen meine/Meine die folgenden Kategorien zuordnen und bei einer syntaktischen Analyse beliebiger deutscher Sätze auch ohne größere Schwierigkeiten erkennen, welche davon jeweils zutrifft:

  • Verb 1. Person Singular Indikativ Präsens
  • Verb: 1. Person Singular Konjunktiv Präsens
  • Verb: 3. Person Singular Konjunktiv Präsens
  • Verb: Imperativ Singular
  • Possessivartikel: 1. Person Singular Femininum Nominativ
  • Possessivartikel: 1. Person Singular Femininum Akkusativ
  • Possessivartikel: 1. Person Plural Mask./Fem./Neutr. Nominativ
  • Possessivartikel: 1. Person Plural Mask./Fem./Neutr. Akkusativ
  • Maskulines Nomenkonvertat
  • Feminines Nomenkonverta
  • Neutrales Nomenkonvertat
  • Eigenname

Laut TreeTagger

Der TreeTagger differenziert anders als GDS und, wie sich gleich zeigen wird, als Connexor:

<Meine/NE> (Eigenname)
<Meine/PPOSAT> (attribuierendes Possessivpronomen)
<Meine/NE> (Eigenname)
<Meine/PPOSS> (substituierendes Possessivpronomen)
<Meine/VVFIN> (finites Vollverb)
<meine/PPOSAT> (attribuierendes Possessivpronomen)
<meine/PPOSS> (substituierendes Possessivpronomen)
<meine/VVFIN> (finites Vollverb)

Eine Testsuche mit Hilfe des Recherchesystems COSMAS II ergab:

  • Unter 285.150 Fundstellen für die Wortformen Meine/meine wurden 2.172 korrekt als Verb erkannt, doch immerhin 420 false positives.
  • Als Nomen wird die Wortform Meine 87-mal gefunden. Darunter finden sich neun false positives. Hier einige Beispiele:

Meine drei Kinder sind aus dem Alter raus, in dem sie nach Ostereiern suchen.
[Berliner Ztg., 30.03.2002 [S. 23]]

Meine Wirbelsäule schmerzt, nach dreihundert Metern Gehstrecke habe ich zudem starke Schmerzen in beiden Beinen.
[Berliner Ztg., 10.02.2005 [S. 27]]

Meine Reisetasche ist schon gepackt.
[Berliner Ztg., 23.06.2005 [S. 22]]

  • 78-mal wurde der Stadtname Meine gefunden, jedoch keineswegs als Eigenname, obwohl diese Kategorie grundsätzlich vorgesehen ist. Als Eigenname wurde die Wortform nie gefunden, was einigermaßen überrascht, da allein schon der Name des Leadsängers der Musikgruppe Scorpions – Klaus Meine – 250 mal vertreten ist, womit zugleich mindestens 250 false negatives zu verzeichnen sind.
  • Die Auszeichnung von 48098 Wortformen als attribuierende Possessivpronomina ist weitestgehend korrekt, doch ist hier mit zahlreichen false negatives zu rechnen. So fanden sich bei einer Suche mittels COSMAS unter 2.172 Fundstellen für meine als finite Verbform 114 „Treffer“, bei denen es sich tatsächlich um Possessivpronomina handelte.
  • Eine Suche nach Meine/meine nicht als Verbform fanden sich in einer Auswahl von 50.000 Treffern mindestens 1910 Wortformen, die als Verbformen hätten erkannt werden müssen. Das sind zwar gerade mal knapp 4 % false positives, doch zugleich extrem viele false negatives an Verbformen, wenn man bedenkt, dass nur 1.752 Wortformen korrekt als Verbformen erkannt wurden, denen – hochgerechnet – 11.319 nicht erkannte gegenüber stehen.

Das heißt: Selbst wenn die Suche nahezu nur korrekte Ergebnisse liefert, kann nicht in jeder Hinsicht davon ausgegangen werden, dass sie erfolgreich war.

Einfluss eines Trainingskorpus (Abschnitt ein-/ausblenden)

Generell ist anzumerken, dass die Ergebnisse von Annotationen mit TreeTagger davon abhängen, welches Trainingskorpus zugrunde gelegt wurde. Bei den im Folgenden vorgenommenen Recherchen zu Präpositionen kann die Wahl eines geeigneten oder eher ungeeigneten Trainingskorpus entscheidenden Einfluss auf die Qualität der Ergebnisse gehabt haben. Bei so häufig verwendeten Wortformen wie Meine und meine sollte dies jedoch kaum eine Rolle spielen.

Laut Connexor Machinese Language Model

Das Connexor Machinese Language Model unterscheidet bei den Wortformen Meine/meine diese Kategorien:

<N > (Noun)
<PRON> (Pronoun)
<V IMP> (Verb, Imperative)
<V IND PRES> (Verb, Indicative Present)
<V SUB PRES> (Verb, Subjunctive Present)

Die vorgenommenen Unterscheidungen sind zwar in mancher Hinsicht etwas weniger differenziert als diejenigen der GDS, in anderer Hinsicht sogar weitergehend. Generell kann festgehalten werden, dass die Klassifikation auch für traditionell ausgerichtete Grammatiker grundsätzlich brauchbar sein sollte. Alles hängt jetzt davon ab, wie zutreffend die Annotation im Praxistest ausfällt. Hier einige Ergebnisse:

  • Unter insgesamt 22.874 Fundstellen für meine/Meine als Verbform waren 10.644 fälschlich als solche ausgezeichnet. Man spricht in diesem Fall von false positives.
  • Unter 67 Fundstellen für meine/Meine als Nomen waren 11 falsch ausgezeichnet.
  • Unter 30.000 Fundstellen für meine als Pronomen erwiesen sich zwar nur etwa drei Prozent als Fehleinschätzung, doch in die Bewertung muss auch eingehen, dass sich schon allein unter den 10.644 fälschlich als Verbform ausgezeichneten Fundstellen 7.804 Fundstellen befanden, bei denen meine als Pronomen hätte erkannt werden müssen. In diesem Fall spricht man von false negatives.

Insgesamt erwies sich Connexor bei diesen Tests als ebenso wenig leistungsfähig wie TreeTagger.

© IDS Mannheim. Zuletzt geändert am 05.05.2017 12:00.