grammis 2.0
das grammatische informationssystem des instituts für deutsche sprache (ids)
                                                                                              Mitarbeiter Literatur
Korpusgrammatik Grammatik in
Fragen und Antworten
Systematische
Grammatik
Grammatische
Fachbegriffe
Grammatisches
Wörterbuch
Grammatische
Bibliografie
                                                                             
                                   
Datenbasis für Untersuchungen zur grammatischen Variabilität im Standarddeutschen Statistische Methoden der Korpusgrammatik Verlässlichkeit grammatischer Annotationen Vorhersage von Fugenelementen in nominalen Komposita Variation der starken Genitivmarkierung AcI-Konstruktionen und Wie-Komplementsätze Ressource: GenitivDB

[Impressum] [Datenschutzerklärung]

                                                                           
Schlagwörter: Frequenz Statistik Teilkorpus

Ausblick statistische Analyse

Ein „statistischer Schnelltest“ birgt die Gefahr, uninformiert nicht die adäquaten Testverfahren auf die Daten anzuwenden. Zudem können nur eine Reihe von Standardbedingungen berücksichtigt werden: Die skizzierten Verfahren sind dafür gemacht, die Verteilung eines Phänomens in den definierten Teilkorpora zu untersuchen und ein Phänomen mit einem oder mehreren weiteren Phänomenen zu vergleichen. Sollen andere Teilkorpora oder mehrere Phänomene miteinander verglichen werden, müssen über diesen Standardtest hinausgehende erweiterte statistische Verfahren angewandt und/oder die Korpusdaten müssen speziell dafür aufbereitet werden.

Es ist deshalb klar, dass der Rechercheprozess fortwährend statistisch begleitet werden muss. Das ermöglicht es auch, die statistischen Verfahren anzupassen, wenn sich erweisen sollte, dass sie den Bedürfnissen nicht genügen.

Ein weiterer Ausbau ist im Zuge unserer Pilotstudien insbesondere bezüglich der Integration in den Abfrageprototypen Kogra-DB und dessen potenziellen Nachfolger geplant: Bisher können nur die Frequenzvergleiche direkt aus der Abfrageumgebung heraus aufgerufen werden. Die Berechnungen zur Gleichmäßigkeit der Verteilung (DPnorm) bedingen als Eingabedaten nicht nur Kontingenztabellen, sondern darüberhinaus auch Trefferlisten, aufgegliedert nach kleineren Einheiten (Dokumente, Texte etc.). Sobald eine derart erweiterte Parameterübergabe realisiert ist, können die beiden Testgruppen besser verzahnt werden: So wird es möglich, dass die Berechnung von DPnorm automatisch separat pro Teilkorpus erfolgt und in Kombination mit den Signifikanztests zu den Frequenzunterschieden noch aussagekräftigere Analysen möglich sind.

© IDS Mannheim. Zuletzt geändert am 05.03.2015 15:15.