grammis 2.0
das grammatische informationssystem des instituts für deutsche sprache (ids)
                                                                                              Mitarbeiter Literatur
Korpusgrammatik Grammatik in
Fragen und Antworten
Systematische
Grammatik
Grammatische
Fachbegriffe
Grammatisches
Wörterbuch
Grammatische
Bibliografie
                                                                             
                                   
Datenbasis für Untersuchungen zur grammatischen Variabilität im Standarddeutschen Statistische Methoden der Korpusgrammatik Verlässlichkeit grammatischer Annotationen Vorhersage von Fugenelementen in nominalen Komposita Variation der starken Genitivmarkierung AcI-Konstruktionen und Wie-Komplementsätze Ressource: GenitivDB

[Impressum] [Datenschutzerklärung]

                                                                           
Schlagwörter: Chi-Quadrat Kontingenztabelle Teilkorpus

Verfahren Fragestellung 2 (Verhältnis zwischen X und Y)

Um zwei Phänomene gegenüberzustellen, werden leicht modifzierte Kontingenztabellen erstellt (Tabellen 4 und 5).

Teilkorpus X Y Total
Publikumspresse 100 200 300
Bücher 100 100 200
Internet/Wikipedia 100 100 200
Gesprochenes 700 100 800
Sonstige Printmedien 200 100 300
Total 1200 600 1800

Tabelle 4: Beobachtete Werte für die Phänomene X und Y in den Teilkorpora

Teilkorpus X Y Total
Publikumspresse 200 100 300
Bücher 133,33 66,67 200
Internet/Wikipedia 133,33 66,67 200
Gesprochenes 533,33 266,67 800
Sonstige Printmedien 200 100 300
Total 1200 600 1800

Tabelle 5: Erwartete Werte für die Phänomene X und Y in den Teilkorpora

Auch hier gibt der Chi-Quadrat-Test nur darüber Auskunft, ob die Verteilung der Treffer für X und Y in Relation zu den jeweiligen Treffersummen von X und Y gleichmäßig verteilt sind. Bei den Messwerten in Tabelle 4 ergibt der Chi-Quadrat-Test eine hoch signifikante Abweichung von einer gleichmäßigen Verteilung (p < 2,2e-16, X2 = 356, df = 4). Ist die Verteilung grundsätzlich ungleichmäßig, kann wieder mit paarweisen Vergleichen (X und Y in Publikumspresse und Bücher, Publikumspresse und Internet/Wikipedia etc.) ermittelt werden, in welchem Teilkorpus der Frequenzunterschied signifikant ist.

Publikumspresse Bücher Internet/Wikipedia Gesprochenes
Bücher 0,0028 - - -
Internet/Wikipedia 0,0028 1,0000 - -
Gesprochenes <2E-16 <2E-16 <2E-16 -
Sonstige Printmedien 6,30E-15 0,0028 0,0028 3,00E-14

Tabelle 6: Paarweiser Vergleich, Werte für p (mit Bonferroni-Korrektur)

Die Ergebnisse des paarweisen Vergleichs in Tabelle 6 zeigen, dass die Verteilung von X und Y im Gesprochenen-Korpus sich zu jedem anderen Teilkorpus hoch signifikant unterscheidet. Auch die Verteilungen von X und Y im Bücher-Korpus und dem Korpus der sonstigen Printmedien unterscheiden sich sehr stark. Andererseits ergibt sich zwischen den Korpora Bücher und Internet/Wikipedia überhaupt keinen Unterschied (p = 1). Die anderen Vergleiche weisen mit p = 0,0028 ebenfalls (wenn auch nicht hoch) signifikante Unterschiede auf.

© IDS Mannheim. Zuletzt geändert am 18.01.2012 15:26.