grammis 2.0
das grammatische informationssystem des instituts für deutsche sprache (ids)
                                                                                              Mitarbeiter Literatur
Korpusgrammatik Grammatik in
Fragen und Antworten
Systematische
Grammatik
Grammatische
Fachbegriffe
Grammatisches
Wörterbuch
Grammatische
Bibliografie
                                                                             
                                   
Datenbasis für Untersuchungen zur grammatischen Variabilität im Standarddeutschen Statistische Methoden der Korpusgrammatik Verlässlichkeit grammatischer Annotationen Vorhersage von Fugenelementen in nominalen Komposita Variation der starken Genitivmarkierung AcI-Konstruktionen und Wie-Komplementsätze Ressource: GenitivDB

[Impressum] [Datenschutzerklärung]

                                                                           
Schlagwörter: Domäne Korpus Ländername Medium Region Register Text Varianz

Metadaten als Variabilitätsfaktoren

Im DeReKo stehen zu den einzelnen Texten folgende relevante Metadaten zur Verfügung, wobei nicht alle zu jedem Text vorliegen:

  • Textsorte/Genre, Ressort, Topic, Land, Titel, Autorenname, Texttyp, Datum, Publikationsort.

Ausgehend von diesen Metadaten und auch anhand weiterführender Recherchen zu einzelnen Texten konnten folgende Zusatzinformationen nachgeführt werden:

  • Medium, Register, Domäne, Region, Geburts- bzw. Heimatort des Autors, Entstehungszeit (Einzelheiten in Textspezifische Metadaten).

Alle diese Daten machen es möglich, das Gesamtkorpus in verschiedenartige Textgruppen aufzuteilen, was bei Recherchen spontan immer wieder genutzt werden kann und soll. Einige Daten werden bereits von vornherein als Ausprägungen mutmaßlicher Variabilitätsfaktoren behandelt und zur Unterteilung des Gesamtkorpus in Teilkorpora benutzt. Die Unterteilungen richten sich nach:

Dies sind durchgehend Kriterien, die bereits in zahlreichen anderen Projekten als Variabilitätsfaktoren behandelt und für die Bildung von Teilkorpora genutzt wurden. Ein weiterer Variabilitätsfaktor, der in diesem Vorhaben regelmäßig überprüft wird, ist die (Entstehungs-)Zeit, die aber als Kontinuum nicht für die Bildung von starren Teilkorpora benutzt wird, sondern flexibler gehandhabt werden soll. Mit allen diesen Kriterien sind drei Dimensionen abgedeckt, die in der Forschung immer wieder als für die sprachliche Variation relevant behandelt werden: Zeit, Raum und Situation (dazu ‚Medium‘ und ‚Register‘). Nicht direkt repräsentiert ist dagegen die diastratische Dimension. Die Standardsprache an sich kann auch als bereits eingeschränkt bezüglich dieser Dimension gesehen werden, wenn man Auffassungen folgt, die sie als typisch für Gebildete bzw. für die Mittel- und Oberschicht betrachten (dazu Was sind standarddeutsche Texte?).

Wie die Unterteilung in Teilkorpora genau aussieht, wird in den folgenden Abschnitten in Tabellen gezeigt und diskutiert.

© IDS Mannheim. Zuletzt geändert am 06.05.2016 15:31.