Im Kontext der Projekte zur Erstellung historischer Sprachkorpora "Referenzkorpus Altdeutsch" und "Referenzkorpus Mittelhochdeutsch" entstand ein Tagset für die Wortartanalyse, HiTS ("Historisches Tagset"). Im Projekt "Referenzkorpus Frühneuhochdeutsch" wird eine vereinfachte Version davon angewendet, da v.a. die späteren Zeiträume schon nahe am neuhochdeutschen (nhd.) Stand sind. 2 HiTS orientiert sich am "Stuttgart-Tübingen Tagset" (STTS, Schiller et al., 1999), dem Standardtagset für nhd. Korpora, und übernimmt -neben einer ganzen Reihe von Tags -auch das hierarchische Design der Tagnamen. Ursprünglich sollte das Tagset komplett auf STTS aufbauen und dieses lediglich um einige neue Tags erweitern. Es stellte sich jedoch heraus, dass neben einigen notwendigen feineren Unterscheidungen (z.B. bei den Pronominaladverbien) auch die Tagnamen des STTS nicht immer geeignet schienen. Z.B. sind in HiTS der definite und indefinite Artikel eine Unterklasse der Determinativa -die Sonderstellung des Artikels, die im STTS durch ein eigenes Tag 'ART' betont wird, ist eine neuere Entwicklung.Das Tagset dient zur Annotation diachroner Daten. Einige wenige Tags finden dabei nur in den alt(hoch)deutschen Daten Anwendung. Um diachrone Untersuchungen bis in die jetzige Zeit zu ermöglichen, werden im vorliegenden Artikel den HiTS-Tags die jeweils entsprechenden STTS-Tags gegenübergestellt. Allerdings ist nicht in jedem Fall eine eindeutige Abbildung möglich. So wird z.B. in HiTS zwischen attributivisch und substantivisch verwendeten Zahlen unterschieden, nicht aber im STTS. Umgekehrt unterscheidet HiTS nicht zwischen elliptischen ("kopflosen") Nominalphrasen und substantivierten Adjektiven (s. Abschnitt 5), was das STTS aber tut. 1 Die vorliegende Arbeit wurde finanziell unterstützt durch die Deutsche Forschungsgemeinschaft (DFG), DO 544/5-1/2 (Projektgruppe Altdeutsch), und KL 472/3-3/5, WE 1318/14-1/2, WE 1318/16-1, DI 1558/1-1/2 (Projektgruppe Mittelhochdeutsch). Außerdem möchten wir den anonymen Reviewern für ihre hilfreichen Kommentare danken. 2 Das Referenzkorpus Altdeutsch (http://www.deutschdiachrondigital.de) deckt den Zeitraum 750-1050 ab, das Referenzkorpus Mittelhochdeutsch (http://referenzkorpus-mhd.uni-bonn.de, http: //www.rub.de/wegera/rem) den Zeitraum 1050-1350 und das Referenzkorpus Frühneuhochdeutsch (http://www.rub.de/wegera/ref) den Zeitraum 1350-1650. Das Referenzkorpus Altdeutsch erfasst dabei die gesamte althochdeutsche und altniederdeutsche Textüberlieferung mit 650 000 Belegen. Die Referenzkorpora Mittel-und Frühneuhochdeutsch enthalten jeweils eine strukturierte Auswahl der Textüberlieferung mit etwa 2,1 Mio (mittelhochdeutsch) bzw. 4,4 Mio (frühneuhochdeutsch) annotierten Wortformen. Alle Korpora sind bzw. werden annotiert mit Metainformation sowie Information zum Lemma, zur Morphologie und zur Wortart.
Using as a starting point the finding that in linguistics Verfügbarkeit and Unverfügbarkeit have not yet been recognised as categories, the authors point out that strategies have, nevertheless, been investigated in a highly intensive way: these are aimed at the activiation of a certain knowledge in the recepient – thereby making this knowledge verfügbar (or not, as the case may be). In this process an important role is played by agents, which in linguistics are called ‘discourse referents’: the authors follow up the communicative potential of these discourse referents from a language historical-systematic perspective.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.