Im Kontext der Projekte zur Erstellung historischer Sprachkorpora "Referenzkorpus Altdeutsch" und "Referenzkorpus Mittelhochdeutsch" entstand ein Tagset für die Wortartanalyse, HiTS ("Historisches Tagset"). Im Projekt "Referenzkorpus Frühneuhochdeutsch" wird eine vereinfachte Version davon angewendet, da v.a. die späteren Zeiträume schon nahe am neuhochdeutschen (nhd.) Stand sind. 2 HiTS orientiert sich am "Stuttgart-Tübingen Tagset" (STTS, Schiller et al., 1999), dem Standardtagset für nhd. Korpora, und übernimmt -neben einer ganzen Reihe von Tags -auch das hierarchische Design der Tagnamen. Ursprünglich sollte das Tagset komplett auf STTS aufbauen und dieses lediglich um einige neue Tags erweitern. Es stellte sich jedoch heraus, dass neben einigen notwendigen feineren Unterscheidungen (z.B. bei den Pronominaladverbien) auch die Tagnamen des STTS nicht immer geeignet schienen. Z.B. sind in HiTS der definite und indefinite Artikel eine Unterklasse der Determinativa -die Sonderstellung des Artikels, die im STTS durch ein eigenes Tag 'ART' betont wird, ist eine neuere Entwicklung.Das Tagset dient zur Annotation diachroner Daten. Einige wenige Tags finden dabei nur in den alt(hoch)deutschen Daten Anwendung. Um diachrone Untersuchungen bis in die jetzige Zeit zu ermöglichen, werden im vorliegenden Artikel den HiTS-Tags die jeweils entsprechenden STTS-Tags gegenübergestellt. Allerdings ist nicht in jedem Fall eine eindeutige Abbildung möglich. So wird z.B. in HiTS zwischen attributivisch und substantivisch verwendeten Zahlen unterschieden, nicht aber im STTS. Umgekehrt unterscheidet HiTS nicht zwischen elliptischen ("kopflosen") Nominalphrasen und substantivierten Adjektiven (s. Abschnitt 5), was das STTS aber tut. 1 Die vorliegende Arbeit wurde finanziell unterstützt durch die Deutsche Forschungsgemeinschaft (DFG), DO 544/5-1/2 (Projektgruppe Altdeutsch), und KL 472/3-3/5, WE 1318/14-1/2, WE 1318/16-1, DI 1558/1-1/2 (Projektgruppe Mittelhochdeutsch). Außerdem möchten wir den anonymen Reviewern für ihre hilfreichen Kommentare danken. 2 Das Referenzkorpus Altdeutsch (http://www.deutschdiachrondigital.de) deckt den Zeitraum 750-1050 ab, das Referenzkorpus Mittelhochdeutsch (http://referenzkorpus-mhd.uni-bonn.de, http: //www.rub.de/wegera/rem) den Zeitraum 1050-1350 und das Referenzkorpus Frühneuhochdeutsch (http://www.rub.de/wegera/ref) den Zeitraum 1350-1650. Das Referenzkorpus Altdeutsch erfasst dabei die gesamte althochdeutsche und altniederdeutsche Textüberlieferung mit 650 000 Belegen. Die Referenzkorpora Mittel-und Frühneuhochdeutsch enthalten jeweils eine strukturierte Auswahl der Textüberlieferung mit etwa 2,1 Mio (mittelhochdeutsch) bzw. 4,4 Mio (frühneuhochdeutsch) annotierten Wortformen. Alle Korpora sind bzw. werden annotiert mit Metainformation sowie Information zum Lemma, zur Morphologie und zur Wortart.