2006
DOI: 10.1007/11780885_7
|View full text |Cite
|
Sign up to set email alerts
|

TAGH: A Complete Morphology for German Based on Weighted Finite State Automata

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1
1

Citation Types

0
8
0
2

Year Published

2008
2008
2020
2020

Publication Types

Select...
7
2
1

Relationship

2
8

Authors

Journals

citations
Cited by 21 publications
(11 citation statements)
references
References 5 publications
0
8
0
2
Order By: Relevance
“…Wir greifen deshalb auf automatische Werkzeuge zurück. Die Bestimmung der Grundform der Wörter (Lemmatisierung) und die morphologische Zerlegung werden von der TAGH-Morphologie (Geyken & Hanneforth, 2006) (Jurish, 2003) wählt dann anhand des Kontexts die wahrscheinlichste Kategorie aus. Die Entscheidungen von moot basieren auf einem Hidden-Markov-Modell (Rabiner, 1989), das die Wahrscheinlichkeiten von drei aufeinander folgenden Wörtern (Wort-…”
Section: Datenerhebungunclassified
“…Wir greifen deshalb auf automatische Werkzeuge zurück. Die Bestimmung der Grundform der Wörter (Lemmatisierung) und die morphologische Zerlegung werden von der TAGH-Morphologie (Geyken & Hanneforth, 2006) (Jurish, 2003) wählt dann anhand des Kontexts die wahrscheinlichste Kategorie aus. Die Entscheidungen von moot basieren auf einem Hidden-Markov-Modell (Rabiner, 1989), das die Wahrscheinlichkeiten von drei aufeinander folgenden Wörtern (Wort-…”
Section: Datenerhebungunclassified
“…Most of them are based on finite state machines. Gertwol (Haapalainen and Majorin, 1995), MORPH (Hanrieder, 1996), Morphy (Lezius, 1996;Lezius et al, 1998) and later SMOR (Schmid et al, 2004) and TAGH (Geyken and Hanneforth, 2006) generate morphological analyses for complex German words, yielding results for derivatives and compounds. All these analyses are flat word splittings and often include dozens of segmentation versions.…”
Section: Related Workmentioning
confidence: 99%
“…Historical text presents numerous challenges for contemporary natural language processing techniques. In particular, the absence of consistent orthographic conventions in historical text presents difficulties for any system requiring reference to a fixed lexicon accessed by orthographic form, such as document indexing systems (Sokirko, 2003;Cafarella and Cutting, 2004), part-of-speech taggers (DeRose, 1988;Brill, 1992;Schmid, 1994), simple word stemmers (Lovins, 1968;Porter, 1980), or more sophisticated morphological analyzers (Geyken and Hanneforth, 2006;Clematide, 2008).…”
Section: Introductionmentioning
confidence: 99%