A B S T R A C TThis study explores ab initio development of syntactic complexity in a longitudinal corpus of learner German writing from a Dynamic Usage-Based perspective. It contributes to the research on L2 writing complexity by focusing on beginning learners of an L2 other than English (German) and on fine-grained measures of syntactic complexity, operationally defined here as syntactic modification.The results show that not only ubiquitous global measures of syntactic complexity but also more specific measures, namely frequencies of syntactic modifiers, can serve as developmental indices at beginning L2 proficiency levels. The learners in this study modified their writing from the very onset of language study and the overall size and range of the modification system did not significantly change over four semesters. However, its composition changed continuously and reflected non-linear waxing and waning of different modifier categories. The study confirmed some results from previous crosssectional research showing that interlanguage development is characterized by a decrease in cognitively easier (e.g., uninflected) categories and an increase in cognitively more difficult (e.g., inflected and clausal) categories. The high variability that was found along with uniform group trends demonstrates the necessity of simultaneous investigations of linguistic development in groups and individuals.
The present study analyzes morphological productivity for complex verbs in second language acquisition by analyzing a corpus of German as a Foreign Language (GFL). It shows that advanced learners of GFL use prefix and particle verbs relatively frequently and productively but less so than native speakers do and discusses these findings in the light of different linguistic models and acquisition theories. It argues that corpus data must be evaluated against good models and that it is necessary to make the categorization decisions available as annotations.
Die Sprache von Lerner/-innen einer Fremdsprache unterscheidet sich auf allen linguistischen Ebenen von der Sprache von Muttersprachler/-innen. Seit einigen Jahrzehnten werden Lernerkorpora gebaut, um Lernersprache quantitativ und qualitativ zu analysieren. Hier argumentieren wir anhand von drei Fallbeispielen (zu Modifikation, Koselektion und rhetorischen Strukturen) für eine linguistisch informierte, tiefe Phänomenmodellierung und Annotation sowie für eine auf das jeweilige Phänomen passende formale und quantitative Modellierung. Dabei diskutieren wir die Abwägung von tiefer, mehrschichtiger Analyse einerseits und notwendigen Datenmengen für bestimmte quantitative Verfahren andererseits und zeigen, dass mittelgroße Korpora (wie die meisten Lernerkorpora) interessante Erkenntnisse ermöglichen, die große, flacher annotierte Korpora so nicht erlauben würden.
Fragestellung und HintergrundWenn wir uns die folgenden Beispiele, geschrieben von fortgeschrittenen Lernenden des Deutschen als Fremdsprache (aus den Korpora Falko und Kobalt-DaF, siehe Abschn. 1.3) anschauen, sehen wir zunächst oberflächennahe Fehler und Merkwürdigkeiten.1 Dazu zählen beispielsweise orthografische Abweichungen (wie ausgeshen in (1a) oder aüßern in (1c)), Kasus-oder Argumentstrukturprobleme (wie kann ich die Frauenbewegung für vieles dankbar sein in (1a)), Flexionsprobleme (wie müssten in 1b) oder phraseologische Probleme (wie Haushalt einhalten in (1b)).1 Das große und interessante Thema ‚Fehler' können wir hier nicht ausführlich besprechen. Wir verwenden den Begriff ‚Fehler' hier so, wie er in der Lernerkorpusdiskussion oft gebraucht wird. In anderen Artikeln haben wir uns ausführlich mit den theoretischen Hintergründen und der Modellierung von Abweichungen, Fehlern, Errors und Mistakes beschäftigt (für einen Überblick siehe Lüdeling/Hirschmann 2015).
In this paper we introduce a corpus based variationist approach to the study of language change, which hinges on the definition and explicit coding of variables and variants, or competing 'ways of saying the same thing', within their usage in corpus data. We use multiple extensible annotation levels to examine variants in the development of relative clauses from Old High German to Modern German, using four comparable deeply annotated corpora of different German language stages. We compare the frequencies of different grammatical categories such as word forms, parts of speech and syntactic constructions to diagnose the most significant changes that are evident in our corpus, and show the advantages of dynamically reexamining quantitative results and categorization systems. Finally we discuss in how far our approach can support theories on language change and lead to insights which enrich previous theoretical accounts.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.