Corpora and historical linguistics

Kytö, Merja

doi:10.1590/s1984-63982011000200007

Cited by 15 publications

(3 citation statements)

References 17 publications

(10 reference statements)

Supporting

Mentioning

Contrasting

Unclassified

Order By: Relevance

“…La compilación de estos últimos está condicionada por ciertas limitaciones bien conocidas, que suelen ser más acusadas a medida que retrocedemos en el tiempo: conservación fragmentaria de textos, dificultad de datación, falta de contextualización, distribución errática de géneros, etc. (Kohnen, 2007;Claridge, 2008;Kytö, 2011).…”

Section: Cuestiones Previasunclassified

Escritura epistolar, edición digital y anotación de corpus

Vaamonde¹

2023

cilengua

View full text Add to dashboard Cite

En este trabajo presentamos el proyecto de investigaciónPost Scriptum, que tiene por objeto la búsqueda, edición y estudio históricolingüísticode cartas privadas escritas en España y Portugal durante la EdadModerna. Post Scriptum reúne una amplia colección epistolar y la ofrece endos formatos preparados para la búsqueda: el de la edición crítica digital yel del corpus lingüísticamente anotado. En esta presentación se exponenlos aspectos fundamentales sobre el diseño y elaboración de Post Scriptum,desde la búsqueda de los manuscritos en archivos históricos hasta la edicióndigital y anotación semiautomática de los textos y su publicación enlínea; también se recogen resultados definitivos y se aportan algunos ejemplosde explotación del corpus en diferentes niveles de análisis.In this paper we present the project Post Scriptum, whichaims to build up a campaign of collection, edition and historical-linguisticstudy of private letters written in Portugal and Spain along the Early ModernAges. Not only does the Post Scriptum project present a wide collectionof private letters, but it also makes it available as a scholarly digital editionand as an annotated corpus. Key aspects about the development of PostScriptum are explained in this paper, from the finding of manuscripts in

show abstract

Section: Cuestiones Previasunclassified

Escritura epistolar, edición digital y anotación de corpus

Vaamonde¹

2023

cilengua

View full text Add to dashboard Cite

show abstract

“…La reticencia a utilizar XML-TEI en la compilación de corpus históricos no se da solo en el caso del español, donde solo uno de los seis corpus analizados emplea este estándar de etiquetado, sino que parece ser una constante general observable en otras lenguas (Marttila, 2014). Sin embargo, la capacidad de encontrar información en un corpus depende muy estrechamente de cómo haya sido anotado (Kytö, 2011). Y en este aspecto, XML-TEI se revela como la mejor estrategia de partida, además de la más estandarizada.…”

Section: Ventajas De Xml-tei: Su Aplicación En Oralia Diacróni-ca Delunclassified

Los Corpus Del Español Clásico Y Moderno: Entre La Filología Y La Lingüística Computacional

Campos

2019

RLA

View full text Add to dashboard Cite

RESUMENEn este artículo se analiza la práctica habitual de elaboración de corpus del español, tanto europeo como americano, del periodo comprendido entre finales del siglo XV y finales del XIX. Se prestará especial atención al modelo seguido por seis corpus diacrónicos: CHARTA, CODEA 2015, CORDIAM, CorLexIn, Post Scriptum y Cíbola, con el objeto de extraer conclusiones metodológicas aplicables a trabajos futuros o iniciales, como el corpus Oralia diacrónica del español (ODE), actualmente en fase de elaboración en la Universidad de Granada. El análisis efectuado revela que, si bien no se aprecian grandes diferencias en el rigor y los criterios de transcripción documental, no parece haber acuerdo en lo referente a la manera de procesar y estructurar la información, tanto textual como metatextual. En este trabajo se defiende la conveniencia de adoptar un modelo estandarizado basado en el uso de XML, siguiendo las directrices del consorcio TEI para la codificación y etiquetado de corpus históricos. Este modelo permitirá la integración de diferentes corpus y, sobre todo, un más fácil acceso a la información por parte de los usuarios.Palabras clave: Historia de la lengua española, corpus diacrónicos, lingüística de corpus, XML, oralidad en los textos escritos. ABSTRACTThis article analyses the standard practice when compiling and producing European and American Spanish corpora for the period spanning from the end of the 15th century to the late 19th century. Special attention will be given to the model used for six diachronic 1 Este estudio se ha llevado a cabo dentro del proyecto "Hispanae Testium Depositiones: las declaraciones de testigo en la historia del español. HISPATESD", de referencia FFI2017-83400-P (MINECO/AEI/FEDER, UE).

show abstract

“…A lingüística histórica non foi allea a esta revolución tecnolóxica, como acredita o crecente interese no desenvolvemento de corpus históricos en diferentes linguas e xéneros (Claridge 2008, Xiao 2008 e como confirma o estado actual da investigación diacrónica baseada en corpus electrónicos (Kytö 2011). Non obstante, na creación de recursos dixitais que sexan útiles para a investigación histórica das linguas cómpre afrontar alomenos dous tipos de problemas que non precisan atención cando se traballa con datos contemporáneos.…”

Section: Introduciónunclassified

Da edición dixital á análise lingüística. A creación de corpus históricos na plataforma TEITOK

Janssen¹,

Vaamonde²

2020

Calen Barbas, Falen Cartas. A Escrita en Galego Na Idade Moderna

View full text Add to dashboard Cite

Corpora and historical linguistics

Cited by 15 publications

References 17 publications

Escritura epistolar, edición digital y anotación de corpus

Escritura epistolar, edición digital y anotación de corpus

Los Corpus Del Español Clásico Y Moderno: Entre La Filología Y La Lingüística Computacional

Da edición dixital á análise lingüística. A creación de corpus históricos na plataforma TEITOK

Contact Info

Product

Resources

About