Dependentzia Unibertsalen eredura egokitutako euskarazko zuhaitz-bankua

Aranzabe, Maxux; Atutxa, Aitziber; Bengoetxea, Kepa; Ilarraza, Arantza Díaz de; Goenaga, Iakes; Gojenola, Koldo; Uria, Larraitz

doi:10.1387/ekaia.19745

Cited by 2 publications

(3 citation statements)

References 3 publications

Supporting

Mentioning

Contrasting

Unclassified

Order By: Relevance

“…Until recently, this was not a documented possibility in Universal Dependencies, however other treebanks have established these layered features as a precedent. One example is the Basque Universal Dependency treebank (Aranzabe et al, 2015). Though subtypes are not described in the documentation of the conversion process (Aranzabe et al, 2015), this treebank includes verbs with multiple number features using subtypes to indicate the type.…”

Section: Creating Word-level Annotationsmentioning

confidence: 99%

“…One example is the Basque Universal Dependency treebank (Aranzabe et al, 2015). Though subtypes are not described in the documentation of the conversion process (Aranzabe et al, 2015), this treebank includes verbs with multiple number features using subtypes to indicate the type. Unlike the Basque Universal Dependency treebank, we do not use subtypes with the case of the agreeing element indicated for Swahili.…”

Section: Creating Word-level Annotationsmentioning

confidence: 99%

See 1 more Smart Citation

Proceedings of the Fourth workshop on Resources for African Indigenous Languages (RAIL 2023)

2023

View full text Add to dashboard Cite

show abstract

Section: Creating Word-level Annotationsmentioning

confidence: 99%

Section: Creating Word-level Annotationsmentioning

confidence: 99%

Proceedings of the Fourth workshop on Resources for African Indigenous Languages (RAIL 2023)

2023

View full text Add to dashboard Cite

show abstract

“…Específicamente, se empleó el paquete "udpipe" (Straka et al, 2016) (Wijffels et al, 2020) en su versión 0.8.5, el cual proporciona una interfaz adaptable para aplicar modelos de Universal Dependencies (Nivre et al, 2016). Se accedió al modelo de euskera publicado por Aranzabe y colaboradores (Aranzabe et al, 2015) para llevar a cabo el modelado y clasificación de los lemas y las categorías gramaticales.…”

Section: Primer Objetivo: Construcción Del Léxico En Lengua Vascaunclassified

El análisis lexicométrico, el corpus y el diccionario previo: caso de la lengua Vasca

2023

ÑEMITỸRÃ Revista Multilingüe De Lengüa Sociedad Y Educación

View full text Add to dashboard Cite

podemos llevar a cabo una clasificación automática de grandes volúmenes de textos que aborden un determinado contexto semántico, con el fin de identificar los distintos campos semánticos o de sentido en base a las elecciones léxicas realizadas. Esta tarea se encuentra resuelta tanto en el software patrocinado por Max Reinert (1990), conocido como ALCESTE, como en el software de código abierto IRaMuTeQ (Ratinaud & Déjean, 2009) y sus desarrollos posteriores (Barnier, 2022). Como mencionaba Reinert (1990), es fundamental llevar a cabo un pretratamiento lingüístico que se ajuste al sentido semántico del texto, evitando así la variabilidad regida por las normas gramaticales. Para lograr este control sobre la variabilidad, se utiliza una preclasificación con un diccionario que contempla las formas plausibles de aparición en el texto, junto con sus correspondientes valores de significado asociados. En el caso de lenguas aglutinantes como el euskera, esto plantea un desafío particular. En esta comunicación, presentamos el proceso de creación de un diccionario para el uso del software IRaMuTeQ con textos en lengua vasca, su evaluación interna, mediante el análisis de autodescripciones de profesorado universitario, y externa, mediante el análisis de un corpus paralelo multilingüe vasco, castellano, inglés y francés.

show abstract

Dependentzia Unibertsalen eredura egokitutako euskarazko zuhaitz-bankua

Cited by 2 publications

References 3 publications

Proceedings of the Fourth workshop on Resources for African Indigenous Languages (RAIL 2023)

Proceedings of the Fourth workshop on Resources for African Indigenous Languages (RAIL 2023)

El análisis lexicométrico, el corpus y el diccionario previo: caso de la lengua Vasca

Contact Info

Product

Resources

About