RESUMO:Por envolverem traços semânticos, morfológicos e pragmáticos, os verbos compõe uma classe gramatical complexa, o que torna complicado o seu processamento computacional, pois muitas vezes os analisadores automáticos não conseguem captar as minúcias de significação que são dependentes do contexto linguístico, gerando ambiguidades. Para aprimorar o processamento automático da linguagem, analisamos o desempenho de dois etiquetadores, o Automatic Parse e o Treetagger, a fim de observar as suas limitações na etiquetagem de verbos do português. Os resultados obtidos reforçam a necessidade de desenvolvimento de etiquetas semântico-discursivas para verbos nos analisadores automáticos, pois, apesar de serem poucos em relação ao número total de palavras do corpus, os erros de etiquetagem de verbos foram significativos e se mostraram frequentes. Palavras-chave: Etiquetagem. Processamento linguístico. Verbos SUMMARY:Verbs involve semantic, morphologic and pragmatic features that compounds a complex grammatical class and this becomes complicate its computational processing because anytime automatic parsers fail at codifying specific meanings context dependents, resulting ambiguity in language. To improve the automatic language processing we analyze the performance of two software taggers -Automatic Parse and Treetagger -in verbs of Portuguese. The results point that is necessary the development of semantic-discursive tags to verbs in automatic taggers: besides few tag mistakes in the corpora these were recurrent in same contexts. Keywords: Tagger. Linguistic processing. Verbs INTRODUÇÃOA Linguística Computacional é a área do conhecimento que investiga as relações entre linguística e informática, possibilitando a construção de sistemas com capacidade de reconhecer e produzir informação apresentada em linguagem natural. Busca desenvolver modelos computacionais que reconheçam e produzam informação em linguagens desenvolvidas naturalmente pelo ser humano. Uma das subáreas é o processamento de linguagem natural, que lida "diretamente com o estudo da linguagem voltado para a construção de softwares e sistemas computacionais específicos, como
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.