Resumo: Este artigo investiga o papel de distância linear entre sujeito e verbo e de marcação morfológica de número no sujeito e no verbo no processamento da concordância verbal variável no português brasileiro
A compreensibilidade textual de informações sobre serviços públicos em ambientes de governo eletrônico (e-gov) gera debates em vários países. Há evidências na literatura de que o método de redação Linguagem Simples (Plain Language) oferece ferramentas para melhorar a compreensibilidade de textos, evitando características linguísticas que dificultam a leitura. Os objetivos deste estudo foram: (i) Realizar levantamento documental sobre uso de Linguagem Simples em e-gov no Brasil e no mundo; (ii) Analisar a incidência de características linguísticas que prejudicam a compreensibilidade textualestruturas complexas de sentença, nominalizações, palavras pouco conhecidas e palavras polissílabasna seção Benefícios do site do INSS. Esta análise compreendeu: a) Análise geral de 19 textos da seção Benefícios; b) Análise automática de três textos pela ferramenta computacional Coh-Metrix-Port 2.0; c) Análise detalhada de um fragmento do texto Auxílio-doença, observando a incidência de estruturas complexas de sentença. O levantamento documental apontou aspectos comuns nas diretrizes internacionais de Linguagem Simples em e-gov. Na análise da escrita do INSS, foram encontradas todas as características linguísticas mencionadas, que, ao oferecerem barreiras à compreensão, podem impactar no acesso da população aos benefícios. Futuras pesquisas poderiam investigar intervenções de Linguagem Simples tendo como parâmetro uma categorização dos referidos aspectos comuns às diretrizes internacionais. plain language, e-gov, red tape, textual comprehensibility The textual comprehensibility of information on public services in e-government raises debates in a number of countries.). Evidence in literature shows that the Plain Language writing method provides tools to improve text comprehensibility, avoiding linguistic traits that make reading difficult. The objectives of this study were: (i) Carry out a documental survey on the use of Plain Language in e-gov in Brazil and worldwide; (ii) Analyze the incidence of linguistic traits that hinder textual comprehensibility-complex sentence structures, nominalisations, unfamiliar words and polysyllable words-in the Benefits section of the INSS (the Federal Social Service) website. This analysis included: a) General analysis of the 19 texts in the Benefits section; b) Automatic analysis of three texts using the Coh-Metrix-Port 2.0 computational tool; c) Detailed analysis of a fragment of the text Disease-related Aid, focusing on the incidence of complex sentence structures. The documental survey pointed out common aspects in the international guidelines of Plain Language in e-gov. The analysis of the INSS writing showed the presence of all the linguistic traits mentioned above, which, by imposing barriers to understanding, may impact the population's access to the benefits. Future research could investigate Plain Language interventions using as a parameter a categorization of the common aspects to international guidelines.
Sentence complexity assessment is a relatively new task in Natural Language Processing. One of its aims is to highlight in a text which sentences are more complex to support the simplification of contents for a target audience (e.g., children, cognitively impaired users, non-native speakers and low-literacy readers ). This task is evaluated using datasets of pairs of aligned sentences including the complex and simple version of the same sentence. For Brazilian Portuguese, the task was addressed by (Leal et al., 2018), who set up the first dataset to evaluate the task in this language, reaching 87.8% of accuracy with linguistic features. The present work advances these results, using models inspired by (Gonzalez-Garduño and Søgaard, 2018), which hold the state-of-the-art for the English language, with multi-task learning and eyetracking measures. First-Pass Duration, Total Regression Duration and Total Fixation Duration were used in two moments; first to select a subset of linguistic features and then as an auxiliary task in the multi-task and sequential learning models. The best model proposed here reaches the new state-of-the-art for Portuguese with 97.5% accuracy 1 , an increase of almost 10 points compared to the best previous results, in addition to proposing improvements in the public dataset after analysing the errors of our best model. 1 Accuracy in our task is how close the model is to the true value, when assessing whether a given sentence is simple or complex, in a 10-fold cross-validation test.
O presente artigo explora os processos envolvidos na retomada anafórica de uma representação conceitual (coletiva ou distributiva), resultado de uma operação de quantificação que envolve o mapeamento de dois conjuntos e as relações estabelecidas entre eles. Com base no mecanismo de retomada, é investigada a interpretação preferencial associada aos quantificadores universais todo(s) e cada no PB. O custo de retomada do pronome anafórico se mostrou diferenciado para cada um dos itens pesquisados. Os resultados experimentais vão de encontro aos estudos prévios e sugerem que, enquanto expressões quantificadas com todos e cada remetem a interpretações coletivas e distributivas, respectivamente, o quantificador todo apresenta um padrão menos definido.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.