2016
DOI: 10.1007/978-3-319-41552-9_2
|View full text |Cite
|
Sign up to set email alerts
|

Automatic Classification of the Complexity of Nonfiction Texts in Portuguese for Early School Years

Abstract: Recent research shows that most Brazilian students have serious problems regarding their reading skills. The full development of this skill is key for the academic and professional future of every citizen. Tools for classifying the complexity of reading materials for children aim to improve the quality of the model of teaching reading and text comprehension. For English, Feng's work [11] is considered the state-of-art in grade level prediction and achieved 74% of accuracy in automatically classifying 4 levels … Show more

Help me understand this report
View preprint versions

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1
1
1

Citation Types

0
2
0
8

Year Published

2018
2018
2023
2023

Publication Types

Select...
3
2
2

Relationship

0
7

Authors

Journals

citations
Cited by 10 publications
(10 citation statements)
references
References 13 publications
(8 reference statements)
0
2
0
8
Order By: Relevance
“…O SIMPLEX-PB ) (ou somente SIMPLEX)é um córpus originalmente concebido para avaliação de métodos de Simplificação Lexical em Português Brasileiro, criado e disponibilizado ao público como um esforço para fomentar a pesquisa naárea. Ele contém 1.719 instâncias segundo a proporção de palavras de conteúdo encontradas no corpus (Hartmann et al, 2016): 56 % substantivos, 18% adjetivos, 18% verbos e 6% advérbios. A partir dessa distribuição, há ainda uma subdivisão igualmente distribuída para favorecer: palavras mais frequentes, palavras com maior número de sinônimos e palavras com mais sentidos.…”
Section: O Córpus Simplex-pb 30unclassified
“…O SIMPLEX-PB ) (ou somente SIMPLEX)é um córpus originalmente concebido para avaliação de métodos de Simplificação Lexical em Português Brasileiro, criado e disponibilizado ao público como um esforço para fomentar a pesquisa naárea. Ele contém 1.719 instâncias segundo a proporção de palavras de conteúdo encontradas no corpus (Hartmann et al, 2016): 56 % substantivos, 18% adjetivos, 18% verbos e 6% advérbios. A partir dessa distribuição, há ainda uma subdivisão igualmente distribuída para favorecer: palavras mais frequentes, palavras com maior número de sinônimos e palavras com mais sentidos.…”
Section: O Córpus Simplex-pb 30unclassified
“…3 O córpus SIMPLEX-PB 3.0 O SIMPLEX-PB (Hartmann, Paetzold e Aluísio, 2018) (ou somente SIMPLEX)é um córpus originalmente concebido para avaliação de métodos de Simplificação Lexical em Português Brasileiro, criado e disponibilizado ao público como um esforço para fomentar a pesquisa naárea. Ele contém 1.719 instâncias segundo a proporção de palavras de conteúdo encontradas no corpus (Hartmann et al, 2016a): 56 % substantivos, 18% adjetivos, 18% verbos e 6% advérbios. A partir dessa distribuição, há ainda uma subdivisão igualmente distribuída para favorecer: palavras mais frequentes, palavras com maior número de sinônimos e palavras com mais sentidos.…”
Section: Trabalhos De Simplificação Lexicalunclassified
“…Sabendo, ainda, que há uma progressão natural na aquisição lexical conforme os anos escolares avançam (Hartmann et al, 2016b),é natural afirmarmos que as palavras do dicionário do tipo 3 são mais complexas que as palavras dos dicionários do tipo 2, e que essas são mais complexas do que as palavras do dicionários do tipo 1. Para a tarefa de Simplificação Lexical, podemos utilizar essas diferenças para aprendermos, com uso de métodos de Machine Learning, quais são as características que determinam a gradação da complexidade de uma palavra e, consequente-mente, ranqueá-la de acordo com a sua complexidade frente a outras palavras.…”
Section: Simplificação Lexicalunclassified
See 2 more Smart Citations