2021
DOI: 10.18255/1818-1015-2021-3-280-291
|View full text |Cite
|
Sign up to set email alerts
|

Text Classification by Genre Based on Rhythm Features

Abstract: The article is devoted to the analysis of the rhythm of texts of different genres: fiction novels, advertisements, scientific articles, reviews, tweets, and political articles. The authors identified lexico-grammatical figures in the texts: anaphora, epiphora, diacope, aposiopesis, etc., that are markers of the text rhythm. On their basis, statistical features were calculated that describe quantitatively and structurally these rhythm features.The resulting text model was visualized for statistical analysis usi… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1
1

Citation Types

0
0
0
4

Year Published

2022
2022
2022
2022

Publication Types

Select...
2

Relationship

1
1

Authors

Journals

citations
Cited by 2 publications
(4 citation statements)
references
References 12 publications
0
0
0
4
Order By: Relevance
“…В статьях [37][38][39] описываются результаты применения методов машинного обучения к задаче классификации текстов социальных сетей. В работах [40,41] оценивается эффективность использования признаков различной природы для классификации постов. Подходы, основанные на применении глубоких нейронных сетей, представлены, в частности, в статьях [42][43][44][45].…”
Section: обзор смежных работunclassified
“…В статьях [37][38][39] описываются результаты применения методов машинного обучения к задаче классификации текстов социальных сетей. В работах [40,41] оценивается эффективность использования признаков различной природы для классификации постов. Подходы, основанные на применении глубоких нейронных сетей, представлены, в частности, в статьях [42][43][44][45].…”
Section: обзор смежных работunclassified
“…Автор статьи в своей предыдущей работе [5] вместе с коллегами исследовала комплекс ритмических характеристик для анализа шести жанров: художественные романы, научные статьи, политические статьи, рекламные статьи, отзывы, твиты. С помощью этих характеристик и классификаторов AdaBoost и LSTM были достигнуты достаточно высокие значения метрик качества: не менее 76 % F-меры для всех жанров, кроме рекламы.…”
Section: обзор смежных работunclassified
“…• классификатор AdaBoost -мета-алгоритм машинного обучения, который объединяет результаты 50 классификаторов-деревьев решений, корректирующих неправильно классифицированные тексты; • классификатор RandomForest -мета-алгоритм машинного обучения, который усредняет результаты 50 классификаторов-деревьев решений; • двунаправленная LSTM -рекуррентная нейронная сеть со слоем двунаправленной долгой краткосрочной памяти (LSTM) с 64 блоками и полносвязным выходным слоем, использующим функцию активации Softmax для мультиклассовой классификации и Sigmoid для бинарной; • GRU -рекуррентная нейронная сеть со слоем Gated Recurrent Unit (GRU) с 4 блоками и полносвязным выходным слоем, использующим функцию активации Softmax для мультиклассовой классификации и Sigmoid для бинарной. Данные алгоритмы были выбраны как лучшие алгоритмы по классификации текстов как с помощью ритма [5], так и с помощью ELMo [7] и BERT [8].…”
Section: постановка экспериментовunclassified
See 1 more Smart Citation