Аннотация. Рассматривается маркемный состав английских текстов второй половины XVII в. Актуальность обсуждаемой проблемы объясняется необходимостью решения задачи объективации и формализации содержательного анализа текста. До сих пор не выработаны четкие параметры, позволяющие, с одной стороны, объективировать характеристику стиля автора, а с другой -проследить взаимосвязь разных авторов и исследовать формирование языка литературы. Применение математических методов в лингвистических исследованиях позволяет выделить закономерности, которым подчиняются все тексты на естественных языках. Универсальные законы Дж. Ципфа, описывающие статистическую структуру текста на естественном языке, позволяют выделить из частотного словаря какого-либо текста или совокупности текстов слова, имеющие ключевое значение. Использование квантитативных методов для анализа литературных произведений дает возможность не только выявить закономерности в частотности употребления тех или иных слов, но и решить ряд других важных задач лингвистического исследования. В статье предлагается использование метода маркемного анализа как одного из способов формализации содержательного анализа текста. Он дает возможность получить полную картину маркемного состава языка литературных произведений любого хронологического среза или исторического периода, позволяя, при этом, исследовать тексты практически любого объема. Кроме того, метод маркемного анализа дает возможность исследовать специфику маркем отдельных авторов или групп авторов, влияние социокультурных процессов на динамику маркем, изучать эволюцию маркемной лексики на основе исследования маркем в нескольких хронологических срезах, а также посредством выделения общих маркем и определения на их основе коэффициента корреляции авторов устанавливать взаимосвязи различных авторов и, таким образом, обнаруживать преемственность в литературе. В основе метода лежат базовые понятия «маркема» и «индекс текстуальной маркированности» (ИнТеМ). ИнТеМ выражает зависимость между длиной словоформы и частотой ее употребления. Разность, полученная в результате вычитания веса словоформы по длине из ее веса по частоте, представляет собой авторскую составляющую, указывающую на степень весомости отдельной словоформы для конкретного текста. Обработка текстов производится созданным в Воронежском государственном университете программным комплексом тематического анализа лексики «ProTemAl-Engl». С целью определения взаимосвязи английских писателей второй половиныXVII в. в созданных ими произведениях выявляется и анализируется маркемная лексика. Маркемами признаются наиболее значимые для автора текста словоформы. Это -имена существительные, как наименее маркированная часть речи, обозначающие важнейшие категории культуры, описываю-
In this paper, we describe hypothetical possibilities for applying nonlinear dynamics methods to linguistic research. We suggest to refer to a large text corpus (meta-book of the writer, national language, language of the branch of knowledge) as a fractal object and to measure its fractal dimension (by Hausdorff). We consider the question of practical calculation of fractal dimension, as well as the question of motivation for applying the fractal concept to the language. In addition, we propose to apply some methods of the qualitative theory of differential equations to modelling the growth of the natural language vocabulary.
The article substantiates the need to supplement the canonical corpus of A.V. Koltsov’s poems with three poetic works, which are contained in the poet’s letterto A.A. Krayevsky, a publisher, and dedicated to the death of A.S. Pushkin. One of these works is presented in the specified epistolary text in a standard verse form, while the other two have a prose design. The authors propose a re-construction of these two poems based on the principle of minimal interference in the content with graphic ordering of the form. The article shows that A.V. Koltsov’s poems reconstructed and restored in their rights are connected with other works not only within the poet’s artistic world, but also within Russian literature with individual images, catchwords, and motives.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.