Колмогорова А.В., Сунь Цюхуа. Тематическое моделирование текстов разных эмоциональных классов [На англ. яз.]
DOI: https://doi.org/10.15688/jvolsu2.2024.5.5
Анастасия Владимировна Колмогорова
доктор филологических наук, профессор, заведующая лабораторией языковой конвергенции, Национальный исследовательский университет «Высшая школа экономики»
наб. канала Грибоедова, 119–121, 190068 г. Санкт-Петербург, Россия
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
https://orcid.org/0000-0002-6425-2050
Цюхуа Сунь
доктор филологических наук, профессор, руководитель департамента международного сотрудничества, Хэйлундзянский университет
просп. Сюэфу, 74, г. Харбин, Китай
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
https://orcid.org/0000-0002-1959-7180
Аннотация. Статья посвящена проблеме вербализации различных эмоциональных состояний в текстах на русском языке. Цель работы – подтвердить или опровергнуть гипотезу о том, что тексты разных эмоциональных классов неодинаково отражают денотативную ситуацию, имеют тематическую специфику и не идентичное лексическое наполнение. Материал исследования составили восемь подкорпусов текстов на русском языке, которые были извлечены из пабликов социальной сети ВКонтакте. Тексты отобраны по эмоциональным хэштегам, которые соответствуют восьми базовым эмоциям, согласно модели Г. Лёвхейма: злость, удивление, стыд, радость, отвращение, печаль, воодушевление, унижение. Соответствие эмоции и хэштега было установлено в предварительном психолингвистическом эксперименте. Для анализа текстовой коллекции использовалась техника выделения статистически неслучайных групп слов (тем) при помощи компьютерного алгоритма – метод компьютерного тематического моделирования. К собранным данным применена нейросетевая модель BERTopic. В результате анализа было выявлено, что тексты разных эмоциональных классов содержат неодинаковое количество тем, при том, что их число не коррелирует непосредственно с объемом данных: при сравнительно небольшом объеме данных может быть много тем, а в объемном корпусе – мало. Наборы слов (токенов), составивших каждую неслучайную группу (тему), отличаются по подкорпусам, отражая специфику денотативной ситуации, формирующуюся под влиянием эмоционального состояния говорящего. Теоретическое обоснование получает идея о специфической тематической «гранулярности», характерной для текстов разных эмоциональных классов.
Ключевые слова: эмоции, денотативная ситуация, тематическое моделирование, тексты в социальных сетях, русский язык.
Цитирование. Колмогорова А. В., Сунь Цюхуа. Тематическое моделирование текстов разных эмоциональных классов // Вестник Волгоградского государственного университета. Серия 2, Языкознание. – 2024. – Т. 23, № 5. – С. 60–71. – (На англ. яз.). – DOI: https://doi.org/10.15688/jvolsu2.2024.5.5
Тематическое моделирование текстов разных эмоциональных классов [На англ. яз.] by Колмогорова А.В., Сунь Цюхуа is licensed under CC BY 4.0