Матыцина М.С., Прохорова О.Н., Чекулай И.В. Возможности изучения сочетаемости и устойчивости лексических единиц статистическими методами (на примере глагола take)

DOI: https://doi.org/10.15688/jvolsu2.2024.4.9

Марина Станиславовна Матыцина

доктор филологических наук, профессор кафедры иностранных языков, Липецкий государственный технический университет

ул. Московская, 30, 398055 г. Липецк, Россия

Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.

https://orcid.org/0000-0001-6102-4397

Ольга Николаевна Прохорова

доктор филологических наук, профессор, директор Института межкультурной коммуникации и международных отношений, Белгородский государственный национальный исследовательский университет

ул. Победы, 85, корп. 10, 308015 г. Белгород, Россия

Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.

https://orcid.org/0000-0001-9441-819X

Игорь Владимирович Чекулай

доктор филологических наук, профессор кафедры английской филологии и межкультурной коммуникации, Белгородский государственный национальный исследовательский университет

ул. Победы, 85, корп. 10, 308015 г. Белгород, Россия

Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.

https://orcid.org/0000-0001-8599-1699


Аннотация. Статья посвящена вопросам определения устойчивой сочетаемости слов в речи с применением различных мер ассоциации на примере лингвистического корпуса. Актуальность исследования обусловлена существующей в лингвистике потребностью углубления знаний о факторах, детерминирующих формирование устойчивых отношений элементов внутри словосочетания. В качестве источника избран English Web Corpus (enTenTen) и его подкорпусы. Материалом для анализа послужили биграммы двухсловного сочетания: глагола take с соседним словом. Наряду с критическим рассмотрением мер, используемых для установления связности слов, описан характер отношений между элементами коллокации. Особое внимание уделено сравнению коллокаций в подкорпусах, содержащих тексты разных жанров и тематики. Проанализировано более 100 биграмм, извлеченных посредством мер ассоциации t-score, MI-score и Log Dice. Установлено, что показатели меры t-score различаются в изучаемых подкорпусах, показывают зависимость полученных данных от размера подкорпусов. Делается вывод о том, что вычисление степени устойчивости ассоциативной связи биграмм глагола take, основанное только на этом показателе, невозможно. Данные, полученные с помощью мер MI-score и Log Dice, свидетельствуют о незначительной разнице между подкорпусами, что демонстрирует независимость таких показателей от размера корпуса. Выявлено, что вариативный характер отношений между элементами коллокации заключается в зависимости степени связности слов в словосочетании от частоты их встречаемости в текстах разных жанров, регистров и модальности. М.С. Матыциной подготовлен общий план исследования, осуществлен сбор необходимой информации из корпуса. О.Н. Прохоровой разработана методика анализа, выполнено обобщение материала. И.В. Чекулаем интерпретированы результаты проведенной научной работы.

Ключевые слова: лингвистический корпус, подкорпус, коллокация, меры ассоциации, English Web Corpus (enTenTen), t-score, MI-score, Log Dice.

Цитирование. Матыцина М. С., Прохорова О. Н., Чекулай И. В. Возможности изучения сочетаемости и устойчивости лексических единиц статистическими методами (на примере глагола take) // Вестник Волгоградского государственного университета. Серия 2, Языкознание. – 2024. – Т. 23, № 4. – С. 106–118. – DOI: https://doi.org/10.15688/jvolsu2.2024.4.9

Возможности изучения сочетаемости и устойчивости лексических единиц статистическими методами (на примере глагола take) by Матыцина М.С., Прохорова О.Н., Чекулай И.В. is licensed under CC BY 4.0

Вложения:
Скачать этот файл (4_Matytcina_et al.pmd.pdf) 4_Matytcina_et al.pmd.pdf
URL: https://l.jvolsu.com/index.php/ru/component/attachments/download/2994
34 Скачивания