Матыцина М.С., Прохорова О.Н., Чекулай И.В. Возможности изучения сочетаемости и устойчивости лексических единиц статистическими методами (на примере глагола take)
DOI: https://doi.org/10.15688/jvolsu2.2024.4.9
Марина Станиславовна Матыцина
доктор филологических наук, профессор кафедры иностранных языков, Липецкий государственный технический университет
ул. Московская, 30, 398055 г. Липецк, Россия
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
https://orcid.org/0000-0001-6102-4397
Ольга Николаевна Прохорова
доктор филологических наук, профессор, директор Института межкультурной коммуникации и международных отношений, Белгородский государственный национальный исследовательский университет
ул. Победы, 85, корп. 10, 308015 г. Белгород, Россия
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
https://orcid.org/0000-0001-9441-819X
Игорь Владимирович Чекулай
доктор филологических наук, профессор кафедры английской филологии и межкультурной коммуникации, Белгородский государственный национальный исследовательский университет
ул. Победы, 85, корп. 10, 308015 г. Белгород, Россия
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
https://orcid.org/0000-0001-8599-1699
Аннотация. Статья посвящена вопросам определения устойчивой сочетаемости слов в речи с применением различных мер ассоциации на примере лингвистического корпуса. Актуальность исследования обусловлена существующей в лингвистике потребностью углубления знаний о факторах, детерминирующих формирование устойчивых отношений элементов внутри словосочетания. В качестве источника избран English Web Corpus (enTenTen) и его подкорпусы. Материалом для анализа послужили биграммы двухсловного сочетания: глагола take с соседним словом. Наряду с критическим рассмотрением мер, используемых для установления связности слов, описан характер отношений между элементами коллокации. Особое внимание уделено сравнению коллокаций в подкорпусах, содержащих тексты разных жанров и тематики. Проанализировано более 100 биграмм, извлеченных посредством мер ассоциации t-score, MI-score и Log Dice. Установлено, что показатели меры t-score различаются в изучаемых подкорпусах, показывают зависимость полученных данных от размера подкорпусов. Делается вывод о том, что вычисление степени устойчивости ассоциативной связи биграмм глагола take, основанное только на этом показателе, невозможно. Данные, полученные с помощью мер MI-score и Log Dice, свидетельствуют о незначительной разнице между подкорпусами, что демонстрирует независимость таких показателей от размера корпуса. Выявлено, что вариативный характер отношений между элементами коллокации заключается в зависимости степени связности слов в словосочетании от частоты их встречаемости в текстах разных жанров, регистров и модальности. М.С. Матыциной подготовлен общий план исследования, осуществлен сбор необходимой информации из корпуса. О.Н. Прохоровой разработана методика анализа, выполнено обобщение материала. И.В. Чекулаем интерпретированы результаты проведенной научной работы.
Ключевые слова: лингвистический корпус, подкорпус, коллокация, меры ассоциации, English Web Corpus (enTenTen), t-score, MI-score, Log Dice.
Цитирование. Матыцина М. С., Прохорова О. Н., Чекулай И. В. Возможности изучения сочетаемости и устойчивости лексических единиц статистическими методами (на примере глагола take) // Вестник Волгоградского государственного университета. Серия 2, Языкознание. – 2024. – Т. 23, № 4. – С. 106–118. – DOI: https://doi.org/10.15688/jvolsu2.2024.4.9
Возможности изучения сочетаемости и устойчивости лексических единиц статистическими методами (на примере глагола take) by Матыцина М.С., Прохорова О.Н., Чекулай И.В. is licensed under CC BY 4.0