Баранов В.А., Зуга О.В. Опыт квантитативного исследования Пантелеймонова Евангелия конца XII – начала XIII в. (три статистических эксперимента)
DOI: https://doi.org/10.15688/jvolsu2.2020.6.4
Виктор Аркадьевич Баранов
доктор филологических наук, профессор, заведующий кафедрой лингвистики, Ижевский государственный технический университет им. М.Т. Калашникова
ул. Студенческая, 7, 426069 г. Ижевск, Россия
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
https://orcid.org/0000-0003-1730-6359
Оксана Владимировна Зуга
кандидат филологических наук, доцент кафедры русского языка, теоретической и прикладной лингвистики, Удмуртский государственный университет
ул. Университетская, 1, 426034 г. Ижевск, Россия
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
https://orcid.org/0000-0002-2675-4818
Аннотация. Цель работы – выявление степени близости Пантелеймонова Евангелия (РНБ, Соф. 1) другим Евангелиям и средневековым славянским текстам других жанров, представленным в подкорпусах исторического корпуса «Манускрипт: славянское письменное наследие». Работа выполнена с помощью специализированных модулей статистики и n-грамм. Сопоставление перечней автоматически извлеченных их рукописи одно, двух- и трехкомпонентных лингвистических единиц с соответствующими перечнями нескольких подкорпусов позволяет определить такие количественно-статистические характеристики лингвистических компонентов рукописей, которые могут быть признаны существенными. Обобщены данные трех экспериментов. Первый эксперимент показал, что наименьшие отличия частотных списков существуют между Пантелеймоновым Евангелием и полными апракосами, а наибольшие – между анализируемой рукописью и краткими апракосами. Это позволяет признать, что состав перечней, порядок следования и относительная частота форм в них являются существенными характеристиками рукописи или подкорпуса. В ходе второго эксперимента, проведенного с применением статистической меры Weirdness, из Пантелеймонова Евангелия извлечены словоформы, претендующие на роль значимых – имеющие максимально высокий вес на фоне разножанровых подкорпусов. Установлено, что объем и состав контрастного подкорпуса не влияют на результат; применение в качестве контрастных подкорпусов коллекций полных и кратких апракосов позволило уточнить список таких форм. В ходе третьего эксперимента (анализ двух- и трехкомпонентных сочетаний, извлеченных с помощью статистической меры T-score) был установлен перечень устойчивых сочетаний (неизменяемых композиционных формул, цельных грамматических структур, устойчивых семантических комплексов и их частей), свойственных всем Евангелиям, и выявлены статистически значимые последовательности, имеющие в Пантелеймоновом Евангелии статистический вес значительно выше, чем в контрастных подкорпусах.
Ключевые слова: древнерусские рукописи, Пантелеймоново Евангелие, статистические методы, ключевые слова, n-граммы.
Цитирование. Баранов В. А., Зуга О. В. Опыт квантитативного исследования Пантелеймонова Евангелия конца XII – начала XIII в. (три статистических эксперимента) // Вестник Волгоградского государственного университета. Серия 2, Языкознание. – 2020. – Т. 19, № 6. – С. 43–57. – DOI: https://doi.org/10.15688/jvolsu2.2020.6.4
Произведение «Опыт квантитативного исследования Пантелеймонова Евангелия конца XII – начала XIII в. (три статистических эксперимента)» созданное автором по имени Баранов В.А., Зуга О.В. , публикуется на условиях лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.