Горбань О.А., Косова М.В., Шептухина Е.М., Светлов А.В. Корпус архивных документов Войска Донского: проблемы морфологического анализа
DOI: https://doi.org/10.15688/jvolsu2.2022.6.4
Оксана Анатольевна Горбань
доктор филологических наук, профессор кафедры русской филологии и журналистики, Волгоградский государственный университет
просп. Университетский, 100, 400062 г. Волгоград, Россия
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
https://orcid.org/0000-0002-2345-3673
Марина Владимировна Косова
доктор филологических наук, профессор кафедры русской филологии и журналистики, Волгоградский государственный университет
просп. Университетский, 100, 400062 г. Волгоград, Россия
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
https://orcid.org/0000-0003-2854-8759
Елена Михайловна Шептухина
доктор филологических наук, профессор кафедры русской филологии и журналистики, Волгоградский государственный университет
просп. Университетский, 100, 400062 г. Волгоград, Россия
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
https://orcid.org/0000-0002-8007-6042
Андрей Владимирович Светлов
кандидат физико-математических наук, доцент кафедры математического анализа и теории функций, Волгоградский государственный университет
просп. Университетский, 100, 400062 г. Волгоград, Россия
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
https://orcid.org/0000-0002-8764-6132
Аннотация. В статье обобщены некоторые результаты исследования, нацеленного на создание специального аннотированного диахронического корпуса документов архивного фонда Михайловского станичного атамана Государственного архива Волгоградской области. Предложены решения лингвистических и технических задач, связанных с разметкой текстов и представлением их в электронно-поисковой среде. Для корректной работы с текстами документов, написанными скорописью XVIII в. и первой половины XIX в., группой специалистов под руководством А.В. Светлова создана надстройка над утилитой для стемминга MyStem И.В. Сегаловича. Она добавляет к возможностям утилиты выводить всю грамматическую информацию и количественные данные опцию работы с устаревшей кириллицей, удобный графический интерфейс, имеет функционал для снятия омонимии вручную, поддерживает экспорт размеченного текста во внешнюю систему хранения и обработки данных. В результате морфологического анализа части текстов О.А. Горбань и Е.М. Шептухиной установлены варианты падежных форм существительных, не отмеченные в «Российской грамматике» М.В. Ломоносова, в современных исследованиях литературных текстов XVIII в., и обоснована необходимость корректировки программных инструментов разметки текстов в плане расширения возможных вариантов грамматического разбора омонимичных форм для последующего снятия омонимии вручную. Количественный анализ выявленных фактов, проведенный М.В. Косовой, и их лингвистическая интерпретация показали в сфере грамматики, наряду с общими тенденциями развития и функционирования русского языка, особенности, характерные для деловой письменной речи в ее региональном варианте.
Ключевые слова: история русского языка, региональная деловая письменность, лингвистический корпус, морфологическая разметка, варианты падежных форм, грамматическая омонимия.
Цитирование. Горбань О. А., Косова М. В., Шептухина Е. М., Светлов А. В. Корпус архивных документов Войска Донского: проблемы морфологического анализа // Вестник Волгоградского государственного университета. Серия 2, Языкознание. – 2022. – Т. 21, № 6. – С. 47–56. – DOI: https://doi.org/10.15688/jvolsu2.2022.6.4
Произведение «Корпус архивных документов Войска Донского: проблемы морфологического анализа» созданное автором по имени Горбань О.А., Косова М.В., Шептухина Е.М., Светлов А.В., публикуется на условиях лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.