Рогозина Е.А. Представление и анализ элементов структуры содержания в Санкт-Петербургском корпусе агиографических текстов (СКАТ)

DOI: https://doi.org/10.15688/jvolsu2.2022.6.3

Елена Андреевна Рогозина

старший преподаватель кафедры математической лингвистики, Санкт-Петербургский государственный университет

Университетская наб., 11, 199034 г. Санкт-Петербург, Россия

Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.

https://orcid.org/0000-0002-5777-1020


Аннотация. СКАТ – электронный корпус агиографических древнерусских текстов XV–XVII вв., созданный на кафедре математической лингвистики Санкт-Петербургского государственного университета. В текстах корпуса вводится морфосинтаксическая разметка, а также активно ведется работа по разметке содержательных элементов. В статье охарактеризованы принципы разметки смысловых разделов. Представлен результат анализа входящих в корпус текстов, позволивший выявить общую для них сюжетную схему. Показано, что разметка сюжетных элементов и создание оглавлений дают возможность работать с отдельными разделами и сравнивать одинаковые разделы в разных текстах. Осуществлен поиск и разметка библейских, святоотеческих и литургических цитат в текстах корпуса. Изучение распределения цитат по текстам и сопоставление цитат с размеченными разделами позволили установить закономерности в использовании цитат и обнаружить цитаты, характерные для определенных разделов житий. Описаны принципы разметки повторяющихся фрагментов текстов. В житиях корпуса СКАТ обнаружены многочисленные текстовые фрагменты, воспроизводимые разными авторами. Такие фрагменты размечаются с указанием ссылки на первоисточник. Эта разметка позволяет постепенно накопить реестр подобных фрагментов и делает возможным их выделение в других текстах.

Ключевые слова: лингвистический корпус, агиография, сюжетная схема, цитата, XML-разметка.

Цитирование. Рогозина Е. А. Представление и анализ элементов структуры содержания в Санкт-Петербургском корпусе агиографических текстов (СКАТ) // Вестник Волгоградского государственного университета. Серия 2, Языкознание. – 2022. – Т. 21, № 6. – С. 30–46. – DOI: https://doi.org/10.15688/jvolsu2.2022.6.3

Лицензия Creative Commons
Произведение «Представление и анализ элементов структуры содержания в Санкт-Петербургском корпусе агиографических текстов (СКАТ)» созданное автором по имени Рогозина Е.А., публикуется на условиях лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Вложения:
Скачать этот файл (3_Rogozina.pdf) 3_Rogozina.pdf
URL: https://l.jvolsu.com/index.php/ru/component/attachments/download/2683
139 Скачивания