Сорокина С.Г. Автоматизированное резюмирование: от методов извлечения к абстрактному обобщению [На англ. яз.]

DOI: https://doi.org/10.15688/jvolsu2.2024.5.4

Светлана Геннадьевна Сорокина

кандидат филологических наук, доцент Института лингвистики и межкультурной коммуникации, Первый Московский государственный медицинский университет им. И.М. Сеченова (Сеченовский университет)

ул. Трубецкая, 8, стр. 2, 119048 г. Москва, Россия

Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.

https://orcid.org/0000-0002-8667-6743


Аннотация. В статье представлен обзор моделей автоматизированного резюмирования текста, основанных на технологиях искусственного интеллекта и использующих два основных подхода: экстрактивный (извлекающий) и абстрактивный (обобщающий). Цель исследования заключается в оценке компрессионных возможностей этих моделей и их языковой компетентности. Степень сжатия оценивается при помощи количественных показателей: количество страниц, слов и символов. Для оценки языковой компетентности принимается во внимание способность моделей применять разнообразные грамматические и лексические конструкции без искажения смысла и содержания. Для оценки потенциала автоматизированного резюмирования были выбраны модели OpenAI Summate.it, WordTune, SciSummary, Scholarcy и OpenAI ChatGPT-4, материалом для анализа послужили тексты публикаций по разным научным дисциплинам. Результаты позволили установить, что выбранные модели с опорой на гибридную стратегию интегрируют как экстрактивные, так и абстрактивные технологии. Тексты, созданные этими инструментами, варьировались по степени полноты и точности, при этом степень сжатия страниц составила от 50 до 95 %, а сокращение количества символов достигло 98 %. Качественная оценка показала, что, хотя модели в целом обладают способностью точно передавать основные идеи исходных текстов, некоторые резюме отличаются излишним упрощением или неверными смысловыми акцентами. Несмотря на эти ограничения, модели автоматического резюмирования обладают значительным потенциалом не только как инструменты для сжатия текста, но и как генераторы нового контента, который может стать ценным объектом для лингвистического анализа, способствуя изучению процессов машинного порождения языка и смысловой переработки текстов.

Ключевые слова: автоматизированное резюмирование, экстрактивное резюмирование, абстрактивное резюмирование, искусственный интеллект, нейронные сети, междисциплинарные исследования.

Цитирование. Сорокина С. Г. Автоматизированное резюмирование: от методов извлечения к абстрактному обобщению // Вестник Волгоградского государственного университета. Серия 2, Языкознание. – 2024. – Т. 23, № 5. – С. 47–59. – (На англ. яз.). – DOI: https://doi.org/10.15688/jvolsu2.2024.5.4

Автоматизированное резюмирование: от методов извлечения к абстрактному обобщению [На англ. яз.] by Сорокина С.Г. is licensed under CC BY 4.0

Вложения:
Скачать этот файл (4_Sorokina.pmd.pdf) 4_Sorokina.pmd.pdf
URL: https://l.jvolsu.com/index.php/ru/component/attachments/download/3024
22 Скачивания