Беляева Л.Н., Камшилова О.Н. Лексикографические проблемы систем машинного перевода: на пути от буквального до нейронного

DOI: https://doi.org/10.15688/jvolsu2.2024.5.1

Лариса Николаевна Беляева

доктор филологических наук, профессор кафедры образо- вательных технологий в филологии, Российский государственный педагогический университет им. А.И. Герцена

наб. реки Мойки, 48, 191186 г. Санкт-Петербург, Россия

Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.

https://orcid.org/0000-0002-8622-4595

Ольга Николаевна Камшилова

кандидат филологических наук, доцент кафедры образовательных технологий в филологии, Российский государственный педагогический университет им. А.И. Герцена

наб. реки Мойки, 48, 191186 г. Санкт-Петербург, Россия

доцент кафедры лингвистики и переводоведения, Санкт-Петербургский университет технологий управления и экономики

просп. Лермонтовский, 44, 190020 г. Санкт-Петербург, Россия

Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.

https://orcid.org/0000-0002-1488-2206


Аннотация. В статье рассматриваются актуальные вопросы интерпретации современными системами машинного перевода (МП) лексики, неизвестной этим системам (out-of-vocabulary words), в контексте изменений форм и ведения автоматического словаря. Дан критический очерк типологии систем МП и стратегий их развития. Описаны особенности этих стратегий и влияние на них развивающихся программных средств и технологий. Проанализированы формы ведения словарной поддержки, меняющиеся под воздействием технологических условий. Показано, что при любой системе МП ее лингвистическое обеспечение и структура автоматических словарей становятся принципиально важными для поддержания качества перевода. При всем успехе развития нейронных систем МП (НМП) их автоматически пополняемые словарные базы не фиксируют слова, характеризующиеся терминологической спецификой и низкой частотой в массивах и корпусах текстов, на которых обучается система. На примере анализа результатов двух востребованных НМП – Google Translate и Yandex Translate – доказано, что обработка и унификация перевода слов, не вошедших в словари системы, прежде легко решавшаяся пользователями всех типов систем МП на основе пополнения и ведения автоматического словаря, остается по-прежнему актуальной проблемой и требует особого подхода при редактировании результатов НМП.

Ключевые слова: машинный перевод, стратегия машинного перевода, типология систем машинного перевода, автоматический словарь, неизвестное слово, лингвистическая поддержка.

Цитирование. Беляева Л. Н., Камшилова О. Н. Лексикографические проблемы систем машинного перевода: на пути от буквального до нейронного // Вестник Волгоградского государственного университета. Серия 2, Языкознание. – 2024. – Т. 23, № 5. – С. 6–19. – DOI: https://doi.org/10.15688/jvolsu2.2024.5.1

Лексикографические проблемы систем машинного перевода: на пути от буквального до нейронного by Беляева Л.Н., Камшилова О.Н. is licensed under CC BY 4.0

Вложения:
Скачать этот файл (1_Beliaeva_Kamshilova.pmd.pdf) 1_Beliaeva_Kamshilova.pmd.pdf
URL: https://l.jvolsu.com/index.php/ru/component/attachments/download/3018
18 Скачивания