Беляева Л.Н., Камшилова О.Н. Лексикографические проблемы систем машинного перевода: на пути от буквального до нейронного
DOI: https://doi.org/10.15688/jvolsu2.2024.5.1
Лариса Николаевна Беляева
доктор филологических наук, профессор кафедры образо- вательных технологий в филологии, Российский государственный педагогический университет им. А.И. Герцена
наб. реки Мойки, 48, 191186 г. Санкт-Петербург, Россия
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
https://orcid.org/0000-0002-8622-4595
Ольга Николаевна Камшилова
кандидат филологических наук, доцент кафедры образовательных технологий в филологии, Российский государственный педагогический университет им. А.И. Герцена
наб. реки Мойки, 48, 191186 г. Санкт-Петербург, Россия
доцент кафедры лингвистики и переводоведения, Санкт-Петербургский университет технологий управления и экономики
просп. Лермонтовский, 44, 190020 г. Санкт-Петербург, Россия
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
https://orcid.org/0000-0002-1488-2206
Аннотация. В статье рассматриваются актуальные вопросы интерпретации современными системами машинного перевода (МП) лексики, неизвестной этим системам (out-of-vocabulary words), в контексте изменений форм и ведения автоматического словаря. Дан критический очерк типологии систем МП и стратегий их развития. Описаны особенности этих стратегий и влияние на них развивающихся программных средств и технологий. Проанализированы формы ведения словарной поддержки, меняющиеся под воздействием технологических условий. Показано, что при любой системе МП ее лингвистическое обеспечение и структура автоматических словарей становятся принципиально важными для поддержания качества перевода. При всем успехе развития нейронных систем МП (НМП) их автоматически пополняемые словарные базы не фиксируют слова, характеризующиеся терминологической спецификой и низкой частотой в массивах и корпусах текстов, на которых обучается система. На примере анализа результатов двух востребованных НМП – Google Translate и Yandex Translate – доказано, что обработка и унификация перевода слов, не вошедших в словари системы, прежде легко решавшаяся пользователями всех типов систем МП на основе пополнения и ведения автоматического словаря, остается по-прежнему актуальной проблемой и требует особого подхода при редактировании результатов НМП.
Ключевые слова: машинный перевод, стратегия машинного перевода, типология систем машинного перевода, автоматический словарь, неизвестное слово, лингвистическая поддержка.
Цитирование. Беляева Л. Н., Камшилова О. Н. Лексикографические проблемы систем машинного перевода: на пути от буквального до нейронного // Вестник Волгоградского государственного университета. Серия 2, Языкознание. – 2024. – Т. 23, № 5. – С. 6–19. – DOI: https://doi.org/10.15688/jvolsu2.2024.5.1
Лексикографические проблемы систем машинного перевода: на пути от буквального до нейронного by Беляева Л.Н., Камшилова О.Н. is licensed under CC BY 4.0