Светлов А.В., Комендантов А.С. Автоматизация процесса получения лингвистической информации: современные возможности

DOI: https://doi.org/10.15688/jvolsu2.2017.2.4

Андрей Владимирович Светлов

Кандидат физико-математических наук, доцент кафедры математического анализа и теории функций, Волгоградский государственный университет

просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация

Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра. ,  Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.

http://orcid.org/0000-0002-8764-6132

 

Анатолий Сергеевич Комендантов

Студент института математики и информационных технологий, Волгоградский государственный университет

просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация

Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.

http://orcid.org/0000-0001-5009-498X


Аннотация. Статья посвящена проблемам автоматизации решения некоторых задач лингвистического анализа. Описано многообразие существующего лингвистического программного обеспечения. Приведена его классификация: электронные словари и тезаурусы; программы преобразования текстов и генераторы текстов; программы анализа и лингвистической обработки документов; системы обработки естественного языка. Для каждой группы даны примеры соответствующих приложений или веб-сервисов, обсуждаются современные возможности программ, сферы их использования и перспективы развития. Основная часть работы посвящена созданной авторами статьи надстройке над утилитой для стемминга MyStem И. Сегаловича. Приложение добавляет к возможностям утилиты удобный графический интерфейс, простой для освоения и интуитивно понятный пользователям, не специализирующимся в информационных технологиях. Функционирование приложения связано с использованием результатов стемминга для решения некоторых специфических задач. Оно перехватывает вывод утилиты MyStem, специальным образом переформатирует и анализирует его. В число задач, которые решаются на основании этой обработки, входит частотный анализ текста, выборка определенных частей речи, выборка побуждений. На примерах продемонстрированы результаты работы всех модулей программы. В заключении намечены некоторые перспективы развития созданного приложения.

Ключевые слова: автоматизация, лингвистический анализ, морфологический анализ, автоматизация лингвистического анализа, автоматизация морфологического анализа, стемминг, графический интерфейс, программная оболочка.

Цитирование. Светлов А. В., Комендантов А. С. Автоматизация процесса получения лингвистической информации: современные возможности // Вестник Волгоградского государственного университета. Серия 2, Языкознание. – 2017. – Т. 16, № 2. – С. 39–46. – DOI: https://doi.org/10.15688/jvolsu2.2017.2.4. 

Лицензия Creative Commons
Произведение «Автоматизация процесса получения лингвистической информации: современные возможности» созданное автором по имени Светлов А.В., Комендантов А.С., публикуется на условиях лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.

Вложения:
Скачать этот файл (4_Svetlov_Komendantov.pmd.pdf) 4_Svetlov_Komendantov.pmd.pdf
URL: https://l.jvolsu.com/index.php/ru/component/attachments/download/1572
827 Скачивания