ПРИКАСПИЙСКИЙ ЖУРНАЛ

УПРАВЛЕНИЕ И ВЫСОКИЕ ТЕХНОЛОГИИ

КЛАССИФИКАЦИЯ СУЩЕСТВИТЕЛЬНЫХ ТАДЖИКСКОГО ЯЗЫКА ДЛЯ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТОВ

Читать Мадибрагимов Навруз Шавкатович, Пруцков Александр Викторович КЛАССИФИКАЦИЯ СУЩЕСТВИТЕЛЬНЫХ ТАДЖИКСКОГО ЯЗЫКА ДЛЯ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТОВ // Прикаспийский журнал:  управление и высокие технологии. — 2020. — №4. — Стр. 39-52.

Мадибрагимов Навруз Шавкатович - Рязанский государственный радиотехнический университет имени В.Ф. Уткина (РГРТУ), navruzmadibragimov@gmail.com

Пруцков Александр Викторович - Рязанский государственный радиотехнический университет имени В.Ф. Уткина (РГРТУ), mail@prutzkow.com

Таджикская компьютерная лингвистика остро нуждается в развитии, так как много трудов в этой сфере выполнены только на теоретическом уровне. Авторами данной статьи реализован универсальный метод генерации и определения словоформ таджикского языка. В работе описывается автоматическая обработка текстов и ее уровни, рассматривается морфологический уровень. Анализируются особенности таджикского языка и его система морфологии. Выполнен обзор исследований в области автоматической обработки текстов на таджикском языке на морфологическом уровне. Приводится предложенная классификация существительных таджикского языка по типам формообразования. Выделены 5 типов формообразования существительных таджикского языка и 12 подтипов. Для выделенных типов и подтипов охарактеризованы отличительные особенности. Результаты данного исследования послужили основой для программной реализации генерации форм слов таджикского языка в виде интернет-приложения.

Ключевые слова: компьютерная лингвистика, автоматическая обработка текста, таджикский язык, морфология таджикского языка, модель формообразования, генерация и определение форм слов, интернет- приложение