ПРИКАСПИЙСКИЙ ЖУРНАЛ

УПРАВЛЕНИЕ И ВЫСОКИЕ ТЕХНОЛОГИИ

Идентификация взаимосвязей между терминами и объектами экономической тематики в тексте на естественном языке

Читать Дмитриев А.С., Соловьев И.С., Орлова Ю.А., Розалиев В.Л., Константинов В.М. Идентификация взаимосвязей между терминами и объектами экономической тематики в тексте на естественном языке // Прикаспийский журнал:  управление и высокие технологии. — 2015. — №4. — Стр. 198-210.

Дмитриев А.С. - старший преподаватель, Волгоградский государственный технический университет, 400005, Российская Федерация, г. Волгоград, пр. им. Ленина, 28, golostos@yandex.ru

Соловьев И.С. - разработчик, SurfStudio, 394018, Российская Федерация, г. Воронеж, ул. Среднемосковская, 1д, issoloveyv@gmail.com

Орлова Ю.А. - кандидат технических наук, кандидат педагогических наук, доцент, Волгоградский государственный технический университет, 400005, Российская Федерация, г. Волгоград, пр. им. Ленина, 28, yulia.orlova@gmail.com

Розалиев В.Л. - кандидат технических наук, доцент, Волгоградский государственный технический университет, 400005, Российская Федерация, г. Волгоград, пр. им. Ленина, 28, vladimir.rozaliev@gmail.com

Константинов В.М. - аспирант, Волгоградский государственный технический университет, 400005, Российская Федерация, г. Волгоград, пр. им. Ленина, 28, konstantinovr1@gmail.com

В настоящее время происходит стремительное развитие систем обработки текста. Однако пока существует достаточно мало программных комплексов для эффективного поиска взаимосвязей внутри текстов. Это особенно ощущается при обработке значительного количества текстов экономической тематики, в т.ч. при извлечении из них важных (значимых) финансово-экономических терминов. Поэтому в рамках данной статьи описана созданная авторами программная система для идентификации объектов и терминов экономической тематики. Эта система позволяет также определить, с каким объектом связан тот или иной экономический термин. Был разработан шаблонный метод (на основе метода Snowball) для идентификации объектов и терминов в тексте. В статье описываются признаки терминов и объектов, особенности работы с контекстом для шаблонного метода. Для идентификации и уточнения отношений между объектами и терминами используется метод опорных векторов (SVM). Приводятся алгоритмы указанных методов и общая архитектура созданной программной системы.

Ключевые слова: экономические термины, идентификация объектов, текст, извлечение отношений, контекст предложения, программная система, интеллектуальный анализ данных, метод опорных векторов, economic terms, object identification, text, relation extraction, context of the