ПРИКАСПИЙСКИЙ ЖУРНАЛ

УПРАВЛЕНИЕ И ВЫСОКИЕ ТЕХНОЛОГИИ

Математические модели информационного поиска web-ресурсов

Читать Кузнецов Михаил Андреевич, Нгуен Тан Там Математические модели информационного поиска web-ресурсов  // Прикаспийский журнал:  управление и высокие технологии. — 2013. — №2. — Стр. 25-30.

Кузнецов Михаил Андреевич - кандидат технических наук, доцент, Волгоградский государственный технический университет, 400005, Российская Федерация, г. Волгоград, пр. им. Ленина, 28, mara122@mail.ru

Нгуен Тан Там - магистрант, Волгоградский государственный технический университет, 400005, Российская Федерация, г. Волгоград, пр. им. Ленина, 28, tantamvn@gmail.com

Реализация поисковой системы для нахождения web-ресурсов требует построения адекватной математической модели. Подавляющее большинство разработанных моделей ориентировано на текстовый поиск. Модель должна обеспечивать высокую скорость обработки поисковых запросов, вести качественную оценку релевантности и ранжируемости результатов. Существующие системы, такие как GOOGLE, YAHOO, BING и т.д., используют подобные математические модели. Каждая реализация имеет отличия, характеризующиеся преимуществами и недостатками. Несмотря на принципиальные особенности в реализации моделей, можно выделить несколько базовых подходов. Каждый подход использует определенные принципы обработки и представления текста для поиска. Статья посвящена рассмотрению особенностей базовых математических моделей, лежащих в основе построения существующих поисковых систем. Рассматриваются модели на основе множеств: векторные, вероятностные и ссылочные.

Ключевые слова: поисковая система,релевантность,ранжирование результатов поиска,ссылочное ранжирование,web-поиск,ключевые слова,термы,лексема,лексический анализ,поисковый запрос