ПРИКАСПИЙСКИЙ ЖУРНАЛ
УПРАВЛЕНИЕ И ВЫСОКИЕ ТЕХНОЛОГИИ
Модели и методы экономичного ранжирования диагностических показателей при их аппроксимации распределением Лапласа
Читать | Колесин И.Д., Трояножко О.А. Модели и методы экономичного ранжирования диагностических показателей при их аппроксимации распределением Лапласа // Прикаспийский журнал: управление и высокие технологии. — 2017. — №3. — Стр. 95-109. |
Колесин И.Д. - доктор физико-математических наук, профессор, Санкт-Петербургский государственный университет, 198504, Российская Федерация, г. Санкт-Петербург, Петергоф, Университетский проспект, 35, kolesin_id@mail.ru
Трояножко О.А. - аспирант, Санкт-Петербургский государственный университет, 198504, Российская Федерация, г. Санкт-Петербург, Петергоф, Университетский проспект, 35, med_otpor@mail.ru
Предложен экономичный метод ранжирования диагностических показателей (ДП) для классификации опухолей по двум группам («доброкачественная» или «злокачественная»). Метод апробирован с использованием базы данных, сформированной Висконсинским университетом в США. Реализованы два этапа метода: сначала выявляются наиболее информативные ДП из всех доступных; затем - проводится классификация. На первом этапе выбор и оценка степени информативности ДП выполняется с использованием коэффициента перекрытия. Он используется для измерения меры сходства между двумя функциями распределения или двумя выборками, представленными этими распределениями. При этом, чем меньше площадь перекрытия функций плотности распределения для различных видов объектов, тем более информативен ДП. При аппроксимации мы использовали классическое распределение Лапласа. Наличие для него простой аналитической формы первообразной является преимуществом перед иными распределениями, не имеющими простой первообразной в явном виде. В результате ранжирования мы получаем упорядоченный по уменьшению степени информативности список ДП на основе соответствующих им значений коэффициентов перекрытия. На практике важна экономичность не только алгоритма, но и программной разработки на его основе - особенно при массовых проведениях исследований. Исходя из этого, нами при сравнении учитывалась временн а я сложность и экономичность алгоритма ранжирования. Отметим, что рост вычислительных мощностей ЭВМ может снижать затраты времени на проведение расчетов, но не улучшает качества распознавания объектов. На втором (заключительном) этапе был использован алгоритм, основанный на применении дискретной функции ошибок. Сравнительный анализ подтвердил, что точность диагностики вида опухолей оказалась не хуже точности, полученной другими методами, причем при меньшей сложности алгоритма ранжирования. В результате точность диагностики по трем ДП, найденным данным методом ранжирования, удалось повысить до 96,31 % (для совокупности объектов, представленных в указанной выше базе данных Висконсинского университета). Предложенный метод ранжирования может быть использован на практике как один из вспомогательных - для ранней экспресс-диагностики вида опухолей при массовых обследованиях.
Ключевые слова: высокотехнологичная диагностика, рак молочной железы, вычислительные алгоритмы, диагностика, информатизация, качество медицинских услуг, коэффициент перекрытия, медицинские информационные системы, ранжирование показателей, распределение Лапласа, сложность