ВЕСТНИК ВОРОНЕЖСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА. СЕРИЯ: СИСТЕМНЫЙ АНАЛИЗ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

Архив статей журнала

МОДЕЛИ И МЕТОДЫ N-SHOT ОБУЧЕНИЯ И ИХ ПРИМЕНЕНИЕ В ЗАДАЧАХ СЕМАНТИЧЕСКОЙ СЕГМЕНТАЦИИ ИЗОБРАЖЕНИЙ: СИСТЕМАТИЗИРОВАННЫЙ ОБЗОР, ЧАСТЬ I - ZERO-SHOT ОБУЧЕНИЕ (2024)
Выпуск: № 1 (2024)
Авторы: Сирота Александр Анатольевич, Отырба Ростислав Русланович

В работе представлен систематизированный обзор моделей и методов N-Shot обучения в контексте задачи семантической сегментации изображений с использованием глубоких нейронных сетей. N-Shot обучение представляет собой совокупность методов и алгоритмов глубокого обучения, преимущественно применяемых в задачах обработки изображений, ориентированных на реализацию способности нейросетевой модели быстро и эффективно обучаться под новую задачу при отсутствии обучающих примеров (Zero-Shot обучение) или при весьма малом их количестве (One-Shot/Few-Shot обучение). Следует отметить, что отечественные научные издания не содержат достаточно полного и систематизированного анализа результатов, полученных в рамках данного направления. Данная первая часть обзора посвящена Zero-Shot обучению, являющаяся одним из направлением N-Shot методологии и осуществляющая сегментацию изображений с новыми классами объектов исключительно на основе целевого изображения и его текстового описания. В работе разобрана постановка задачи Zero-Shot обучения, а также детально проанализированы наиболее известные подходы и реализации, начиная с первоначальных концепций и заканчивая последними инновационными исследованиями. Представленные на рисунках модели глубоких нейронных сетей отображены с сохранением наиболее существенных компонентов, отражающих принципы реализации предлагаемого подхода в каждом случае. При необходимости точного воспроизведения архитектуры читателю следует обратиться к первоисточнику. Для лучшего понимания преимуществ и недостатков анализируемых моделей было осуществлено сравнение полученных авторами результатов тестирования на общих наборах данных Pascal-VOC 2012 и COCO-Stuff. Проведенный анализ позволил выделить наиболее перспективные и эффективные модели, которые могут быть рекомендованы для практического применения в задачах семантической сегментации изображений. В последующей второй части обзора будет представлено исследование методов One-Shot и Few-Shot обучения в задаче семантической сегментации. Эта часть обзора будет посвящена методам, способным выполнять сегментацию изображений с новыми классами объектов на основе всего нескольких обучающих примеров.

Сохранить в закладках
АЛГОРИТМЫ КЛАССИФИКАЦИИ ОБЪЕКТОВ НА ИЗОБРАЖЕНИЯХ ПРИЕМНОЙ КАМЕРЫ СОВРЕМЕННОГО ФАНДОМАТА (2024)
Выпуск: № 1 (2024)
Авторы: Гостев Захар Сергеевич, Сирота Александр Анатольевич

В работе рассматривается задача разработки математического и программного обеспечения для анализа изображений в современных фандоматах. В рамках подхода, основанного на применении методов поверхностного машинного обучения, формулируется задача обработки изображений объектов, подлежащих сырьевой переработке в фандомате, как задача сегментации этих изображений с последующей классификацией по форме. Производится обзор и сравнение известных методов сегментации с целью выделения формы объектов и формирования признаков для классификации. В результате сравнения делается выбор в пользу метода активного контура. Предлагается и исследуется относительно простой алгоритм классификации сегментированных объектов на основе «случайного леса». Также предлагается два алгоритма выделения признаков классификации: алгоритм на основе анализа степени заполненности частей сегментированного изображения и алгоритм, вычисляющий свойства области объекта. Как альтернативный подход также описывается метод классификации получаемых изображений в целом, без предварительного выделения признаков, основанный на глубоком обучении…

Сохранить в закладках
МОДЕЛИ И МЕТОДЫ N-SHOT ОБУЧЕНИЯ И ИХ ПРИМЕНЕНИЕ В ЗАДАЧАХ СЕМАНТИЧЕСКОЙ СЕГМЕНТАЦИИ ИЗОБРАЖЕНИЙ: СИСТЕМАТИЗИРОВАННЫЙ ОБЗОР, ЧАСТЬ II, ONE-SHOT И FEW-SHOT ОБУЧЕНИЕ (2024)
Выпуск: № 2 (2024)
Авторы: Отырба Ростислав Русланович, Сирота Александр Анатольевич

В работе представлен систематизированный обзор моделей и методов N-Shot обучения в контексте задачи семантической сегментации изображений с использованием глубоких нейронных сетей. N-Shot обучение представляет собой совокупность методов и алгоритмов глубокого обучения, применяемых в задачах обработки изображений и ориентированных на реализацию способности нейросетевой модели быстро и эффективно обучаться под новую задачу при отсутствии обучающих примеров (Zero-Shot обучение) или при весьма малом их количестве (One-Shot/Few-Shot обучение). Следует отметить, что отечественные научные издания не содержат достаточно полного и систематизированного анализа результатов, полученных в рамках данного направления. В статье, ранее опубликованной в настоящем журнале, была представлена первая часть обзора, посвященная исключительно методам и алгоритмам Zero-Shot обучения, т. е. обучения в отсутствии обучающих примеров. Данная статья является второй частью обзора и посвящена методам One-Shot/Few-Shot обучения. Она, с одной стороны, теснейшим образом связана с опубликованной ранее первой частью, но, в то же время, раскрывает суть принципиально другого подхода. В отличие от Zero-Shot обучения, где модель не имеет обучающих примеров для новых классов, данный подход предполагает обучение либо на основе одного обучающего примера в виде размеченного изображения (One-Shot-обучение), либо на основе использования небольшого количества обучающих примеров (Few-Shot-обучение). На сегодняшний день данное направление развивается ещё более активно, чем Zero-Shot, и демонстрирует впечатляющие результаты. В работе разобрана постановка задачи One-Shot и Few-Shot обучения, а также детально проанализированы наиболее известные подходы и реализации, начиная с первоначальных концепций и заканчивая последними инновационными исследованиями. Представленные на рисунках модели глубоких нейронных сетей отображены с сохранением наиболее существенных компонентов, отражающих принципы реализации предлагаемого подхода в каждом случае. При необходимости точного воспроизведения архитектуры читателю следует обратиться к первоисточнику. Для лучшего понимания преимуществ и недостатков анализируемых моделей было осуществлено сравнение полученных авторами результатов тестирования на общих наборах данных PASCAL-5i и COCO-20i. Проведенный анализ позволил выделить наиболее перспективные и эффективные модели, которые могут быть рекомендованы для практического применения в задачах семантической сегментации изображений при ограниченном количестве обучающих примеров.

Сохранить в закладках
РЕГУЛЯРИЗАЦИЯ ПРОЦЕССА ОБУЧЕНИЯ ГРАФОВЫХ НЕЙРОННЫХ СЕТЕЙ МЕТОДОМ РАСПРОСТРАНЕНИЕ МЕТОК (2024)
Выпуск: № 3 (2024)
Авторы: Головинский Павел Абрамович, Сирота Александр Анатольевич, Лыгин Вадим Сергеевич

Графовые нейронные сети в настоящее время являются объектом все возрастающего интереса в области машинного обучения и анализа данных. Их специализированная архитектура позволяет эффективно моделировать и анализировать сложные структуры данных на графах, такие как социальные сети, биоинформационные сети, транспортные сети и другие. С возрастанием объема данных, представленных в виде графов, растет их значимость как инструмента для понимания и прогнозирования сложных взаимосвязей и паттернов. Данная работа направлена на оценку эффективности метода L2-регуляризации, применяемого при машинном обучении в контексте задачи кластеризации узлов графа. Под кластеризацией понимается объединение узлов в группы, выделяемые по степени их связности. При обучении используется специальный метод регуляризации и реализующий его алгоритм распространения меток LPA (Label Propagation Algorithm), а также расширение данного подхода на две популярные архитектуры графовых нейронных сетей: GraphSAGE (Graph Sample and Aggregation) и GAT (Graph Attention Networks). В рамках исследования проводится сравнительный анализ эффективности применения метода LPA на различных датасетах, широко применяемых в научных и практических задачах. Результаты исследования показывают заметное улучшение точности анализа графовых моделей данных при использовании анализируемого подхода. Проведенное исследование способствует более глубокому пониманию воздействия общего подхода L2-регуляризации в плане обучения графовых нейронных сетей.

Сохранить в закладках