Архив статей журнала
Объектом исследования является технология федеративного обучения, которая позволяет осуществлять коллективное машинное обучение на распределенных обучающих наборах данных без их передачи в единое хранилище. Актуальность данной технологии обусловлена, с одной стороны, давно растущим трендом на использование машинного обучения для решения множества прикладных задач, а с другой - ростом запросов, в том числе законодательных, на приватность и обработку данных ближе к источнику или непосредственно на нем. Основными проблемами при создании систем федеративного обучения являются отсутствие гибких фреймворков для различных сценариев федеративного обучения: большинство существующих решений сосредоточено на обучении искусственных нейронных сетей в централизованной вычислительной среде. Предмет исследования - универсальная архитектура фреймворка для разработки прикладных систем федеративного обучения, позволяющая строить системы для разных сценариев, различных параметров и топологий вычислительной среды, моделей и алгоритмов машинного обучения. В статье рассмотрена предметная область федеративного обучения, даны основные определения и описан процесс федеративного обучения, приведены и разобраны различные сценарии возможных прикладных задач. Проведен анализ наиболее известных на данный момент фреймворков федеративного обучения, а также их применения для возможных сценариев использования. В качестве результата описана архитектура универсального фреймворка, который, в отличие от существующих, может быть использован для разработки прикладных систем федеративного обучения разного типа и разных сценариев использования.
В статье рассматриваются разработанные методы детектирования и классификации объектов в транспортном потоке на данных космической съемки сверхвысокого пространственного разрешения. С появлением в свободном доступе больших объемов спутниковых данных все большую актуальность приобретает развитие методов машинного обучения на основании геопространственных данных, в частности, спутниковых. В настоящей работе обоснован выбор источника данных о транспортных потоках - спутниковых снимков сверхвысокого разрешения, рассмотрены основные проблемы и задачи, связанные с распознаванием и классификацией объектов. Целью автора является разработка цепочки алгоритмов, позволяющей с высокой точностью детектировать и классифицировать объекты в транспортных потоках. Исследования основаны на численной оценке качества работы алгоритмов. В работе используются методы распознавания образов, машинного обучения и обработки цифровых изображений. Научная новизна заключается в уникальном алгоритме извлечения изображений локальных участков улично-дорожной сети, алгоритме определения направления дорожного движения объекта, модернизации алгоритма селективного поиска. Следует подчеркнуть, что используемые данные съемки сверхвысокого разрешения появились в доступе для частного использования относительно недавно.
В статье рассматривается способ автоматизации оценки состояния электросети в удаленных районах России с использованием смарт-структур. Предлагаемый способ реализован в виде мобильного приложения. Смарт-структура, лежащая в основе данного способа, состоит из модулей получения и обработки данных с датчиков, поиска закономерностей характеристик электросети и формирования классификаторов состояний, рекомендаций по ремонту и оптимальному режиму эксплуатации электросети и подстанции. Научная новизна предлагаемого решения заключается в методе анализа и обработки характеристик электросети и их совокупностей. Кроме того, учитываются параметры внешних воздействий в виде природных и техногенных факторов. Метод анализа и обработки информации об электросети и подстанции основан на машинном обучении - логическом анализе данных. Оценка состояния электросети и подстанции важна при исследовании и решении задач прогнозирования изменения состояния электросети, подбора рекомендаций и принятия решений о ремонтных и обслуживающих работах. Метод оценки состояния электросети основан на поиске закономерностей и построении классификаторов и позволяет учитывать все характеристики и параметры электросети, их совокупность и связи между ними. Он также дает возможность анализировать и получать закономерности для неполных и неточных данных, с чем достаточно часто приходится сталкиваться в реальных электросетях. Метод может быть использован при проектировании и обслуживании электросетей и подстанции в труднодоступных и удаленных регионах Российской Федерации. Предлагаемая редукция закономерностей характеристик и их совокупностей на основе их рекуррентной конъюнкции позволяет получать оптимальные классификаторы состояний электросети и подстанции с высокой интерпретируемостью и обобщенностью, что увеличивает точность оценки состояния электросети и, как следствие, точность прогноза поведения, рекомендаций и принятия решений о ремонтных работах и оптимальном режиме эксплуатации.
В статье представлен метод классификации изображений с использованием, помимо базовой нейронной сети, дополнительной, способной адаптивно концентрироваться на классифицируемом объекте изображения. Задача дополнительной сети является задачей о контекстном многоруком бандите и сводится к предсказанию такой области на исходном изображении, при вырезании которой в процессе классификации возрастет уверенность базовой нейронной сети в принадлежности объекта на изображении правильному классу. Обучение дополнительной сети происходит с помощью методов обучения с подкреплением и стратегий достижения компромисса между эксплуатацией и исследованием при выборе действий для решения задачи о контекстном многоруком бандите. На подмножестве набора данных ImageNet-1K проведены различные эксперименты по выбору архитектуры нейронной сети, алгоритма обучения с подкреплением и стратегии исследования при обучении. Рассмотрены такие алгоритмы обучения с подкреплением, как DQN, REINFORCE и A2C, и такие стратегии исследования, как -жадная, -softmax, -decay-softmax и метод UCB1. Большое внимание уделено описанию проведенных экспериментов и обоснованию полученных результатов. Предложены варианты применения разработанного метода, демонстрирующие увеличение точности классификации изображений по сравнению с базовой моделью ResNet. Дополнительно рассмотрен вопрос о вычислительной сложности данного метода. Дальнейшие исследования могут быть направлены на обучение агента на изображениях, не задействованных при обучении сети ResNet.
В статье рассматривается проблема улучшения методов стилевой классификации русскоязычных текстов. В качестве возможного направления исследований предложен метод оптимизации набора (множества) букв, применяемого для вычисления статистических индексов текстов. Для оптимизации и контроля результатов использованы поэтические и прозаические художественные тексты на русском языке. Объем текстов составлял порядка 300 тысяч знаков при оптимизации и 100 тысяч знаков при контрольной оценке. Для вычисления статистических индексов рассчитывались частотности биграмм и триграмм букв. При оптимизации опробован также и вариант совместного использования индексов биграмм и триграмм. В статье дано краткое описание метода статистических индексов, приведены применявшиеся в исследовании алгоритм пошаговой оптимизации, вид возможной оптимизационной функции и формула для нахождения границы классификации. Показано, что оптимизация набора букв улучшает классификацию по сравнению с вариантом использования как полного набора букв, так и набора из гласных букв в применении к задаче автоматического различения поэтических и прозаических художественных текстов на русском языке. Проведено сравнение результатов классификации по предложенной формуле границы классификации с результатами расчетов по классификации методом ROC-кривых. В итоге для разных сочетаний статистических индексов и способов определения границы классификации интервал верной классификации составил 72-74 % для набора, включающего все буквы, 82-86 % для набора, включающего только гласные буквы, и 80.5-92.5 % для разных наборов букв, полученных при оптимизации.
В настоящей статье рассматриваются аспекты применения методов машинного обучения к существующим способам моделирования поведения интеллектуальных агентов для обеспечения возможности агентам повысить показатели своей эффективности в моделях конкуренции. Практическая значимость исследования представлена разработкой подхода к моделированию поведения интеллектуальных агентов, за счет которого можно повысить эффективность их функционирования в таких сферах деятельности, как компьютерные игры, разработка беспилотных летательных аппаратов и поисковых роботов, изучение городской и транспортной мобильности, а также в прочих сложных системах. Проведен обзор существующих методов машинного обучения (обучение с подкреплением, глубокое обучение, Q-обучение) и способов моделирования поведения агентов (модель на правилах, конечно-автоматная модель поведения, деревья поведения). Выбрана наиболее подходящая к задаче комбинация метода обучения и модели поведения: деревья поведения и обучение с подкреплением. Средствами Unity реализована тестовая платформа, разработаны модели поведения четырех основных архетипов агентов, которые должны соревноваться в задаче сбора ресурсов в условиях ограниченного времени. Реализован обученный агент с помощью средств Unity ML и TensorFlow. На базе тестовой платформы проведена серия экспериментов в различных условиях: ограниченность, изобилие, среднее количество ресурсов. В рамках эксперимента тестировалась способность разработанной модели поведения интеллектуального агента выигрывать в условиях конкуренции с агентами, снабженными различными вариантами традиционных моделей поведения на базе деревьев поведения. Оценены работоспособность и преимущества использования разработанной модели поведения. Проанализированы результаты эксперимента, сделаны выводы относительно потенциала выбранной комбинации методов.