Архив статей журнала
В статье представлен метод классификации изображений с использованием, помимо базовой нейронной сети, дополнительной, способной адаптивно концентрироваться на классифицируемом объекте изображения. Задача дополнительной сети является задачей о контекстном многоруком бандите и сводится к предсказанию такой области на исходном изображении, при вырезании которой в процессе классификации возрастет уверенность базовой нейронной сети в принадлежности объекта на изображении правильному классу. Обучение дополнительной сети происходит с помощью методов обучения с подкреплением и стратегий достижения компромисса между эксплуатацией и исследованием при выборе действий для решения задачи о контекстном многоруком бандите. На подмножестве набора данных ImageNet-1K проведены различные эксперименты по выбору архитектуры нейронной сети, алгоритма обучения с подкреплением и стратегии исследования при обучении. Рассмотрены такие алгоритмы обучения с подкреплением, как DQN, REINFORCE и A2C, и такие стратегии исследования, как -жадная, -softmax, -decay-softmax и метод UCB1. Большое внимание уделено описанию проведенных экспериментов и обоснованию полученных результатов. Предложены варианты применения разработанного метода, демонстрирующие увеличение точности классификации изображений по сравнению с базовой моделью ResNet. Дополнительно рассмотрен вопрос о вычислительной сложности данного метода. Дальнейшие исследования могут быть направлены на обучение агента на изображениях, не задействованных при обучении сети ResNet.
В статье представлены концептуальная и поведенческие модели производственных и бизнес-процессов сетевых предприятий на основе применения многоагентных технологий, реализующих холархические и гетерархические принципы построения киберфизических производственных систем, которые обеспечивают построение и функционирование гибких и адаптивных систем управления производством. В качестве метода исследования предлагается использовать усовершенствованный метод декомпозиции многоагентных систем на автономные компоненты в соответствии с ролевым назначением агентов продуктов, агентов ресурсов и агентов платформы в производственных и бизнес-процессах. Метод разработки единой концептуальной модели позволяет интегрировать производственные и бизнес-процессы в системах управления производством сетевого предприятия на разных уровнях. Для обеспечения качества и надежности функционирования систем управления производством сетевых предприятий предлагается использовать метод формирования соглашений об уровне обслуживания. Основными результатами исследования являются построенная концептуальная модель архитектуры многоагентной системы управления производством сетевого предприятия, отражающая взаимодействие программных агентов - административных оболочек активов в соответствии с их ролями, и разработанные поведенческие модели процессов сетевых предприятий для организации бизнес-экосистемы, конфигурирования и контроля исполнения производственной цепочки с использованием языковых средств UML. В модели организации и контроля исполнения производственной цепочки введено использование соглашений об уровне обслуживания. Особенностями построенных моделей производственных и бизнес-процессов являются усиление их интеграции на различных уровнях управления производством, а также введение механизма управления качеством через аппарат создания и использования соглашений об уровне обслуживания, что позволяет повысить качество и надежность гибкого конфигурирования и исполнения производственных цепочек сетевого предприятия.
В данной работе рассмотрены возможности интеграции методов обучения с подкреплением и нечеткой логики в плане повышения эффективности алгоритмов обучения с подкреплением. Главное внимание уделяется применению таких интегрированных методов в интеллектуальных системах реального времени, особенно в системах поддержки принятия решений для мониторинга и управления сложными техническими объектами. Как основа используется метод обучения с подкреплением на базе темпоральных различий, состояние среды и сигнал вознаграждения формируются с применением нечеткой логики. Представлена программная реализация и приводятся данные компьютерного моделирования методов глубокого обучения с подкреплением на основе темпоральных различий, полученные при сравнительном анализе алгоритма на основе нечеткой логики и алгоритмов на основе нейронных сетей. Показано, что основными достоинствами алгоритмов обучения с подкреплением с применением нечеткой логики являются: эффективность обучения, выражающаяся в минимизации количества эпизодов, что особенно важно, когда доступность данных для обучения ограничена или обучение в реальном времени требует быстрой адаптации; устойчивость к шуму и выбросам в данных, что важно в реальных средах, где присутствуют шумы или изменяются данные; интерпретируемость - алгоритмы с нечеткой логикой предоставляют интерпретируемые правила и выводы на основе нечеткой логики; расширение области применения обучения с подкреплением на предметные/проблемные области и задачи с непрерывным пространством состояний. Данные исследования и разработки выполняются в рамках конструирования интеллектуальных систем поддержки принятия решений реального времени. Эти системы предназначены для помощи оперативно-диспетчерскому персоналу (лицам, принимающим решения) при мониторинге и управлении сложными техническими и организационными системами в условиях достаточно жестких временных ограничений и при наличии различного типа неопределенностей (неточности, нечеткости, противоречивости) в поступающей в систему информации, то есть так называемых зашумленных данных.
В работе описывается система назначения персонифицированного лечения на основе прецедентов. Ее уникальной особенностью является извлечение прецедентов на основе гибридного метода, сочетающего извлечение прецедента на основе знаний с классическим способом K-ближайших соседей. Новизна предлагаемого подхода заключается в обеспечении максимальной гибкости и корректности в оценке сходимости прецедентов. В работе описаны информационные и программные компоненты системы. Используемая база знаний, как и все информационные ресурсы, строится по своим онтологиям, четко задающим их структуру и семантику. Это позволяет оперативно вносить изменения без привлечения программистов и переработки всей системы. Система реализована на основе мультиагентного подхода. На первом этапе с помощью базы знаний производятся предварительный расчет и приведение всех признаков к единой метрике, на втором - непосредственный расчет сходимости методом K-ближайших соседей. Сходимость историй болезни определяется совокупно по каждому признаку. На практике система позволяет максимально гибко и точно оценивать похожесть историй болезни, содержащих разнородные по типу признаки. Предлагаемое решение особенно эффективно в условиях дефицита медицинских знаний и данных, когда системы иного типа, в частности, основанные на знаниях, не могут предложить корректное решение.
В статье приводятся результаты исследований по разработке гибридных интеллектуальных регуляторов, позволяющих обеспечить эффективность управления техническим объектом, в том числе функционирующим в условиях неопределенности. Рассмотрены вопросы компенсации разных типов неопределенностей при управлении техническим объектом с применением интеллектуальных регуляторов. Дана обобщенная классификация неопределенностей и предложена новая с определением тех ее видов, компенсация которых достигается с помощью разработанных методов и алгоритмов. Такими видами неопределенностей являются параметрическая неопределенность, неопределенности, вызванные внешними воздействиями, лингвистическая неопределенность. Отдельно выделена лингвистическая неопределенность, приведены способы ее компенсации, основанные на подходе управления, который базируется на сочетании классической теории управления, нечеткой логики, нейросетевых технологий и генетических алгоритмов. В рамках демонстрации подхода в общем виде описан весь процесс получения желаемого управления для технического объекта, в том числе функционирующего в условиях неопределенности. Представлены результаты работы созданных методов управления техническими объектами с применением интеллектуальных регуляторов на основе самоорганизации баз знаний. Основу методов составляет алгоритм самоорганизации робастных баз знаний без привлечения эксперта с автоматизацией процесса генерации управляющих правил. Реализация алгоритма в моделях управления способствует получению желаемого управления для технических объектов, включая функционирующие в условиях неопределенности, представленных линейными или нелинейными математическими моделями первого, второго и третьего порядков, в том числе с запаздыванием. Результаты моделирования подтверждают, что применение подхода с гибридным управлением позволяет получать желаемое управление техническим объектом, в том числе функционирующим в условиях неопределенности.
В настоящей статье рассматриваются аспекты применения методов машинного обучения к существующим способам моделирования поведения интеллектуальных агентов для обеспечения возможности агентам повысить показатели своей эффективности в моделях конкуренции. Практическая значимость исследования представлена разработкой подхода к моделированию поведения интеллектуальных агентов, за счет которого можно повысить эффективность их функционирования в таких сферах деятельности, как компьютерные игры, разработка беспилотных летательных аппаратов и поисковых роботов, изучение городской и транспортной мобильности, а также в прочих сложных системах. Проведен обзор существующих методов машинного обучения (обучение с подкреплением, глубокое обучение, Q-обучение) и способов моделирования поведения агентов (модель на правилах, конечно-автоматная модель поведения, деревья поведения). Выбрана наиболее подходящая к задаче комбинация метода обучения и модели поведения: деревья поведения и обучение с подкреплением. Средствами Unity реализована тестовая платформа, разработаны модели поведения четырех основных архетипов агентов, которые должны соревноваться в задаче сбора ресурсов в условиях ограниченного времени. Реализован обученный агент с помощью средств Unity ML и TensorFlow. На базе тестовой платформы проведена серия экспериментов в различных условиях: ограниченность, изобилие, среднее количество ресурсов. В рамках эксперимента тестировалась способность разработанной модели поведения интеллектуального агента выигрывать в условиях конкуренции с агентами, снабженными различными вариантами традиционных моделей поведения на базе деревьев поведения. Оценены работоспособность и преимущества использования разработанной модели поведения. Проанализированы результаты эксперимента, сделаны выводы относительно потенциала выбранной комбинации методов.
В статье предлагается интеллектуальная система (программно-аналитический комплекс) на основе искусственной нейронной сети для управления учебным процессом на данных, полученных от структурных подразделений организации. Для моделирования совершенствования бизнес-процессов используется цикл Деминга. Представлена структура (модель) программно-аналитического комплекса, позволяющего выявить и проследить связанные друг с другом вертикальные и горизонтальные процессы, что дает формализованное описание системы, удовлетворяющее требованиям алгоритма. Построена онтологическая модель структуры комплекса программной аналитики, которая увязывается с набором решений с использованием баз данных и знаний и разбивается на классы объектов и категории с иерархическими отношениями между ними. Чтобы поделиться этими знаниями, в SAC необходимо предоставить их конкретное описание. Оно должно быть достаточно формальным, понятным для другой системы и написано на том же языке. Новизна заключается в решении задачи интеграции информационных систем, связанных со слабоструктурированными предметно-ориентированными информационными потоками образовательного учреждения, с использованием методов теории множеств и теории категорий. Описание свойств отношений между объектами учета происходит на высоком уровне абстракции, появляется возможность существенно расширить сферу применения предлагаемого метода построения программно-аналитического комплекса на основе онтологической модели для различных предметных областей с учетом многоуровневого рассмотрения самой предметной области, а также конечных и бесконечных областей значений. При этом автоматически определяется необходимый уровень абстракции для обеспечения структурной и параметрической целостности формируемой системы и интерпретации возникающих задач анализа данных, представленных семантическими моделями.