ISSN 2071-0216 · EISSN 2308-0256
Языки: ru · en

Статья: ИНВАРИАНТНОЕ ОПИСАНИЕ УПРАВЛЕНИЯ В ЗАДАЧЕ О ГАУССОВСКОМ ОДНОРУКОМ БАНДИТЕ (2024)

Читать онлайн

Рассматривается задача об одноруком бандите в приложении к пакетной обработке данных, если имеются два альтернативных метода обработки с разной эффективностью, причем эффективность второго метода априори неизвестна. В процессе обработки необходимо определить наиболее эффективный метод и обеспечить его преимущественное использование. Обработка выполняется пакетами, поэтому распределение доходов является гауссовским. Мы рассматриваем случай априори неизвестных математического ожидания и дисперсии одношагового дохода, соответствующих второму действию. Этот случай описывает ситуацию, когда сами пакеты и их количество имеют умеренные или небольшие объемы. Получены рекуррентные уравнения для вычисления байесовского риска и функции потерь, которые затем представлены в инвариантном виде с горизонтом управления, равным единице. Это позволяет получить оценки байесовского и минимаксного рисков, которые справедливы для всех горизонтов управления, кратных количеству обработанных пакетов.

Ключевые фразы: ОДНОРУКИЙ БАНДИТ, ПАКЕТНАЯ ОБРАБОТКА, БАЙЕСОВСКИЙ И МИНИМАКСНЫЙ ПОДХОДЫ, ИНВАРИАНТНОЕ ОПИСАНИЕ, ONE-ARMED BANDIT, BATCH PROCESSING, BAYESIAN AND MINIMAX APPROACHES, INVARIANT DESCRIPTION
Автор (ы): Колногоров Александр Валерианович
Журнал: ВЕСТНИК ЮЖНО-УРАЛЬСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА. СЕРИЯ: МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ И ПРОГРАММИРОВАНИЕ

Идентификаторы и классификаторы

УДК
519.244. Последовательные методы
519.83. Теория игр
eLIBRARY ID
67205356
Для цитирования:
КОЛНОГОРОВ А. В. ИНВАРИАНТНОЕ ОПИСАНИЕ УПРАВЛЕНИЯ В ЗАДАЧЕ О ГАУССОВСКОМ ОДНОРУКОМ БАНДИТЕ // ВЕСТНИК ЮЖНО-УРАЛЬСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА. СЕРИЯ: МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ И ПРОГРАММИРОВАНИЕ. 2024. Т. 17 № 1
Текстовый фрагмент статьи