Предельное описание в задаче о гауссовском одноруком бандите с обоими неизвестными параметрами
Бесплатный доступ
Мы рассматриваем предельное описание управления в задаче о гауссовском одноруком бандите, которая является математической моделью оптимизации пакетной обработки больших данных при наличии двух альтернативных методов с известной эффективностью первого метода. Установлено, что это описание дается дифференциальным уравнением в частных производных второго порядка, в котором дисперсия одношаговых доходов является известной. Этот результат означает, что в случае больших данных дисперсия может быть сколь угодно точно оценена на коротком начальном этапе обработки, а затем полученная оценка использована управляющей стратегией.
Однорукий бандит, байесовский и минимаксный подходы, инвариантное описание, пакетная обработка
Короткий адрес: https://sciup.org/147248009
IDR: 147248009 | DOI: 10.14529/mmp250103