Предельное описание в задаче о гауссовском одноруком бандите с обоими неизвестными параметрами

Бесплатный доступ

Мы рассматриваем предельное описание управления в задаче о гауссовском одноруком бандите, которая является математической моделью оптимизации пакетной обработки больших данных при наличии двух альтернативных методов с известной эффективностью первого метода. Установлено, что это описание дается дифференциальным уравнением в частных производных второго порядка, в котором дисперсия одношаговых доходов является известной. Этот результат означает, что в случае больших данных дисперсия может быть сколь угодно точно оценена на коротком начальном этапе обработки, а затем полученная оценка использована управляющей стратегией.

Однорукий бандит, байесовский и минимаксный подходы, инвариантное описание, пакетная обработка

Короткий адрес: https://sciup.org/147248009

IDR: 147248009   |   DOI: 10.14529/mmp250103

Статья научная