Обобщение метода смешивания апостериорных распределений на несчетное множество экспертов
Автор: Зухба Р.Д., Зухба А.В.
Журнал: Труды Московского физико-технического института @trudy-mipt
Рубрика: Математика
Статья в выпуске: 4 (68) т.17, 2025 года.
Бесплатный доступ
В работе [2] рассматривается задача агрегирования конечного множества экспертов и требуется минимизировать регрет по сравнению с произвольным составным экспертом. Регрет в такой задаче имеет порядок Θ(𝑘 ln𝑁), то есть он неограниченно растет с ростом количества экспертов 𝑁. В данной работе рассматривается такая же постановка задачи, но с несчетным множеством экспертов 𝒩 = [𝑐, 𝑑]. Для решения этой задачи предложено обобщение метода смешивания апостериорных распределений (MPP) на несчетное множество экспертов. Получены оценки снизу на регрет любого алгоритма, решающего эту задачу. Предложено обобщение стандартного метода оценки сверху потерь алгоритмов, родственных MPP, использующее дополнительную информацию о потерях отдельных экспертов.
Непрерывное машинное обучение, прогнозирующие алгоритмы, обучение с учителем, экспертные стратегии, регрет, составной эксперт, оценка регрета снизу, оценка регрета сверху
Короткий адрес: https://sciup.org/142247123
IDR: 142247123 | УДК: 519.6