Обучение с подкреплением: введение
Автор: Ротова О.М., Шибанова А.Д.
Журнал: Теория и практика современной науки @modern-j
Рубрика: Математика, информатика и инженерия
Статья в выпуске: 1 (55), 2020 года.
Бесплатный доступ
В данной статье рассмотрены основные положения алгоритма машинного обучения с подкреплением. Сформулированы модели обучения с подкреплением. Также рассмотрены три фундаментальные проблемы, которые обучение с подкреплением должно решить: компромисс между исследованием и эксплуатацией, проблема отсроченного вознаграждения и необходимость обобщения.
Искусственный интеллект, машинное обучение, обучение с подкреплением, марковские процессы принятия решений, переходы состояний, вознаграждение
Короткий адрес: https://sciup.org/140275028
IDR: 140275028
Список литературы Обучение с подкреплением: введение
- Баранов В.В. Процессы принятия управляющих решений, мотивированных интересами. ФИЗМАТЛИТ, 2005. - 296c.
- Саттон Ричард С., Барто Эндрю Г. Обучение с подкреплением. Бином. Лаборатория знаний, 2017. - 400с.
- Mahdi Naser-Moghadasi. The Incremental Pruning Filters for POMDPs - Past Present Future. LAP LAMBERT Academic Publishing, 2012. - 68с.