Обучение с подкреплением: введение

Автор: Ротова О.М., Шибанова А.Д.

Журнал: Теория и практика современной науки @modern-j

Рубрика: Математика, информатика и инженерия

Статья в выпуске: 1 (55), 2020 года.

Бесплатный доступ

В данной статье рассмотрены основные положения алгоритма машинного обучения с подкреплением. Сформулированы модели обучения с подкреплением. Также рассмотрены три фундаментальные проблемы, которые обучение с подкреплением должно решить: компромисс между исследованием и эксплуатацией, проблема отсроченного вознаграждения и необходимость обобщения.

Искусственный интеллект, машинное обучение, обучение с подкреплением, марковские процессы принятия решений, переходы состояний, вознаграждение

Короткий адрес: https://sciup.org/140275028

IDR: 140275028

Список литературы Обучение с подкреплением: введение

  • Баранов В.В. Процессы принятия управляющих решений, мотивированных интересами. ФИЗМАТЛИТ, 2005. - 296c.
  • Саттон Ричард С., Барто Эндрю Г. Обучение с подкреплением. Бином. Лаборатория знаний, 2017. - 400с.
  • Mahdi Naser-Moghadasi. The Incremental Pruning Filters for POMDPs - Past Present Future. LAP LAMBERT Academic Publishing, 2012. - 68с.
Статья научная