Текущее состояние обучения с подкреплением и направления на будущее
Автор: Шарибаев А.Н., Шарибаев Р.Н., Абдулазизов Б.Т., Тохиржонова М.Р.
Журнал: Мировая наука @science-j
Рубрика: Основной раздел
Статья в выпуске: 6 (75), 2023 года.
Бесплатный доступ
Обучение с подкреплением - важная отрасль искусственного интеллекта, которая занимается тем, как агенты учатся принимать решения, основанные на вознаграждениях и наказаниях. В этой работе исследуется история развития обучения с подкреплением в ИИ. Работа включает в себя краткое введения в область искусственного интеллекта и различные подходы к машинному обучению.
Искусственный интеллект, разработка алгоритмов, обучение с подкреплением
Короткий адрес: https://sciup.org/140299450
IDR: 140299450
Список литературы Текущее состояние обучения с подкреплением и направления на будущее
- Watkins, C. J., & Dayan, P. (1992). Q-learning. Machine learning, 8(3-4), 279-292.
- Schrittwieser, J., Antonoglou, I., Hubert, T., Simonyan, K., Sifre, L., Schmitt, S., Graepel, T. (2020). Mastering Atari, Go, chess and shogi by planning with a learned model. Nature, 588(7839), 604-609.