Стратегии оптимизации и методы оценки для точной настройки больших языковых моделей

Автор: Денисенко В.В., Чесников Л.С.

Журнал: Международный журнал гуманитарных и естественных наук @intjournal

Рубрика: Технические науки

Статья в выпуске: 4-1 (91), 2024 года.

Бесплатный доступ

В данной статье представлен обзор стратегий оптимизации и методов оценки эффективности дообучения больших языковых моделей. Рассмотрены ключевые аспекты выбора функции потерь, оптимизатора и настройки скорости обучения, а также методы оценки эффективности дообучения, включая сравнительные эксперименты и специальные техники анализа. Приведены выводы о значимости дообучения для развития области NLP и его будущих направлениях.

Дообучение, языковые модели, оптимизация, оценка эффективности, функция потерь, оптимизатор, скорость обучения, переобучение, анализ чувствительности, кросс-валидация

Короткий адрес: https://sciup.org/170204831

IDR: 170204831   |   DOI: 10.24412/2500-1000-2024-4-1-180-184

Список литературы Стратегии оптимизации и методы оценки для точной настройки больших языковых моделей

  • Решение задач информационной безопасности с использованием искусственного интеллекта / А.В. Скрыпников, В.В. Денисенко, Е.Г. Хитров [и др.] // Современные наукоемкие технологии. - 2021. - № 6-2. - С. 277-281. DOI: 10.17513/snt.38734 EDN: LMFNLR
  • Недогарок, В.В. Применение искусственного интеллекта для обработки данных / В.В. Недогарок // WORLD SCIENCE: PROBLEMS AND INNOVATIONS: сборник статей LIX Международной научно-практической конференции, Пенза, 30 ноября 2021 года. - Пенза: Наука и Просвещение (ИП Гуляев Г.Ю.), 2021. - С. 70-72. EDN: NPAXCC
  • Верезубова, Н.А. Технологии искусственного интеллекта в процессах обработки информации / Н.А. Верезубова, Н.В. Петракова, М.А. Петраков // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и технические науки. - 2023. - № 9-2. - С. 58-62. DOI: 10.37882/2223-2982.2023.9-2.05 EDN: LTDUPS
  • Шотыло Д.М., Крайнова В.Е., Скурыдин А.В. Тенденции развития искусственных нейронных сетей в цифровой экономике // ЭКОНОМИНФО. - 2018. - №4. - С. 65-69. EDN: YPSCNN
  • Распознавание рукописного текста с использованием нейронных сетей / А.В. Скрыпников, В.В. Денисенко, Е.Г. Хитров [и др.] // Современные наукоемкие технологии. - 2021. - № 6-1. - С. 91-95. DOI: 10.17513/snt.38703 EDN: EZVXSB
Еще
Статья научная