Сравнительный анализ регрессионных моделей машинного обучения для прогнозирования результатов ЕГЭ по математике выпускников города Москвы
Автор: Шлипаков Е.В., Щербаков Д.Е., Ященко И.В.
Журнал: Труды Московского физико-технического института @trudy-mipt
Рубрика: Информатика и управление
Статья в выпуске: 3 (67) т.17, 2025 года.
Бесплатный доступ
Рассматривается применение и сравнение качества работы пяти методов регрессионного анализа для прогнозирования результатов Единого государственного экзамена (ЕГЭ) по математике (профильный уровень) у выпускников Москвы 2023/24 учебного года. В исследовании были обучены пять различных моделей: Ridgeи Lasso-регрессия, случайный лес, градиентный бустинг на решающих деревьях и полносвязная нейронная сеть. В качестве признаков были использованы результаты Основного государственного экзамена (ОГЭ) по всем предметам, успехи во Всероссийской и Московской олимпиадах школьников, а также школьные оценки. Лучшие результаты были получены с помощью нейронной сети (MAE = 7,98; MAPE = 12,41% на валидации; MAE = 8,17; MAPE = 12,63% на тесте). Также в работе выявлены наиболее важные признаки для построенной модели: балл ОГЭ по математике ученика и всего класса, а также общие результаты ОГЭ ученика и средний балл по математическим предметам в выпускном классе. Полученные результаты позволяют заранее оценить, какой балл может получить ученик на ЕГЭ, и организовать дополнительные мероприятия, направленные на повышение итоговой оценки.
Инное обучение, задача и алгоритмы регрессии, прогностические модели, ЕГЭ, качество образования, нейронные сети
Короткий адрес: https://sciup.org/142245840
IDR: 142245840 | УДК: 004.855.5, 519.237.5, 372.851
Comparative Analysis of Machine Learning Regression Models for Predicting Mathematics Unified StateExam Scores of Moscow Graduates
In this study, five regression algorithms — Ridge- and Lasso-Regression, Random Forest, Gradient Boosted Decision Trees, and a fully connected neural network — were implemented and compared for predicting 2023/24 Unified State Exam (USE) mathematics (advanced level) scores of Moscow graduates. Models were trained using features that include Basic State Exam (BSE) results across all subjects, achievements in the All-Russian and Moscow school Olympiads, and school grades. The neural network achieved the best performance (MAE = 7.98; MAPE = 12.41% on the validation set; MAE = 8.17; MAPE = 12.63% on the test set). Feature-importance analysis identified the student’s and class’s average BSE math scores, the student’s overall BSE results, and average grades in mathematics subjects as the most influential predictors. These results enable early estimation of a student’s likely USE score and support the development of targeted interventions to enhance final exam performance.