Методы прогнозирования когнитивной нагрузки обучающихся в средах электронного обучения с использованием данных отслеживания взгляда
Автор: Аджаи И.Х., Авксентьева Е.Ю.
Рубрика: Информатика и вычислительная техника
Статья в выпуске: 1, 2025 года.
Бесплатный доступ
В статье оцениваются методы машинного обучения для задачи прогнозирования когнитивной нагрузки обучающихся в средах электронного обучения с использованием данных отслеживания взгляда. Основная цель исследования - адаптивное вмешательство в реальном времени для предотвращения когнитивной перегрузки и повышения вовлеченности обучающихся в процесс обучения. В исследовании рассматриваются методы контролируемого обучения, такие как машины опорных векторов (SVM), случайный лес (Random Forest) и логистическая регрессия (Logistic Regression), с использованием симулированных данных отслеживания взгляда обучающихся. Проблема и цели исследования четко определены и сопровождаются всесторонним обзором литературы, в котором рассматривается теория когнитивной нагрузки, отслеживание взгляда и методы машинного обучения в образовательных контекстах. Методология сосредоточена на разработке и обучении моделей с использованием k-кратной перекрестной валидации для обеспечения надежности. Результаты исследования показывают, что Random Forest является самым эффективным методом, демонстрирующим способность улавливать сложные закономерности прогнозирования. Ключевой вклад данного исследования заключается в новом применении интеллектуальных методов для прогнозирования когнитивной нагрузки на основе данных отслеживания взгляда, что повышает прогностические возможности методов машинного обучения. Исследование подчеркивает важность реализации этих методов в реальном времени и проверки на реальных данных обучающихся, а также необходимость решения этических вопросов, связанных с использованием данных отслеживания взгляда в образовательных учреждениях.
Электронное обучение, когнитивная нагрузка, машинное обучение, методы контролируемого обучения, машины опорных векторов, метод случайного леса, логистическая регрессия, отслеживание взгляда, усталость
Короткий адрес: https://sciup.org/148330804
IDR: 148330804 | DOI: 10.18137/RNU.V9187.25.01.P.81
Текст научной статьи Методы прогнозирования когнитивной нагрузки обучающихся в средах электронного обучения с использованием данных отслеживания взгляда
Электронное обучение произвело огромную революцию в сфере образования, сделав широкодоступными учебные материалы и курсы. Одной из важнейших задач в этом цифровом процессе является поддержание вовлеченности учащихся и регулирование когнитивной нагрузки [1].
Интегрируя технологии машинного обучения и отслеживания взгляда, мы стремимся создать интеллектуальную систему прогнозирования когнитивной перегрузки и принятия решений, которая сможет адаптироваться к когнитивным состояниям обучающихся и повышать эффективность учебного процесса [2].
Учащиеся испытывают когнитивную перегрузку, когда их рабочая память перегружена сложностью учебных задач, тогда как большинство обучающихся могут обрабатывать только ограниченное количество информации в любой момент времени [3]. Эта проблема часто усугубляется в среде электронного обучения из-за отсутствия обратной связи с преподавателями в реальном времени, которая обычно доступна при очном обучении. Отслеживая когнитивную перегрузку с помощью технологии отслеживания взгляда, можно динамически корректировать учебный контент, чтобы повысить вовлеченность и за-
Методы прогнозирования когнитивной нагрузки обучающихся в средах электронного обучения с использованием данных отслеживания взгляда поминаемость материала, снижая тем самым когнитивную перегрузку [4]. Эффективное управление когнитивной перегрузкой необходимо для улучшения результатов обучения.
Технология отслеживания взгляда позволяет получить ценную информацию о вовлеченности учащихся. Благодаря таким показателям, как продолжительность фиксации взгляда, скорость саккад, частота моргания, расширение зрачков и др., когнитивная нагрузка может быть определена с помощью цифровых систем видеорегистрации в режиме реального времени [5]. Алгоритмами машинного обучения эти показатели могут быть проанализированы для выявления когнитивной перегрузки и ее закономерности.
Целью данного исследования является проектирование программного модуля мониторинга и прогнозирования когнитивной перегрузки обучающихся на основе алгоритма машинного обучения для системы управления обучением.
Теория когнитивной нагрузки была представлена Дж. Свеллером [6] в 2011 году. Она объясняет умственные усилия, необходимые для обучения и решения проблем, подчеркивает ограничения, возникающие при работе с памятью из-за ограниченного количества информации, которую она может воспринять за один раз. В рамках этой теории выделяется три типа когнитивной нагрузки: внутренняя, внешняя и уместная. Внутренняя нагрузка связана со сложностью изучаемого материала; внешняя включает в себя когнитивную нагрузку, возникающую в результате передачи информации; уместная – это умственные усилия, направленные на создание схем для обучения. Правильное управление когнитивными нагрузками приводит к эффективному учебному процессу, неправильное – к перегрузке когнитивных способностей обучающегося, снижению вовлеченности и результатов обучения.
В среде электронного обучения влияние когнитивной нагрузки невероятно велико из-за способа подачи цифрового контента: интерактивное содержание, постоянные уведомления и мультимедийные презентации – всё это может привести к перегрузке когнитивных ресурсов обучающегося [7]. Особенно остро эта проблема стоит в средах самообучения, где нет обратной связи преподавателя с обучающимися. Без возможности оценить невербальные сигналы, такие как язык тела и движения глаз, системы электронного обучения не могут динамически подстраиваться под потребности учащихся, что приводит к когнитивной перегрузке [8].
Использование технологии отслеживания взгляда (продолжительность фиксации взгляда, частота морганий и др.) является одним из наиболее перспективных подходов к определению когнитивной нагрузки [9]. Исследования показали, что более длительная фиксация может указывать на когнитивную перегрузку, в то время как более короткая или рассеянная фиксация может свидетельствовать о невовлеченности в учебный процесс.
В среде, где учащиеся должны одновременно обрабатывать визуальную и слуховую информацию (мультимодальная учебная среда), задача когнитивной нагрузки резко возрастает. Исследование Р. Майера [10] подтвердило, что учащиеся получают пользу от принципов мультимедиа, однако чрезмерное их использование может увеличить внешнюю когнитивную нагрузку.
Дополнительную когнитивную нагрузку в электронное обучение вносит использование иммерсивных технологий, таких как виртуальная реальность (VR) и дополненная реальность (AR), поскольку они способствуют более глубокому обучению, погружая учащихся в реалистичную среду [2; 11]. Это подчеркивает важность разработки платформ
Вестник Российского нового университета
Серия «Сложные системы: модели, анализ и управление», выпуск 1 за 2025 год электронного обучения, позволяющих сбалансировать когнитивную нагрузку за счет интеграции алгоритмов отслеживания взгляда и машинного обучения.
Последние исследования расширили понимание когнитивной нагрузки, особенно в цифровой среде. В работе О. Чен и С. Калюга [3] подчеркивается роль опыта в модерации влияния когнитивной нагрузки: обучающиеся с разными предварительными знаниями по-разному переживают когнитивную перегрузку, что подчеркивает важность адаптивных систем электронного обучения, учитывающих индивидуальные особенности обучающихся.
В статье Т. Де Йонг [12] отмечается, что сильный эмоциональный стресс может усугубить когнитивную перегрузку, поэтому учет эмоциональных состояний в системах электронного обучения может оптимизировать подачу контента и результаты обучения.
Таким образом, управление когнитивной нагрузкой имеет решающее значение для повышения эффективности обучения в среде электронного обучения.
Определение когнитивной нагрузки в электронном обучении во внеурочное время эволюционировало от самоотчета и анализа поведения к более сложным методам, работающим в режиме реального времени. Ранние подходы, такие как NASA-TLX (индекс нагрузки на задачу), давали субъективную оценку когнитивной нагрузки, служили косвенными индикаторами и были не способны обеспечить обратную связь в режиме реального времени [13].
Машинное обучение изменило определение когнитивной нагрузки, улучшив анализ данных о взгляде. В статье Ф. Чжоу и др. [14] машинное обучение использовано для анализа данных о взгляде с целью повышения вовлеченности в процесс обучения вождению и снижения когнитивной перегрузки. Исследователи С. Солхью и др. [15], наряду с отслеживанием взгляда, применяли физиологические маркеры, такие как вариабельность сердечного ритма (HRV) и кожная проводимость. Такой мультимодальный подход особенно полезен для выявления тонких когнитивных сдвигов, которые могут быть недоступны только при отслеживании взгляда. Ученые М.У. Икбал и др. [16] обнаружили, что объединение сигналов электроэнцефалограммы (ЭЭГ) с технологией отслеживания взгляда улучшает определение когнитивной нагрузки в реальном времени.
Алгоритмы контролируемого обучения, такие как деревья решений и нейронные сети, используются для прогнозирования будущих оценок, анализа характера взаимодействия студентов, результатов выполнения заданий и тестов, предсказывая вероятную неуспеваемость или отсев студентов и позволяя преподавателям вмешаться в процесс на ранних этапах обучения. В исследовании Се Ж. и др. [17] использованы модели ML для распознавания атипичного зрительного внимания при расстройстве аутистического спектра. Методы колла-боративной фильтрации, на основе алгоритмов машинного обучения, могут использоваться для предложения персонализированных курсов и материалов с учетом особых потребностей или предпочтений обучающегося, повышая их вовлеченность и удовлетворенность [18].
Китайские ученые Ли X. и др. [19] разработали модель обучения с подкреплением, которая корректирует подачу контента в зависимости от производительности и когнитивного состояния обучающегося, предлагая вмешательство в режиме реального времени для предотвращения когнитивной перегрузки. Благодаря имитации различных условий обучения их исследование позволило добиться лучшего обобщения моделей при их применении к реальным данным.
Несмотря на то что в исследованиях такие алгоритмы, как машины опорных векторов (SVM), нейронные сети и деревья решений, применялись независимо друг от друга, сравне-
Методы прогнозирования когнитивной нагрузки обучающихся в средах электронного обучения с использованием данных отслеживания взгляда ние этих алгоритмов с точки зрения точности и адаптируемости к различным условиям обучения смогло дать ценные сведения о том, какие методы лучше работают в различных условиях.
Таким образом, машинное обучение уже давно стало ведущим трансформационным инструментом в анализе образовательных данных, позволяя создавать индивидуальные и адаптивные учебные программы для обучающихся. Использование машинного обучения для анализа данных в образовании расширило возможности преподавателей по прогнозированию результатов обучения, адаптации учебного контента и предоставлению персонализированных рекомендаций, что в конечном итоге способствовало созданию более эффективной и увлекательной учебной среды.
В данном исследовании используются методы контролируемого обучения для мониторинга и прогнозирования когнитивной перегрузки на основе данных отслеживания взгляда обучающегося. Основная цель – использование алгоритмов машинного обучения для прогнозирования уровня когнитивной нагрузки в реальном времени и предоставления адаптивных техник в среду электронного обучения. Процесс включает в себя моделирование данных отслеживания взгляда, выбор и обучение методов машинного обучения, проверку их точности с помощью соответствующих метрик. В данном исследовании сравниваются традиционные методы, такие как машины опорных векторов (SVM), логистическая регрессия и случайный лес, для определения наиболее эффективных методов для прогнозирования когнитивной перегрузки. Данные методы будут обучены на симулированном наборе данных, а затем протестированы на реальных данных, собранных с платформы электронного обучения. Цель – оценить, какой алгоритм лучше предсказывает когнитивную перегрузку учащихся на основе анализа взгляда.
Критерии выбора моделей – эффективность в задачах контролируемого обучения и способность обрабатывать многомерную природу данных отслеживания взгляда без сложностей глубокого обучения в режиме реального времени.
Методы обучения и валидации. Обучение и проверка методов машинного обучения являются ключевым этапом данного исследования для обеспечения точных и надежных прогнозов когнитивной нагрузки.
Настройка обучающих данных. Симулированные данные разделены на обучающие и тестовые наборы данных по принципу 80/20, где 80 % данных используется для обучения, 20 % – для проверки работы модели на тестовых данных.
Методы перекрестной валидации. Использована кросс-валидация k-fold. Обучающий набор данных делится на k подмножеств (обычно k = 5 или 10), модель обучается на k – 1 подмножестве и проверяется на оставшемся подмножестве. Этот процесс повторяется k раз, после чего вычисляется средняя производительность по всем подмножествам.
Метрики эффективности. Для оценки эффективности моделей машинного обучения использованы следующие показатели эффективности:
-
• Accuracy – доля правильно предсказанных состояний когнитивной нагрузки среди всех предсказаний;
-
• Precision – доля истинно положительных случаев состояний перегрузки среди всех предсказанных случаев перегрузки;
-
• Recall – процент реальных случаев состояний перегрузки, которые модель определила правильно;
-
• F1-Score – среднее гармоническое значение показателей precision и recall, обеспечивающее сбалансированную оценку эффективности модели.
Вестник Российского нового университета
Серия «Сложные системы: модели, анализ и управление», выпуск 1 за 2025 год
Показатели позволяют понять, насколько хорошо каждый алгоритм справляется с классификацией уровней когнитивной нагрузки и какая модель обеспечивает наиболее надежные прогнозы в режиме реального времени.
Оценка производительности методов
Представлена оценка производительности логистической регрессии, случайного леса и машины опорных векторов (SVM). Каждый алгоритм был обучен и оценен с помощью 5-кратной кросс-валидации для обеспечения надежности в таких показателях, как Accuracy, Precision, Recall и F1-Score; k-кратная кросс-валидация гарантирует, что модели хорошо обобщаются на тестовых данных путем разбиения набора данных на пять отдельных групп. Это предотвращает перебор и обеспечивает более полную оценку эффективности метода.
Логистическая регрессия (Logistic Regression) – простая линейная модель для оценки более сложных алгоритмов. Модель была обучена с помощью решателя Sagaс максимумом в 500 итераций для обеспечения сходимости (см. Таблицу 1).
Таблица 1
Результаты перекрестной валидации логистической регрессии
Метрики |
Logistic Regression (Mean) |
Accuracy |
0,957 |
Precision |
0,791 |
Recall |
0,697 |
F1-Score |
0,741 |
Источник: здесь и далее таблицы составлены авторами.
Метод показал хорошую общую производительность с точностью 92,35 %. Однако, учитывая ее линейную природу, логистическая регрессия может не справиться с отражением нелинейных связей в данных отслеживания взгляда.
Случайные леса (Random Forests) – ансамблевый метод на основе деревьев решений, хорошо подходящий для задач классификации с зашумленными данными. Алгоритм строит несколько деревьев решений и объединяет их предсказания, что делает его устойчивым к перестройке (см. Таблицу 2).
Таблица 2
Результаты перекрестной валидации случайного леса
Метрики |
Random Forest (Mean) |
Accuracy |
0,9786 |
Precision |
0,9701 |
Recall |
0,9628 |
F1-Score |
0,9664 |
Метод продемонстрировал высокую производительность по всем метрикам с точностью 97,86 %. Его способность обрабатывать большие объемы данных слежения за взглядом и улавливать сложные закономерности делает его сильным кандидатом для применения в реальном мире.
Методы прогнозирования когнитивной нагрузки обучающихся в средах электронного обучения с использованием данных отслеживания взгляда
Машины опорных векторов (SVM – Support Vector Machine) – обучен с использованием ядра радиальной базисной функции ( Radial Basis Function – RBF ), что позволяет моделировать нелинейные зависимости, которые эффективны в высокоразмерных пространствах, хорошо работают для задач бинарной и мультиклассовой классификации, используются для классификации уровней когнитивной нагрузки (низкий, средний, высокий) на основе данных отслеживания взгляда (см. Таблицу 3).
Таблица 3
Результат перекрестной валидации машины опорных векторов
Метрики |
SVM (Mean) |
Accuracy |
0,957 |
Precision |
0,791 |
Recall |
0,697 |
F1-Score |
0,741 |
Метод показал хорошие результаты, сбалансировав Precision и Recall, что свидетельствует о том, что он эффективно справляется как с когнитивной перегрузкой, так и с нормальным состоянием. Метод уступает Random Forest, однако продемонстрировал надежное обобщение.
Сводные результаты методов представлены в Таблице 4.
Таблица 4
Результаты кросс-валидации для всех методов
Метод |
Accuracy |
Precision |
Recall |
F1-Score |
Logistic Regression |
0,957 |
0,955 |
0,957 |
0,955 |
Random Forest |
0,9786 |
0,9701 |
0,9628 |
0,9664 |
Support Vector Machine |
0,989 |
0,989 |
0,9425 |
0,989 |
Таким образом, Random Forest оказался самым эффективным методом, обеспечив наивысшую точность и сбалансированные показатели достоверности, чувствительности и F1-Score. Ансамблевые методы отлично справляются с выявлением сложных закономерностей в данных отслеживания взгляда, что делает их пригодными для реального применения в средах электронного обучения. Более простые методы, такие как логистическая регрессия, показали достаточно хорошие результаты, что говорит о том, что они тоже могут быть использованы в некоторых сценариях.
Сравнение эффективности моделей
Random Forest является сильной альтернативой для наборов данных с нелинейными закономерностями. SVM предлагает баланс между простотой и производительностью, но немного отстает от ансамблевых моделей по показателям Recall и F1-Score. Логистическая регрессия полезна для более простых, легкоинтерпретируемых моделей, но она с трудом справляется с отражением сложных взаимосвязей в данных.
Высокие показатели Random Forest при прогнозировании когнитивной перегрузки согласуются с недавними результатами [20], которые показали, что ансамблевые методы
Вестник Российского нового университета
Серия «Сложные системы: модели, анализ и управление», выпуск 1 за 2025 год очень эффективны при обработке сложных, нелинейных взаимосвязей в образовательных данных. Использование данных отслеживания взгляда повышает прогностические возможности моделей машинного обучения, предоставляя подробную информацию о поведении обучающегося и особенностях его внимания.
Применение для управления когнитивной нагрузкой в электронном обучении
Прогнозирование когнитивной нагрузки в реальном времени имеет огромное значение для адаптивных платформ электронного обучения. Динамическая регулировка сложности учебных материалов на основе определения когнитивной нагрузки в реальном времени может значительно повысить вовлеченность учащихся и их способность удерживать внимание. Адаптивные системы обучения, реагирующие на когнитивную нагрузку, помогают предотвратить когнитивную перегрузку и гарантировать, что учащиеся остаются в оптимальной зоне обучения. Использование имитационных данных в исследовании обеспечивает контролируемую среду для обучения моделей и бывает необходимо на ранних этапах разработки моделей, когда реальных данных не хватает. Однако методы, обученные на симулированных данных, могут плохо обобщаться с реальными сценариями, особенно когда речь идет о высокодинамичном поведении, таком как когнитивная нагрузка. Поэтому, хотя методы в данном исследовании хорошо показали себя на симулированных данных, важно проверить их на реальных наборах данных, чтобы убедиться в их надежности и практическом применении.
Потенциал применения этих моделей в реальных платформах электронного обучения весьма значителен [21]. Интеграция машинного обучения с данными отслеживания взгляда в реальном времени может дать немедленное представление о вовлеченности ученика, что позволяет адаптировать процесс обучения. Авторы обзора по адаптивному обучению [22] подчеркнули проблемы масштабирования таких систем, связанные с обработкой больших объемов данных в режиме реального времени.
Результаты данного исследования согласуются с последними достижениями в области машинного обучения и прогнозирования когнитивной нагрузки, особенно в контексте электронного обучения. Случайный лес оказался наиболее эффективным методом бинарного прогнозирования когнитивной нагрузки, предлагая высокую точность и сбалансированное соотношение доли истинно положительных случаев состояний когнитивной перегрузки и процента реальных случаев состояний когнитивной перегрузки. Потенциал применения в реальном времени очевиден, но необходима дальнейшая проверка методов на реальных данных. Будущие исследования должны быть направлены на решение проблем масштабируемости и этических проблем, связанных с использованием данных отслеживания взгляда в адаптивных системах обучения.