Методы прогнозирования когнитивной нагрузки обучающихся в средах электронного обучения с использованием данных отслеживания взгляда

Бесплатный доступ

В статье оцениваются методы машинного обучения для задачи прогнозирования когнитивной нагрузки обучающихся в средах электронного обучения с использованием данных отслеживания взгляда. Основная цель исследования - адаптивное вмешательство в реальном времени для предотвращения когнитивной перегрузки и повышения вовлеченности обучающихся в процесс обучения. В исследовании рассматриваются методы контролируемого обучения, такие как машины опорных векторов (SVM), случайный лес (Random Forest) и логистическая регрессия (Logistic Regression), с использованием симулированных данных отслеживания взгляда обучающихся. Проблема и цели исследования четко определены и сопровождаются всесторонним обзором литературы, в котором рассматривается теория когнитивной нагрузки, отслеживание взгляда и методы машинного обучения в образовательных контекстах. Методология сосредоточена на разработке и обучении моделей с использованием k-кратной перекрестной валидации для обеспечения надежности. Результаты исследования показывают, что Random Forest является самым эффективным методом, демонстрирующим способность улавливать сложные закономерности прогнозирования. Ключевой вклад данного исследования заключается в новом применении интеллектуальных методов для прогнозирования когнитивной нагрузки на основе данных отслеживания взгляда, что повышает прогностические возможности методов машинного обучения. Исследование подчеркивает важность реализации этих методов в реальном времени и проверки на реальных данных обучающихся, а также необходимость решения этических вопросов, связанных с использованием данных отслеживания взгляда в образовательных учреждениях.

Еще

Электронное обучение, когнитивная нагрузка, машинное обучение, методы контролируемого обучения, машины опорных векторов, метод случайного леса, логистическая регрессия, отслеживание взгляда, усталость

Короткий адрес: https://sciup.org/148330804

IDR: 148330804   |   DOI: 10.18137/RNU.V9187.25.01.P.81

Текст научной статьи Методы прогнозирования когнитивной нагрузки обучающихся в средах электронного обучения с использованием данных отслеживания взгляда

Электронное обучение произвело огромную революцию в сфере образования, сделав широкодоступными учебные материалы и курсы. Одной из важнейших задач в этом цифровом процессе является поддержание вовлеченности учащихся и регулирование когнитивной нагрузки [1].

Интегрируя технологии машинного обучения и отслеживания взгляда, мы стремимся создать интеллектуальную систему прогнозирования когнитивной перегрузки и принятия решений, которая сможет адаптироваться к когнитивным состояниям обучающихся и повышать эффективность учебного процесса [2].

Учащиеся испытывают когнитивную перегрузку, когда их рабочая память перегружена сложностью учебных задач, тогда как большинство обучающихся могут обрабатывать только ограниченное количество информации в любой момент времени [3]. Эта проблема часто усугубляется в среде электронного обучения из-за отсутствия обратной связи с преподавателями в реальном времени, которая обычно доступна при очном обучении. Отслеживая когнитивную перегрузку с помощью технологии отслеживания взгляда, можно динамически корректировать учебный контент, чтобы повысить вовлеченность и за-

Методы прогнозирования когнитивной нагрузки обучающихся в средах электронного обучения с использованием данных отслеживания взгляда поминаемость материала, снижая тем самым когнитивную перегрузку [4]. Эффективное управление когнитивной перегрузкой необходимо для улучшения результатов обучения.

Технология отслеживания взгляда позволяет получить ценную информацию о вовлеченности учащихся. Благодаря таким показателям, как продолжительность фиксации взгляда, скорость саккад, частота моргания, расширение зрачков и др., когнитивная нагрузка может быть определена с помощью цифровых систем видеорегистрации в режиме реального времени [5]. Алгоритмами машинного обучения эти показатели могут быть проанализированы для выявления когнитивной перегрузки и ее закономерности.

Целью данного исследования является проектирование программного модуля мониторинга и прогнозирования когнитивной перегрузки обучающихся на основе алгоритма машинного обучения для системы управления обучением.

Теория когнитивной нагрузки была представлена Дж. Свеллером [6] в 2011 году. Она объясняет умственные усилия, необходимые для обучения и решения проблем, подчеркивает ограничения, возникающие при работе с памятью из-за ограниченного количества информации, которую она может воспринять за один раз. В рамках этой теории выделяется три типа когнитивной нагрузки: внутренняя, внешняя и уместная. Внутренняя нагрузка связана со сложностью изучаемого материала; внешняя включает в себя когнитивную нагрузку, возникающую в результате передачи информации; уместная – это умственные усилия, направленные на создание схем для обучения. Правильное управление когнитивными нагрузками приводит к эффективному учебному процессу, неправильное – к перегрузке когнитивных способностей обучающегося, снижению вовлеченности и результатов обучения.

В среде электронного обучения влияние когнитивной нагрузки невероятно велико из-за способа подачи цифрового контента: интерактивное содержание, постоянные уведомления и мультимедийные презентации – всё это может привести к перегрузке когнитивных ресурсов обучающегося [7]. Особенно остро эта проблема стоит в средах самообучения, где нет обратной связи преподавателя с обучающимися. Без возможности оценить невербальные сигналы, такие как язык тела и движения глаз, системы электронного обучения не могут динамически подстраиваться под потребности учащихся, что приводит к когнитивной перегрузке [8].

Использование технологии отслеживания взгляда (продолжительность фиксации взгляда, частота морганий и др.) является одним из наиболее перспективных подходов к определению когнитивной нагрузки [9]. Исследования показали, что более длительная фиксация может указывать на когнитивную перегрузку, в то время как более короткая или рассеянная фиксация может свидетельствовать о невовлеченности в учебный процесс.

В среде, где учащиеся должны одновременно обрабатывать визуальную и слуховую информацию (мультимодальная учебная среда), задача когнитивной нагрузки резко возрастает. Исследование Р. Майера [10] подтвердило, что учащиеся получают пользу от принципов мультимедиа, однако чрезмерное их использование может увеличить внешнюю когнитивную нагрузку.

Дополнительную когнитивную нагрузку в электронное обучение вносит использование иммерсивных технологий, таких как виртуальная реальность (VR) и дополненная реальность (AR), поскольку они способствуют более глубокому обучению, погружая учащихся в реалистичную среду [2; 11]. Это подчеркивает важность разработки платформ

Вестник Российского нового университета

Серия «Сложные системы: модели, анализ и управление», выпуск 1 за 2025 год электронного обучения, позволяющих сбалансировать когнитивную нагрузку за счет интеграции алгоритмов отслеживания взгляда и машинного обучения.

Последние исследования расширили понимание когнитивной нагрузки, особенно в цифровой среде. В работе О. Чен и С. Калюга [3] подчеркивается роль опыта в модерации влияния когнитивной нагрузки: обучающиеся с разными предварительными знаниями по-разному переживают когнитивную перегрузку, что подчеркивает важность адаптивных систем электронного обучения, учитывающих индивидуальные особенности обучающихся.

В статье Т. Де Йонг [12] отмечается, что сильный эмоциональный стресс может усугубить когнитивную перегрузку, поэтому учет эмоциональных состояний в системах электронного обучения может оптимизировать подачу контента и результаты обучения.

Таким образом, управление когнитивной нагрузкой имеет решающее значение для повышения эффективности обучения в среде электронного обучения.

Определение когнитивной нагрузки в электронном обучении во внеурочное время эволюционировало от самоотчета и анализа поведения к более сложным методам, работающим в режиме реального времени. Ранние подходы, такие как NASA-TLX (индекс нагрузки на задачу), давали субъективную оценку когнитивной нагрузки, служили косвенными индикаторами и были не способны обеспечить обратную связь в режиме реального времени [13].

Машинное обучение изменило определение когнитивной нагрузки, улучшив анализ данных о взгляде. В статье Ф. Чжоу и др. [14] машинное обучение использовано для анализа данных о взгляде с целью повышения вовлеченности в процесс обучения вождению и снижения когнитивной перегрузки. Исследователи С. Солхью и др. [15], наряду с отслеживанием взгляда, применяли физиологические маркеры, такие как вариабельность сердечного ритма (HRV) и кожная проводимость. Такой мультимодальный подход особенно полезен для выявления тонких когнитивных сдвигов, которые могут быть недоступны только при отслеживании взгляда. Ученые М.У. Икбал и др. [16] обнаружили, что объединение сигналов электроэнцефалограммы (ЭЭГ) с технологией отслеживания взгляда улучшает определение когнитивной нагрузки в реальном времени.

Алгоритмы контролируемого обучения, такие как деревья решений и нейронные сети, используются для прогнозирования будущих оценок, анализа характера взаимодействия студентов, результатов выполнения заданий и тестов, предсказывая вероятную неуспеваемость или отсев студентов и позволяя преподавателям вмешаться в процесс на ранних этапах обучения. В исследовании Се Ж. и др. [17] использованы модели ML для распознавания атипичного зрительного внимания при расстройстве аутистического спектра. Методы колла-боративной фильтрации, на основе алгоритмов машинного обучения, могут использоваться для предложения персонализированных курсов и материалов с учетом особых потребностей или предпочтений обучающегося, повышая их вовлеченность и удовлетворенность [18].

Китайские ученые Ли X. и др. [19] разработали модель обучения с подкреплением, которая корректирует подачу контента в зависимости от производительности и когнитивного состояния обучающегося, предлагая вмешательство в режиме реального времени для предотвращения когнитивной перегрузки. Благодаря имитации различных условий обучения их исследование позволило добиться лучшего обобщения моделей при их применении к реальным данным.

Несмотря на то что в исследованиях такие алгоритмы, как машины опорных векторов (SVM), нейронные сети и деревья решений, применялись независимо друг от друга, сравне-

Методы прогнозирования когнитивной нагрузки обучающихся в средах электронного обучения с использованием данных отслеживания взгляда ние этих алгоритмов с точки зрения точности и адаптируемости к различным условиям обучения смогло дать ценные сведения о том, какие методы лучше работают в различных условиях.

Таким образом, машинное обучение уже давно стало ведущим трансформационным инструментом в анализе образовательных данных, позволяя создавать индивидуальные и адаптивные учебные программы для обучающихся. Использование машинного обучения для анализа данных в образовании расширило возможности преподавателей по прогнозированию результатов обучения, адаптации учебного контента и предоставлению персонализированных рекомендаций, что в конечном итоге способствовало созданию более эффективной и увлекательной учебной среды.

В данном исследовании используются методы контролируемого обучения для мониторинга и прогнозирования когнитивной перегрузки на основе данных отслеживания взгляда обучающегося. Основная цель – использование алгоритмов машинного обучения для прогнозирования уровня когнитивной нагрузки в реальном времени и предоставления адаптивных техник в среду электронного обучения. Процесс включает в себя моделирование данных отслеживания взгляда, выбор и обучение методов машинного обучения, проверку их точности с помощью соответствующих метрик. В данном исследовании сравниваются традиционные методы, такие как машины опорных векторов (SVM), логистическая регрессия и случайный лес, для определения наиболее эффективных методов для прогнозирования когнитивной перегрузки. Данные методы будут обучены на симулированном наборе данных, а затем протестированы на реальных данных, собранных с платформы электронного обучения. Цель – оценить, какой алгоритм лучше предсказывает когнитивную перегрузку учащихся на основе анализа взгляда.

Критерии выбора моделей – эффективность в задачах контролируемого обучения и способность обрабатывать многомерную природу данных отслеживания взгляда без сложностей глубокого обучения в режиме реального времени.

Методы обучения и валидации. Обучение и проверка методов машинного обучения являются ключевым этапом данного исследования для обеспечения точных и надежных прогнозов когнитивной нагрузки.

Настройка обучающих данных. Симулированные данные разделены на обучающие и тестовые наборы данных по принципу 80/20, где 80 % данных используется для обучения, 20 % – для проверки работы модели на тестовых данных.

Методы перекрестной валидации. Использована кросс-валидация k-fold. Обучающий набор данных делится на k подмножеств (обычно k = 5 или 10), модель обучается на k – 1 подмножестве и проверяется на оставшемся подмножестве. Этот процесс повторяется k раз, после чего вычисляется средняя производительность по всем подмножествам.

Метрики эффективности. Для оценки эффективности моделей машинного обучения использованы следующие показатели эффективности:

  •    Accuracy – доля правильно предсказанных состояний когнитивной нагрузки среди всех предсказаний;

  •    Precision – доля истинно положительных случаев состояний перегрузки среди всех предсказанных случаев перегрузки;

  •    Recall – процент реальных случаев состояний перегрузки, которые модель определила правильно;

  •    F1-Score – среднее гармоническое значение показателей precision и recall, обеспечивающее сбалансированную оценку эффективности модели.

Вестник Российского нового университета

Серия «Сложные системы: модели, анализ и управление», выпуск 1 за 2025 год

Показатели позволяют понять, насколько хорошо каждый алгоритм справляется с классификацией уровней когнитивной нагрузки и какая модель обеспечивает наиболее надежные прогнозы в режиме реального времени.

Оценка производительности методов

Представлена оценка производительности логистической регрессии, случайного леса и машины опорных векторов (SVM). Каждый алгоритм был обучен и оценен с помощью 5-кратной кросс-валидации для обеспечения надежности в таких показателях, как Accuracy, Precision, Recall и F1-Score; k-кратная кросс-валидация гарантирует, что модели хорошо обобщаются на тестовых данных путем разбиения набора данных на пять отдельных групп. Это предотвращает перебор и обеспечивает более полную оценку эффективности метода.

Логистическая регрессия (Logistic Regression) – простая линейная модель для оценки более сложных алгоритмов. Модель была обучена с помощью решателя Sagaс максимумом в 500 итераций для обеспечения сходимости (см. Таблицу 1).

Таблица 1

Результаты перекрестной валидации логистической регрессии

Метрики

Logistic Regression (Mean)

Accuracy

0,957

Precision

0,791

Recall

0,697

F1-Score

0,741

Источник: здесь и далее таблицы составлены авторами.

Метод показал хорошую общую производительность с точностью 92,35 %. Однако, учитывая ее линейную природу, логистическая регрессия может не справиться с отражением нелинейных связей в данных отслеживания взгляда.

Случайные леса (Random Forests) – ансамблевый метод на основе деревьев решений, хорошо подходящий для задач классификации с зашумленными данными. Алгоритм строит несколько деревьев решений и объединяет их предсказания, что делает его устойчивым к перестройке (см. Таблицу 2).

Таблица 2

Результаты перекрестной валидации случайного леса

Метрики

Random Forest (Mean)

Accuracy

0,9786

Precision

0,9701

Recall

0,9628

F1-Score

0,9664

Метод продемонстрировал высокую производительность по всем метрикам с точностью 97,86 %. Его способность обрабатывать большие объемы данных слежения за взглядом и улавливать сложные закономерности делает его сильным кандидатом для применения в реальном мире.

Методы прогнозирования когнитивной нагрузки обучающихся в средах электронного обучения с использованием данных отслеживания взгляда

Машины опорных векторов (SVM – Support Vector Machine) – обучен с использованием ядра радиальной базисной функции ( Radial Basis Function – RBF ), что позволяет моделировать нелинейные зависимости, которые эффективны в высокоразмерных пространствах, хорошо работают для задач бинарной и мультиклассовой классификации, используются для классификации уровней когнитивной нагрузки (низкий, средний, высокий) на основе данных отслеживания взгляда (см. Таблицу 3).

Таблица 3

Результат перекрестной валидации машины опорных векторов

Метрики

SVM (Mean)

Accuracy

0,957

Precision

0,791

Recall

0,697

F1-Score

0,741

Метод показал хорошие результаты, сбалансировав Precision и Recall, что свидетельствует о том, что он эффективно справляется как с когнитивной перегрузкой, так и с нормальным состоянием. Метод уступает Random Forest, однако продемонстрировал надежное обобщение.

Сводные результаты методов представлены в Таблице 4.

Таблица 4

Результаты кросс-валидации для всех методов

Метод

Accuracy

Precision

Recall

F1-Score

Logistic Regression

0,957

0,955

0,957

0,955

Random Forest

0,9786

0,9701

0,9628

0,9664

Support Vector Machine

0,989

0,989

0,9425

0,989

Таким образом, Random Forest оказался самым эффективным методом, обеспечив наивысшую точность и сбалансированные показатели достоверности, чувствительности и F1-Score. Ансамблевые методы отлично справляются с выявлением сложных закономерностей в данных отслеживания взгляда, что делает их пригодными для реального применения в средах электронного обучения. Более простые методы, такие как логистическая регрессия, показали достаточно хорошие результаты, что говорит о том, что они тоже могут быть использованы в некоторых сценариях.

Сравнение эффективности моделей

Random Forest является сильной альтернативой для наборов данных с нелинейными закономерностями. SVM предлагает баланс между простотой и производительностью, но немного отстает от ансамблевых моделей по показателям Recall и F1-Score. Логистическая регрессия полезна для более простых, легкоинтерпретируемых моделей, но она с трудом справляется с отражением сложных взаимосвязей в данных.

Высокие показатели Random Forest при прогнозировании когнитивной перегрузки согласуются с недавними результатами [20], которые показали, что ансамблевые методы

Вестник Российского нового университета

Серия «Сложные системы: модели, анализ и управление», выпуск 1 за 2025 год очень эффективны при обработке сложных, нелинейных взаимосвязей в образовательных данных. Использование данных отслеживания взгляда повышает прогностические возможности моделей машинного обучения, предоставляя подробную информацию о поведении обучающегося и особенностях его внимания.

Применение для управления когнитивной нагрузкой в электронном обучении

Прогнозирование когнитивной нагрузки в реальном времени имеет огромное значение для адаптивных платформ электронного обучения. Динамическая регулировка сложности учебных материалов на основе определения когнитивной нагрузки в реальном времени может значительно повысить вовлеченность учащихся и их способность удерживать внимание. Адаптивные системы обучения, реагирующие на когнитивную нагрузку, помогают предотвратить когнитивную перегрузку и гарантировать, что учащиеся остаются в оптимальной зоне обучения. Использование имитационных данных в исследовании обеспечивает контролируемую среду для обучения моделей и бывает необходимо на ранних этапах разработки моделей, когда реальных данных не хватает. Однако методы, обученные на симулированных данных, могут плохо обобщаться с реальными сценариями, особенно когда речь идет о высокодинамичном поведении, таком как когнитивная нагрузка. Поэтому, хотя методы в данном исследовании хорошо показали себя на симулированных данных, важно проверить их на реальных наборах данных, чтобы убедиться в их надежности и практическом применении.

Потенциал применения этих моделей в реальных платформах электронного обучения весьма значителен [21]. Интеграция машинного обучения с данными отслеживания взгляда в реальном времени может дать немедленное представление о вовлеченности ученика, что позволяет адаптировать процесс обучения. Авторы обзора по адаптивному обучению [22] подчеркнули проблемы масштабирования таких систем, связанные с обработкой больших объемов данных в режиме реального времени.

Результаты данного исследования согласуются с последними достижениями в области машинного обучения и прогнозирования когнитивной нагрузки, особенно в контексте электронного обучения. Случайный лес оказался наиболее эффективным методом бинарного прогнозирования когнитивной нагрузки, предлагая высокую точность и сбалансированное соотношение доли истинно положительных случаев состояний когнитивной перегрузки и процента реальных случаев состояний когнитивной перегрузки. Потенциал применения в реальном времени очевиден, но необходима дальнейшая проверка методов на реальных данных. Будущие исследования должны быть направлены на решение проблем масштабируемости и этических проблем, связанных с использованием данных отслеживания взгляда в адаптивных системах обучения.

Статья научная