Компьютерная диагностика и управление процессом обучения
Автор: Дьячук П.П., Малова И.П., Суровцев В.М.
Журнал: Вестник Красноярского государственного педагогического университета им. В.П. Астафьева @vestnik-kspu
Рубрика: Диагностика
Статья в выпуске: 1 (1), 2006 года.
Бесплатный доступ
Работа посвящена компьютерным системам, позволяющим измерять изменения в выполнении заданий обучающимся. Основу таких систем составляют динамические теcты-тренажеры, в которых имеются модули слежения и записи информации о действиях ученика в процессе решения задач. Это позволяет проводить контент-анализ продуктов деятельности ученика, определять функцию вознаграждения и функцию ценности состояния обучаемого, вычислять скорость обучения и проводить анализ изменений соотношения между внешней и внутренней информацией.
Педагогическая диагностика, компьютерная диагностика учащихся, тесты-тренажеры, анализ процесса обучения
Короткий адрес: https://sciup.org/144152783
IDR: 144152783
Текст научной статьи Компьютерная диагностика и управление процессом обучения
В настоящей работе анализируется другая ситуация, когда в компьютерной системе управления процессом научения есть модуль, который играет роль исполнительного органа. В этом случае в основе управления деятельностью ученика лежит механизм компенсации неправильных действий обучаемого. Например, компьютер исправляет неправильные операции, совершаемые учеником, или устанавливает запрет на некоторые операции, совершаемые учеником через клавиатуру или мышку, и т.п. В этом случае компьютерная система компенсирует неопределенность объекта. Надо отметить, что исполнительные органы ученика действуют и в этом случае. Более того, компенсационные управляющие воздействия, которые произведены компьютером, воспринимаются учеником как сигналы управления, которые подвергаются перекодировке в управляющем устройстве ученика (в мозгу).
Таким образом, ученик рассматривается как неопределенный объект управления. Поведение ученика характеризуется рядом параметров, совокупность которых можно обозначить вектором 0 . Вектор 9 может включать в себя неизвестные параметры объекта, неточно известные характеристики, неизмеряемые внешние возмущения и т.д.
Структурная схема компенсаторной системы управления, в которой реализуется оптимальный (в определенном смысле) процесс управления, представлена на рис.1.
Положим, что локальная цель управления состоит в том, чтобы обеспечить наименьшее значение некоторой величины (функционала) R 1 , зависящей в общем случае от функций задающего x в (t) и управляющего u(t), воздействий и от управляемой величины x(t), т. е.
R i [ x в (t ), x (t ), u (t )] = R min . (1)
Главная цель определяется целевым неравенством:
R 2( x, t ) <А . (2)
Эти цели должны быть достигнуты при наличии определенных ограничений, состоящих в том, что некоторые величины (функционалы) F i , где i = 1, 2,..., m , не должны превосходить установленных для них значений, т. е.
F [ x в (t ), x(t ), u(t ), z(t )] < F i ,
где z(t) - возмущение, воздействующее на объект управления.
Роль функционалов F i могут играть ограничения на время T или число заданий N, отводимых на обучение студента. Управляемой величиной R i (формула (1)) является расстояние между текущим и целевым состоянием задачи в проблемном пространстве задачи. Целевое неравенство (2) определяется для функции ценности состояния R 2 [3] .

Рис .1. Структура управления обучающей и диагностирующей компьютерной системы с компенсационным механизмом :
ГЗ — генератор заданий ; A i — интерфейс ученика ; A 2 — управляющий модуль ( адаптер ); С — вычислительный модуль ; ЗПД — запись продуктов деятельности ученика ; X в — за дающее воздействие ( задание ); U — управляющее воздействие ; Z — возмущение ; x — управ ляемая величина ( действия ученика ); х0 — компенсатор ; P — управление ГЗ; R i и R 2 — кри терии оптимальности ; F i — функционалы ; у — корректирующее воздействие
Как уже говорилось выше, полная априорная информация относительно z(t) и x(t) отсутствует. В рассматриваемой системе управляющее устройство A 1 представляет собой интерфейс студента, являющийся преобразователем входов x, X в x0, y и выхода U . А 2 может воздействовать на A 1 , перестраивая его алгоритм. Основываясь на главной и локальных целях управления, устройство А 2 с помощью алгоритмов обучения и по мере накопления опыта, который определяется совокупностью реакций A 1 на возможные изменения режимов работы студента, вырабатывает воздействия y(t) и x0 , которые все более и более приближаются к требуемым значениям. Требуемыми являются такие значения y(t) , x0 , которые в соответствии с получаемыми в вычислительном устройстве С значениями критериев оптимальности R 1 и R 2 (при ограничениях F* i ) перестраивают алгоритм работы A 1 таким образом, что выполняются условия (1) – (2). На вход вычислительного модуля С поступает информация о действиях студента x и о заданиях, которые генерируются модулем ГЗ . Вычислительный модуль С осуществляет слежение за деятельностью ученика при выполнении задания в режиме on-line. При этом на основании сравнения с критерием оптимальности R 1 вычисляется функция вознаграждения [1; 3]. Это позволяет определить значение функции ценности состояния и выработать в модуле A 2 корректирующее воздействие y(t), помогающее студенту достичь главной цели (2). Величину функции ценности состояния ученика y(t) м одуль A 2 изменяет в соответствии с относительной частотой правильных действий p , вычисляемой после каждого задания. Информация об окончании выполнения задания, так же, как и информация об окончании работы с системой, передается в модуль ГЗ по каналу P. Наряду с перечисленными функциями вычислительный модуль С производит не только слежение за действиями ученика, но и записывает информацию о деятельности, которая представляет собой протокол, включающий: 1) действие; 2) время; 3) «штраф» (–1) или «вознаграждение» (+1); 4) величину функции ценности состояния ученика R 2 . Продукты деятельности ученика записываются в текстовой файл (выход ЗПД ) для последующей диагностики динамических характеристик процесса научения.
Рассмотрим математическую обработку продуктов деятельности, полученных в результате динамического тестирования студентов факультета физики, информатики и ВТ [4]. Динамическое тестирование проводилось по теме «Кривые второго порядка». Студенты должны были обучиться конструированию кривых второго порядка по заданным уравнениям.
В процессе научения решению задач обучаемый, решая серию аналогичных задач, совершает различные действия ( A j ). В нашем случае эти действия связаны с операциями параллельного переноса, растяжения, сжатия и поворота. При этом множеству альтернатив A j , соответствует множество вероятностных переменных P j. Однако наибольший интерес представляют две альтернативы: A 1 («правильные действия») и A 2 («неправильные действия»), вероятности появления которых равны соответственно P и 1 – P .
Основные приближения математической модели состоят в том, что вероятность P в процессе выполнения i-го задания полагается постоянной и стохас- тическая модель обучаемости линейная [2]. Последовательность событий Ei состоит из выполненных заданий, i – номер задания.
Отдельное событие E i представляется строчным математическим оператором Q i , который записывается в виде:
Q i P = a P + ( 1 - а ) Я , (4)
где α и λ – параметры, которые характеризуют обучаемого ( λ – предельное значение вероятности Р). Величина α принимает значения от –1 до 1 и показывает скорость выхода на уровень неподвижной точки (величина λ ), который принимает значения от 0 до 1.
Если до наступления события E i вероятность события A 1 есть Р , то Q i P есть вероятность этой реакции после наступления события E i . Следовательно, если событие E i наступает еще раз, то необходимо применить оператор Q i к вероятности Q i P . Полагая, что событие E i наступает n раз, получаем общую формулу для случая n применений оператора:
Q - P = a - p + ( 1 - a n U . (5)
Параметры α и λ определяются методом «наименьшего квадратичного отклонения». Данное рекуррентное соотношение дает дискретное описание экспериментального временного ряда событий (рис. 2, графики 1, 2). Непрерывная аппроксимация решения рекуррентного уравнения (5) имеет вид:
-
У = e -t^ i ) n p + (1 - e -t^ i ) n )Л;, (6)
где y – вероятность правильного действия на n+1 задании, λ и α имеют тот же смысл, что и при рекуррентном соотношении.

Рис 2. Вероятность правильных действий в зависимости от числа заданий для испытуемого под номером 12:
-
1 – экспериментальная зависимость вероятности правильных действий от числа заданий ;
-
2 – рекуррентная зависимость изображена точками ( α =0,91, λ =0,931);
3 – график функции (3), ( α =0,95, λ =0,935)
Выражение (6) является разумной аппроксимацией, если величина 1-α мала по сравнению с единицей [2]. На рис. 2 аппроксимация экспериментальных данных с помощью формулы (6) представлена графиком под номером 3.
Динамическое тестирование процесса научения решению задач было произведено на выборке из 85 студентов факультета физики КГПУ. В результате получена гистограмма плотности распределения испытуемых по параметру λ (рис. 3). Видно, что распределение имеет асимметричный характер с выраженным максимумом f = 7,53 при λ = 0,92. Среднее значение параметра λ = 0,745 при ∆ λ = 0,03125, а дисперсия D = 0,025.
Из гистограммы плотности распределения видно, что небольшая группа студентов имеет предельное значение вероятности правильных действий 0,5 – 0,6. Студенты этой группы, несмотря на достаточно большое количество выполненных заданий (свыше 30), не достигли «индуктивного порога» [3]. Их деятельность осталась на уровне метода проб и ошибок.
Полученные результаты подтвердили целесообразность использования линейного приближения для анализа экспериментальных временных рядов событий E i , полученных при динамическом тестировании. Однако линейное приближение налагает жесткие ограничения на значения параметра α (см. выше).
Гистограмма плотности распределения (f) испытуемых по параметру лямбда ( λ )

Рис 3. Гистограмма плотности распределения обучаемых по параметру λ
Нелинейное описание снимает эти ограничения, однако в настоящее время оно отсутствует.