Модели и процедуры интервальной оценки результатов контроля знаний в компьютерных системах тестирования ВМФ
Автор: Печников Д.А.
Журнал: Вестник Воронежского государственного университета инженерных технологий @vestnik-vsuet
Рубрика: Информационные технологии, моделирование и управление
Статья в выпуске: 1 (75), 2018 года.
Бесплатный доступ
В данной статье рассматривается существующие и перспективные модели и процедуры интервальной оценки результатов контроля знаний в компьютерных системах с применением биноминального закона распределения и геометрического распределения, как частного случая отрицательного биноминального распределения. С целью перейти от точечных оценок эмпирической частости к адекватным теоретически обоснованным оценкам вероятности правильного действия, которые имеют количественно оцениваемый доверительный интервал. В тенденциях развития ТОС ВМФ отмечается следующий ряд основных противоречий: 1) между ростом возможностей ТОС как средств моделирования управляемых объектов и неизменностью их дидактических характеристик; 2) между необходимостью индивидуализации процесса подготовки и ограниченными психофизиологическими возможностями обучающих по управлению обучением в группах с количественным составом более 5-7 обучаемых; 3) между ростом числа и сложности задач управления обучением и неизменностью психофизиологических возможностей руководителей обучения. В качестве средства разрешения этих противоречий рассматривается автоматизация в ТОС ВМФ функций управления обучением.
Интервальная оценка, доверительный интервал, биноминальный закон распределения
Короткий адрес: https://sciup.org/140230003
IDR: 140230003 | DOI: 10.20914/2310-1202-2018-1-97-104
Текст научной статьи Модели и процедуры интервальной оценки результатов контроля знаний в компьютерных системах тестирования ВМФ
Для того чтобы осуществлять военнопрофессиональную подготовку специалистов ВМФ необходима соответствующая учебноматериальная база. Основу такой базы раньше всегда составляли действующие учебные и тренировочные образцы военной техники и вооружения, которые ранее поступали в военно-морские учебные заведения в достаточном количестве и обеспечивали необходимый уровень как теоретической, так и практической подготовки будущих офицеров ВМФ. В результате резкого сокращения в 1990 годы отраслей военнопромышленного комплекса, разрабатывающих технику и вооружения для ВМФ, новейшие образцы этой техники и вооружений теперь изготовляются не сериями, а отдельными экземплярами. Вопрос о производстве учебных и тренировочных образцов не стоит вообще. В этих условиях в качестве единственного средства, способного обеспечить военно-профессиональную подготовку, могут рассматриваться только виртуальные аналоги образцов военной техники и вооружения, разрабатываемые средствами информационных технологий, т. е. тренажерно-обучающие системы (ТОС) ВМФ.
В тенденциях развития ТОС ВМФ отмечается следующий ряд основных противоречий: 1) между ростом возможностей ТОС как средств моделирования управляемых объектов и неизменностью их дидактических характеристик; 2) между необходимостью индивидуализации процесса подготовки и ограниченными психофизиологическими возможностями обучающих по управлению обучением в группах с количественным составом более 5–7 обучаемых; 3) между ростом числа и сложности задач управления обучением и неизменностью психофизиологических возможностей руководителей обучения. В качестве средства разрешения этих противоречий рассматривается автоматизация в ТОС ВМФ функций управления обучением.
Ключевой функцией, без автоматизации которой нельзя автоматизировать все остальные функции управления обучением, является функция педагогического контроля качества подготовки обучаемых.
Качество реализации в ТОС ВМФ функции контроля качества подготовки различно в отношении знаний и действий (умений и навыков) обучаемых.
В направлении автоматизации функции оценивания деятельности выполнен целый ряд исследований (Челышкова М.Б [31], Вадзинский Р.Н [3], Ю.А. Ветров [4], Ю.Ф. Волынец [5], В.Н. Иванов [8], В.Д. Мосин [11], Д.А. Печников [13–15], А.Н. Платов [16], В.Ю. Пузырев [17], А.А. Ско-ров [19], А.М. Стручков [20], Е.В. Хекерт
[23, 24], О.Е. Чудаков [25], К.Ю. Шилов [26], Н.В. Щербаков [27] Kaftandjieva, F [36]), Wim J. van derLinden [37] завершившихся созданием оригинальной автоматизированной системы оценки, которая прошла испытания и внедряется в программное обеспечение перспективных ТОС ВМФ.
В направлении автоматизации функции оценивания знаний выполнено менее значительное число исследований. Первая их группа (В.Н. Наумов [12], А.Н. Ханников [29], П.В. Филиппов [28]) носит поисковый характер и ориентирована на создание технологий искусственного интеллекта. На совершенствование моделей и процедур тестирования направлена вторая группа исследований (Р.Р. Туктаров [21], А.О. Туровская [22]), которые были направлены на совершенствование моделей и процедур оценивания отдельных видов тестовых заданий и не касались вопросов управления процессом тестирования.
На достижение целей контроля усвоения знаний в ТОС ВМФ ориентирована компьютерная система тестирования военного назначения (КСТ ВН) “Система автоматизированного контроля (САК)”, которая входит в состав комплекса программ инструментальных средств (КПИС) “Медиатор”. Эта КСТ является типичным представителем современных КСТ и полностью соответствует современному уровню их развития.
ГОСТ РВ 51540-2005 [6] и ГОСТ РВ 15.205-2004 [7] определяют КСТ по функциональному предназначению как продукцию двойного назначения и относятся КСТ к комплектующим изделиям межотраслевого применения (КИМП), представляющим собой “изделие военной техники (ВТ), предназначенное для выполнения определенных технических функций в составе изделий ВТ или их составных частей, создаваемое не для конкретного изделия ВТ по самостоятельным комплектам и не подвергаемое изменениям в процессе создания изделий ВТ, в котором его применяют”. В соответствии с классификациями, приведенными в ГОСТ РВ 51540-2005 [6] и ГОСТ Р 50-60580-93 [7], КСТ должны быть необходимо отнесены к изделиям ВТ, которые входит в категорию учебно-тренировочных средств, принадлежащих к учебной военной техники как виду военной техники.
Основная часть
В настоящее время в компьютерных системах тестирования наибольшее распространение получили тестовые задания закрытого типа с единственным верным ответом. Задания этого типа применяются не менее чем в 92% случаев. В рассматриваемых тестовых заданиях успешность выполнения задания оценивается путем установления факта совпадения ответа обучаемого с заранее заданным правильным вариантом ответа. Любой другой вариант ответа является неправильным. Для последующей статистической обработки результаты (верно– не верно) выполнения таких тестовых заданий представляются представляет в виде дихотомическая переменной (0 – 1).
Безошибочность (правильность) ответов обучаемого определяется в виде показателя частности B , который имеет вид:
n
I j
B = -==1— (1) n где i (г = 1, n) - номер тестового задания, n - общее число тестовых заданий, j (j = 0,1) результат выполнения отдельного тестового задания в тесте j = 1 - верный ответ, j = 0 -неверный ответ.
Все существующие модели и процедуры обработки результатов выполнения систем тестовых заданий основаны на точечной оценке вида (1). Эти точечные оценки результатов тестирования не обеспечивают оперативность процедуры и не вполне обеспечивают достоверность результатов тестирования. Ниже предлагаются модели и процедуры интервальной оценки результатов выполнения систем тестовых заданий тестовые задания закрытого типа с единственным верным ответом.
Предлагаемые модели и процедуры базируются на том факте, что показатель “правильность” является дихотомической переменной, а процедура его определения в процессе решения обучаемым тестирующей выборки из n заданий соответствует схеме Бернулли.
Схемой Бернулли называется последовательность независимых в совокупности испытаний, в каждом из которых возможны лишь два исхода – “успех” и “неудача”, при этом успех в одном испытании происходит с вероятностью p е (0,1), а неудача - с вероятностью q = 1 - p . “Схема Бернулли лежит в основе таких целочисленных распределений, как биномиальное, геометрическое и отрицательное биномиальное [4].
Для корректного применения схемы Бернулли должны быть выполнены следующие условия [1]: 1) каждое испытание имеет ровно два исхода, условно называемых успехом и неудачей; 2) независимость испытаний: результат очередного эксперимента не должен зависеть от результатов предыдущих экспериментов; 3) вероятность успеха должна быть постоянной (фиксированной) для всех испытаний.
Выполнение первого условия определяется характеристиками самих систем тестовых заданий закрытого типа с единственным верным ответом, в которых результаты выполнения задания обозначаются дихотомической переменной Ji ( Ji = 0,1) . Выполнение второго условия обусловливается независимостью тестовых заданий в тесте и возможностью их предъявления в случайном порядке. Выполнение третьего условия обеспечивается тем, фактом, что в процессе тестирования обучаемым никаких новых сведений об объектах тестируемой предметной области не сообщается.
Примем допущение о том, что вероятность правильного выполнения тестовых заданий обучаемым определяется только знаниями обучаемого о тестируемой предметной области и не зависит ни от каких-либо других факторов (например, от фактора угадывания). Если принятое допущение выполняется, то выполняется и третье условие соответствия процедуры тестирования схеме Бернулли. В соответствии с принятым допущением безошибочность выполнения тестовых заданий обучаемым характеризуется некоторой постоянной вероятностью p = const правильного выполнения задания и соответствующей ей вероятностью q = 1 - p ее неправильного выполнения.
Пусть в результате решения обучаемым выборки из n тестовых заданий получен вектор (примеры векторов приведены в таблице 1)
J = ( J 1 ,..., Ji,..., J n ), (2), в котором j = 0,1 есть оценки успешности выполнения соответствующего задания ( j = 1 - задание выполнено без ошибок, j = 0 - задание выполнено с ошибками). Требуется оценить вероятность p безошибочной деятельности.
Таблица 1.
Некоторые варианты векторов результатов тестирования для n = 12
Table 1.
Some variants of vectors of test results for n = 12
Вариант Option |
j 1 |
j 2 |
j 3 |
j 4 |
j 5 |
j 6 |
j 7 |
j 8 |
j 9 |
j 10 |
j 11 |
j 12 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
2 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
1 |
1 |
1 |
1 |
1 |
3 |
1 |
1 |
1 |
1 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
4 |
1 |
0 |
1 |
0 |
1 |
0 |
1 |
0 |
1 |
0 |
1 |
0 |
5 |
0 |
1 |
0 |
1 |
0 |
1 |
0 |
1 |
0 |
1 |
0 |
1 |
6 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
1 |
1 |
7 |
1 |
1 |
0 |
0 |
1 |
1 |
1 |
1 |
1 |
0 |
1 |
1 |
8 |
1 |
1 |
1 |
1 |
0 |
1 |
1 |
1 |
0 |
1 |
1 |
1 |
9 |
1 |
1 |
1 |
1 |
0 |
0 |
0 |
1 |
1 |
1 |
1 |
0 |
10 |
1 |
1 |
0 |
1 |
1 |
0 |
0 |
1 |
1 |
0 |
1 |
0 |
Рассмотрим те законы распределений, которые могут быть использованы для интервальной оценки вероятности p безошибочного выполнения тестовых заданий.
Как отмечалось выше, эмпирические данные, полученные по схеме Бернулли, подчиняются законам таких целочисленных распределений, как биномиальное, геометрическое и отрицательное биномиальное. “Механизм возникновения этих распределений определяется тем способом, которым обрывается последовательность испытаний Бернулли” [4].
Биномиальное распределение имеет место в тех случаях, когда последовательность испытаний Бернулли обрывается после проведения фиксированного числа n испытаний. При этом под биномиальной случайной величиной X понимается число успехов в серии из n испытаний Бернулли.
Вероятность P ( J ) появления вектора J при биномиальном распределении оценивается как:
P(J ) = Cp" - kqk при C = , (3) k !( n - k )!
где J – рассматриваемый вариант (вектор) результатов тестирования; p – вероятность безошибочного выполнения тестового задания, q = 1 - p - вероятность выполнения задания с ошибкой, k – число заданий, выполненных с ошибкой, n - общее число заданий, п - k -число заданий, выполненных без ошибок.
Отрицательное биномиальное распределение имеет место в тех случаях, когда последовательность испытаний обрывается сразу же после m -ого успеха. При этом рассматриваются две случайные величины: случайная величина Z – число неудач, предшествовавших т -ому успеху, и случайная величина W – общее число испытаний до m -ого успеха (включая m -ый успех).
Вероятность P ( J ) появления вектора J при отрицательном биномиальном распределении оценивается как:
P ( J ) = C . . - 1 p"q при C = ( z + m "*)’ , (4) z !( m - 1)!
где J – рассматриваемый вариант (вектор) результатов тестирования; p – вероятность безошибочного выполнения тестового задания, q = 1 - p - вероятность выполнения задания с ошибкой, z – число заданий, которые выполнены с ошибкой и предшествуют m -ому успеху.
Геометрическое распределение является частным случаем отрицательного биномиального распределения и возникают при обрыве серии испытаний сразу же после первого успеха или неудачи. При этом рассматриваются две случайные величины: случайная величина X – число неудач (успехов), предшествовавших первому успеху (неудаче), и случайная величина Y – число испытаний до первого успеха (неудачи). Сам успех (неудача) может включаться и не включаться в число Y .
Геометрическое распределение – это единственное дискретное распределение со свойством отсутствия памяти (последействия): знание об отсутствии успеха (неудачи) в предыдущих опытах никак не влияет на распределение оставшегося числа опытов до появления успеха (неудачи).
При геометрическом распределении вероятность P ( J ; j = 1) появление вектора J ( j = 1; i = 1, n ) оценивается как:
P ( J ; j i = 1) = p h q , (5)
а вектора J ( j = 0; i = 1, n ) как
P ( J ; j , = 0) = q h p , (6) где p – вероятность безошибочного выполнения задания, q = 1 - p - вероятность выполнения задания с ошибкой, h ( h = 1, n ) - номер i последнего задания, выполненного без ошибки или, наоборот, с ошибкой (число “неудач (ошибок)” до первого “успеха” или число “успехов” до первой “неудачи (ошибки)”.
В целях интервальной оценки вероятности p безошибочного выполнения тестовых заданий целесообразно использовать те законы распределения, которые принципиально об еспечивают обработку любого числа ( i , i = 1, +да ) тестовых заданий. Такому требованию соответствуют только законы биномиального и геометрического распределения.
Закон отрицательного биномиального распределения может быть использован для оценивания результатов тестирования только после появления m -ого успеха. При его использовании минимальная длина оцениваемого вектора J лежит в пределах z + m < J < +w . Другими словами, при самом благоприятном стечении обстоятельств отрицательное биномиальное распределение обеспечит возможность оценки результатов тестирования только при числе i = z + m выполненных заданий, а при самом неблагоприятном – не обеспечит никогда.
Введем понятие вектора h непрерывного результата (успеха или неудачи), под которым будем понимать любую часть вектора (1), каждый из элементов которой равен 1 или 0: если все элементы вектора равны 1 (j = 1) - вектор h непрерывного успеха, если все элементы вектора равны 0 (j = 0) - вектор h непрерывной неудачи. Например, в таблице 1 для 6 варианта вектора j это вектора h = (jx, j) , h2 = (J 3,j4,j5,j 6,j7,j 8,j9) , h3 = (J 10, b jn) •
Вероятность появления вектора (1) можно оценивать с двух позиций:
-
1) как вероятность события L , заключающееся в том, что при выполнении n заданий обучаемым было достигнуто ( n - k ) успехов (допущено k ошибок);
-
2) как вероятность события H , заключающегося в появлении в векторе (1) m векторов непрерывного результата.
Вероятность P(L) наступления события L оценивается по биномиальному закону (2). Соответственно при определении доверительного интервала (ДИ) для оценок вероятности p успешного выполнения тестового задания корректно использование следующих формул оценки доверительных интервалов биномиального распределения:
-
1) оценка точного ДИ [2, 3]:
Л ( n - k )
( n - k ) + ( k + 1) F 2( k + i),2( n - k 2 ’
( n - k + i) F n - k + i),2 k , i - ^ 2
v k + ( n - k + i) F n - k + i),2 k , i - е /2
где n – число испытаний, k – число ошибок, а F f g a - квантиль порядка а распределения F с f, g степенями свободы;
-
2) оценка приближенного ДИ в соответствии с центральной предельной теоремой, когда при больших n распределение биномиальной случайной величины будет близко к нормальному [2, 3]
(
P * - u i -E /2
' p * (i - p *) Ip * (i - p *)
--------------, p * + u i-E /2 A-------------- nn
( n - k
n
—
(n - k)k n - k (n - k)k ui-E/2\ 2 , + ui-E/2\ 2 ,
V n n nn где p * - оценка эмпирической частости правильного выполнения тестовых заданий; u – квантили стандартного нормального распределения порядка i - е /2.
Оценим вероятность события H , которое заключается в появлении в векторе (2) m векторов непрерывного результата.
В соответствии с введенным выше понятием вектора h s непрерывного результата события h s = н появления таких векторов относятся к категории попарно несовместных событий. Поэтому вероятность P ( H ) любого из вариантов их реализаций (см. табл. 1) оценивается по формуле:
P ( н ) = P ( h i и ... и h s и ... и h m ) =
= P (hi) + ... P (hs ) + ... P (hm ) , где s (s = i, m; m < n) - номер вектора непре- рывного результата; n – число выполненных тестовых заданий.
В (8) вероятности P(h) оцениваются по геометрическому закону в соответствии с
-
6)
(5,
P ( h s ) =
< phq _ qh p
при
при
j‘ i;, (10)
j , = 0
гдеp – вероятность безошибочного выполнения задания, q = i - p - вероятность выполнения задания с ошибкой, h (h = i, (n - k)) - номер i последнего задания, выполненного без ошибки или, наоборот, с ошибкой (число “неудач (ошибок)” до первого “успеха” или число “успехов” до первой “неудачи (ошибки)”.
Для оценки в (9, 10) неизвестного параметра p предлагается использовать метод максимального правдоподобия, при котором в качестве оценки вероятности p принимается ее значение p = arg max f(j ,p) = arg max P(H), (1Г) p e(0,i) p e(0,i)
максимизирующее вероятность P ( H ) появления при выполнении n тестовых заданий вектора j = ( j j,..., j ,..., j ), включающего m ( m = i, n ) векторов h непрерывного результата.
Каждый из полученных векторов h непрерывного результата позволяет по (10) получить оценку ps с ошибкой ст^: ps ± ^ . Соответственно функция W(ps, p) правдоподобия (совместной плотностью вероятности) для любой из реализаций события H = иh может быть представлена в виде s=m w (ps, p) = n P (hs) = s=i s=ls
= П P (ht )П P (hs) = ptqk(12)
s=i при t > 0, k > 0, где p – вероятность безошибочного выполнения тестового задания, q = 1 - p - вероятность выполнения задания с ошибкой, k – число заданий, выполненных с ошибкой, t – число заданий, выполненных правильно, n = t + k -общее число выполненных заданий, 5 (5 = 1, m) - номера векторов h непрерывного результата, 5 (5 = 1, l) - номера векторов hs непрерывного успеха, 5 (5 = l +1, m) - номера вектор hs непрерывной неудачи.
Например, для представленного в таблице 1 варианта 6 вектора J , включающего вектора h = ( jx, j 2) , h = ( j 3 , j 4 , j 5 , j 6 , j 7 , j 8 , j 9 ) и h 3 = ( j 10 , j m j' n ) . функция (11) имеет вид
5 = m
W ( P 5 , p ) = n P ( hs ) =
5 = 1 .
= P ( h ) P ( h 2 ) P ( h 3 ) = p 2 q 7 p 3 = p 5 qq
Если рассматриваемый вектор является единичным вектором непрерывного успеха hs (в таблице 1 вариант 1) или непрерывной неудачи h то такие вектора оцениваются по формуле (10).
Поиск p целесообразно реализовать путем решения следующей задачи нелинейного программирования p"- k+1 qk+1 ^ max,
[ , (13)
p e (0,1), k = 1, n
Для решения (12) можно использовать стандартную функцию “Solve (Поиск решения)” MicrosoftExcel.
ДИ оценки p может быть определен как p (1 - p)
p - u 1 - E /2 J---------, p + u 1 - E /2
n
p (1 - p )
n
Сравним оценки обучаемых, полученные обычным путем на основе предлагаемых моделей.
Пусть обучаемыми выполнено 13 заданий и получены результаты, приведенные в таблице 1. Оценки этих результатов тестирования приведены в таблице 2.
Таблица 2.
Оценки результатов тестирования, приведенных в таблице 1
Table 2.
Evaluation of test results given in table 1
№ варианта option |
n |
n-k |
k |
l |
ml |
Точечная оценка по модели (2.1) Point estimate by the model (2.1) |
Интервальные оценки Interval estimates |
|||||
на основе биномиального распределения based on binomiall distribution |
на основе геометрического распределения on the basis of geometric distribution |
|||||||||||
Вероятнейшее значение по (2.3) The most probable value according to (2.3) |
Границы ДИ по (2.7) The boundaries of CI by (2.7) |
Вероятнейшее значение по (2.13) The most probable value according to (2.13) |
Границы ДИ по (2.14) The boundaries of the CI by (2.14) |
|||||||||
Нижняя Lower |
Верхняя Upper |
Нижняя Lower |
Верхняя Upper |
|||||||||
1 |
12 |
12 |
0 |
1 |
0 |
1,000 |
1,000 |
0,735 |
1,000 |
0,923 |
0,754 |
1,000 |
2 |
12 |
6 |
6 |
1 |
1 |
0,500 |
0,500 |
0,211 |
0,789 |
0,500 |
0,182 |
0,818 |
3 |
12 |
6 |
6 |
1 |
1 |
0,500 |
0,500 |
0,211 |
0,789 |
0,500 |
0,182 |
0,818 |
4 |
12 |
6 |
6 |
6 |
6 |
0,500 |
0,500 |
0,211 |
0,789 |
0,500 |
0,182 |
0,818 |
5 |
12 |
6 |
6 |
6 |
6 |
0,500 |
0,500 |
0,211 |
0,789 |
0,500 |
0,182 |
0,818 |
6 |
12 |
5 |
7 |
2 |
1 |
0,417 |
0,417 |
0,152 |
0,723 |
0,400 |
0,089 |
0,711 |
7 |
12 |
9 |
3 |
3 |
2 |
0,750 |
0,750 |
0,428 |
0,945 |
0,647 |
0,343 |
0,951 |
8 |
12 |
10 |
2 |
4 |
2 |
0,833 |
0,833 |
0,516 |
0,979 |
0,667 |
0,367 |
0,966 |
9 |
12 |
8 |
4 |
2 |
2 |
0,667 |
0,667 |
0,349 |
0,901 |
0,625 |
0,317 |
0,933 |
10 |
12 |
7 |
5 |
4 |
4 |
0,583 |
0,583 |
0,277 |
0,848 |
0,550 |
0,234 |
0,866 |
Оценки, приведенные в таблице 2, свидетельствуют, что применение предлагаемых моделей оценки результатов тестирования обеспечивает переход от точечных оценок эмпирической частости к адекватным теоретически обоснованным оценкам вероятности правильного действия, которые имеют количественно оцениваемый ДИ.
Поскольку задачи текущего контроля решаются непосредственно в процессе обучения и имеют целью выработку адресных обучающих воздействий, то процесс критериально-ориентированного тестирования должен занимать минимум времени. Иначе говоря, к самому процессу критериально-ориентированного тестирования, а также процедурам обработки и презентации его результатов должно быть предъявлено требование оперативности.
Оперативность процедур обработки и отображения результатов действий обучаемых проблем не вызывает, поскольку полностью обеспечивается за счет быстродействия аппаратно-программных средств КСТ. А вот оперативность самой процедуры тестирования соответствующего обеспечения не имеет. Поэтому условия и методы ее реализации требуют более подробного рассмотрения.
Наличие моделей (3, 7, 13, 14) интервальной оценки результатов тестирования обеспечивает возможность постановки и решения задачи разработки моделей и процедур управления процессом критериально-ориентированного тестирования, обеспечивающих оперативность этого процесса.
Список литературы Модели и процедуры интервальной оценки результатов контроля знаний в компьютерных системах тестирования ВМФ
- Аванесов В.С. Проблема формы тестовых заданий.URL: http://testolog.narod.ru/Theory32.html
- Ван дер Варден Б.Л. Математическая статистика/Перевод с немецкого. -М.: Изд-во Иностранной литературы, 1960. -436 с. URL: http://www.twirpx.com/file/275786/
- Вадзинский Р.Н. Справочник по вероятностным распределениям. - СПб.: Наука, 2001. - 295с. URL: http://налекцию.рф/content/786 Буравлев А.И., Переверзев В.Ю. Выбор оптимальной длины педагогического теста и оценка надежности его результатов // Открытое образование. 1999. №2. С. 23 -26. URL: http://www.e-joe.ru/sod/99/2_99/st160.html
- Ветров Ю.А. Повышение качества тактической подготовки офицеров запаса ВМФ на основе рационального использования компьютерных технологий обучения: Дис. … канд. пед. наук. -СПб: БГТУ "Военмех", 1999. -193 с.
- Волынец Ю.Ф. Концепция, принципы построения и функционирования инфологической автоматизированной среды подготовки специалистов ВМФ/Под ред. А.Н. Печникова. -Петродворец: ВМИРЭ, 1999. -199с.
- ГОСТ РВ 51540-2005. Военная техника. Термины и определения. -М.: Стандартинформ, 2011. -12с. URL: http://www.twirpx.com/file/1699773/
- ГОСТ РВ 15.205-2004. Система разработки и постановки продукции на производство. Военная техника. Порядок выполнения опытно-конструкторских работ по созданию комплектующих изделий межотраслевого применения. -М.: Стандартинформ, 2005. -65с. URL: http://www.twirpx.com/file/520927/
- Иванов В.Н. Метод автоматизированной оценки качества профессиональной деятельности в корабельных автоматизированных системах: Дис.... канд. воен. наук. -Петродворец: ВМИРЭ, 1999. -187с.
- Кремер Н.Ш. Теория вероятностей и математическая статистика: Учебник для вузов. -2-е изд., перераб. и доп. -М.: Юнити-Дана, 2004. -573 с. URL: http://www.e-joe.ru/sod/99/2_99/st160.html
- Крокер Л., Алгина Дж. Введение в классическую и современную теорию тестов: учебник/пер. с англ. Н.Н. Найденовой, В.Н. Симкина, М.Б. Челышковой; под общ. ред. В.И. Звонникова, М.Б. Челышковой. -М.: Логос, 2010. -668 с. URL: http://www.twirpx.com/file/1346290/
- Мосин В.Д. Моделирование процесса адаптивного управления деятельностью курсантов в ходе практического обучения на автоматизированных тренажерах: Дис.... канд. техн. наук. -Петродворец: ВМИРЭ, 1999. -164с.
- Наумов В.Н. Теоретические основы представления содержания профессиональной подготовки специалистов ВМФ в интеллектуальных обучающих системах: Дис.... докт. воен. наук. -Петродворец: ВВМУРЭ им. А.С. Попова, 1994. -296с
- Печников А.Н. Комплекс методов и моделей оценки качества и эффективности деятельности операторов вооружения и военной техники в тренажерно-обучающих системах ВМФ: Дис.... докт. техн. наук.-СПб.: СПбГЭТУ, 2011.-343 с.
- Печников А.Н., Ветров Ю.А. Проектирование и применение компьютерных технологий обучения. Ч.1. Концепция систем автоматизированного обучения и моделирование процессов деятельности. Кн.1. -СПб: БГТУ, 2002. -195с.
- Печников А.Н., Стручков А.М., Хекерт Е.В. и др. Генератор оценки: Свидетельство о государственной регистрации программ для ЭВМ №2009613362 от 26.06.2009.
- Платов А.Н. Автоматизация управления контролем подготовки на тренажерах ВМФ: Дис.... канд. техн. наук. -СПб: 1 ЦНИИ МО РФ, 2000. -125с.
- Пузырев В.Ю. Диагностика деятельности операторов корабельных электромеханических систем в специализированных тренажерах ВМФ: Дис. … канд. техн. наук. -Новороссийск: НГМА, 2005. -129с.
- Р 50-605-80-93. Система разработки и постановки продукции на производство. Термины и определения (утв. приказом ВНИИстандарта от 9 июля 1993 г. № 18). URL: http://gostrf.com/normadata/1/4293827/4293827526.htm
- Скоров А.А. Методологические основы использования компьютерных технологий обучения в процессе профессиональной подготовки специалистов ВМФ: Дис.... докт. пед. наук. -Петродворец: ВМИРЭ, 2001. -318с
- Стручков А.М. Проектирование компьютерных систем обучения и интеллектуального тренажа: Дис.... канд. техн. наук. -Петродворец: ЗАО "Фирма "Пассат", 2002. -166с.
- Туктаров Р.Р. Модели и процедуры оценки знаний в компьютерных системах тестирования ВМФ: Дис. … канд. техн. наук. -Новороссийск: ГМА им. адмирала Ф.Ф. Ушакова, 2013. -248с.
- Туровская А.О. Квалиметрия результатов выполнения критериально-ориентированных тестов в компьютерных системах тестирования военного назначения: Дис. … канд. пед. наук. -СПб.: ЗАО "Фирма "Пассат", 2010. -226с.
- Хекерт Е.В. Квалиметрия уровня операторской деятельности в компьютерных системах обучения и интеллектуального тренажа ВМФ: Дис. … канд. техн. наук. -Новороссийск: НГМА, 2005. -156с.
- Хекерт Е.В. Методы представления, квалиметрии выполнения и оптимизации алгоритмов операторской деятельности в тренажерно-обучающих системах ВМФ: Дис. … докт. техн. наук. -СПб.: ВИТУ, 2009. -330с.
- Чудаков О.Е. Информационная технология управления качеством подготовки специалистов ВМФ радиоэлектронного профиля: Дис. … докт. техн. наук. -Петродворец: ВМИРЭ им. А.С. Попова, 2010. -347с.
- Шилов К.Ю. Комплекс технических и технологических решений для создания интеллектуальных тренажерных средств подготовки корабельных операторов: Дис.... докт. техн. наук.-СПб.: НПО "Аврора", 2011.-335 с.
- Щербаков Н.В. Рациональная система контроля результатов педагогического процесса в ВВМУ: Дис.... канд. пед. наук. -Л.: ВВМУ им. М.В. Фрунзе, 1999.
- Филиппов П.В. Принципы построения и функционирования автоматизированной системы контроля уровня знаний: Монография. -Петродворец: ВМИРЭ им. А.С. Попова, 2003
- Ханников А.Н. Метод построения эталонов для процедуры автоматизированного контроля знаний в процессе подготовки специалистов-гидрографов ВМФ: Дис. … канд. техн. наук. -Новороссийск: НГМА, 2006. -139с
- Челышкова М.Б. Адаптивное тестирование в образовании (теория, методология, технология). -М: Исследовательский центр проблем качества подготовки специалистов, 2001. -165 с.
- Boyd, John R. (September 3, 1976). Destruction and Creation. U.S. Army Command and General Staff College. URL: http://www.goalsys.com/books/documents/DESTRUCTION_AND_CREATION.pdf
- Berk R.A. Criterion-referenced measurement: The state of art, Baltimor, MD: Johns Hopkins University Press, 1980.
- Wim J. van der Linden. (1982). Passing score and length of a mastery test. Evaluation in Education. 1982, Vol. 5, pp. 149-164. URL: http://doc.utwente.nl/68993/1/Linden82passing.pdf
- Wim J. van der Linden, W.J. (2005). Linear models for optimal test design. New York: Springer-Verlag. 408 p.URL: http://www.springer.com/statistics/social/book/978-0-387-20272-3
- Kaftandjieva, F. (2010). Methods for setting cut scores in criterion-referenced achievement tests: A comparative analysis of six recent methods with an application to tests of reading in EFL. Arnhem, Netherlands: URL: http://www.ealta.eu.org/documents/resources/FK_second_doctorate.pdf
- Kriewall, Thomas Edward. Application of Information Theory and Acceptance Sampling Principles to the Management of Mathematics Instruction. Unpublished doctoral dissertation, University of Wisconsin, 1969.