Особенности использования кросстабуляции в педагогике и образовательном процессе
Автор: Бакаева Ольга Александровна
Журнал: Интеграция образования @edumag-mrsu
Рубрика: Инновации в образовании
Статья в выпуске: 1 (66), 2012 года.
Бесплатный доступ
Раскрываются особенности использования в образовательном процессе непараметрических методов статистики, в частности метода кросстабуляции. Рассматривается построение таблиц сопряженности как простейшей формы кросстабуляции.
Непараметрическая статистика, кросстабуляция, таблицы сопряженности, дихотомия
Короткий адрес: https://sciup.org/147136826
IDR: 147136826
Текст научной статьи Особенности использования кросстабуляции в педагогике и образовательном процессе
На сегодняшний день педагогика сформировалась в многоотраслевую науку, которая находится в тесной взаимосвязи с другими дисциплинами. Такие науки, как математическая статистика, информатика, кибернетика, обеспечивают ее необходимыми средствами диагностической и исследовательской работы.
Новые, дополнительные возможности перед педагогикой открывает статистика, позволяющая исследовать различные закономерности, способы и механизмы управления учебным процессом. Основная задача педагога, ставящего эксперимент, состоит в сборе данных и правильной интерпретации результатов статистических расчетов. С помощью методов математической статистики выявляется обоснованность выводов педагогических исследований.
Использование статистических методов в педагогике, к сожалению, не все- гда сопровождается четкими представлениями о разнообразных возможностях и границах их применения. Часто педагог-исследователь обращается к тому или иному методу анализа данных не потому, что он наиболее целесообразен, а лишь в силу знаний о нем и простоты расчетов. Как следствие, значительная часть прикладных исследований довольствуется упрощенным, одномерным анализом данных, который позволяет делать лишь информационно бедные выводы, игнорируя взаимосвязи между различными педагогическими явлениями, и снижает диагностическую и прогностическую ценность получаемых результатов. Целью экспериментального исследования, как правило, является проверка эффективности того или иного педагогического подхода к решению поставленной задачи [4].
Применение более сложных видов анализа (многомерного, факторного, дис-
персионного, регрессионного и др.) сопряжено с рядом трудностей. Между тем существуют статистические методы, которые пока очень редко встречаются в педагогических исследованиях, несмотря на то что в других областях науки они уже нашли широкое распространение. Это, например, методы непараметрической статистики — сравнительно новой и бурно развивающейся в настоящее время дисциплины анализа данных. С помощью методов непараметрической статистики педагог может проводить корректную математическую обработку данных без освоения сложных разделов высшей математики, при этом значительно упрощаются расчеты и вычисления, что не наносит вреда достоверности выводов.
Непараметрические методы применяются для измерения тесноты связи качественных признаков, а также количественных признаков, распределение которых отличается от нормального. Поскольку указанные методы не требуют обязательного для многих других статистических методов выполнения условия нормальности распределения случайной величины, то они избавляют педагогов-исследователей от необходимости изучения и последующего применения способов проверки нормального закона распределения. Так как проблема нахождения закона распределения является достаточно сложной для педагогов, никак не связанных с математическими дисциплинами, непараметрические методы дают возможность обойти ее, даже не поднимая вопроса о законе распределения.
Особенность непараметрических методов заключается в том, что они учитывают направления изменения значений признаков, но не зависят от интенсивности колебаний значения результативного признака при изменении факторного признака (это позволяют сделать параметрические методы). Непараметрические методы были первыми из методов измерения тесноты взаимосвязи количественных признаков.
Популярность непараметрических методов объясняется широкой областью их применения, простотой математических средств, устойчивостью и доступностью понимания полученных с помощью них выводов. Непараметрические критерии значительно менее трудоемки, чем параметрические, а при работе с качественными переменными признаются самыми эффективными и точными критериями для выявления связи.
Непараметрическая статистика, как уже упоминалось, рассматривает только такие ситуации, в которых о функциональном виде распределений ничего не известно. Единственной априорной информацией считается информация о характере случайных величин (например, непрерывны они или дискретны) и о типе различий между их распределениями. Легко заметить, что многие психологические и педагогические исследования с чисто математической стороны сводимы именно к данному кругу вопросов [1].
Основным методом непараметрического анализа данных считается кросстабуляция. Этот способ обработки данных является одним из самых простых и потому часто используемых. Если вариационный ряд характеризует одну переменную, то построение таблиц сопряженности признаков — кросстабуляция (cross-tabulation) — помогает увидеть одновременно значения двух и более переменных.
Кросстабуляция (перекрестная классификация) — это процесс объединения двух (или нескольких) таблиц частот в одну так, чтобы каждая ячейка в построенной таблице представлялась единственной комбинацией значений кросста-булированных переменных. Таким образом, кросстабуляция позволяет совместить частоты появления наблюдений на разных уровнях рассматриваемых факторов. Исследуя данные частоты, можно определить зависимости между переменными. Обычно табулируются категориальные переменные или переменные с небольшим числом значений.
Простейшая форма кросстабуляции — таблица сопряженности 2x2, в которой значения двух переменных пересечены (сопряжены) на разных уровнях и каждая переменная принимает только два значения.
Таблицы сопряженности — это инструмент, позволяющий проводить анализ связей между двумя и более переменными. Категории одной переменной помещают в таблицу так, чтобы они соответствовали категориям другой переменной. Распределение частот одной переменной подразделяется на группы в зависимости от категорий других переменных. Обычно таблица совместного распределения частот для двух категориальных переменных строится так, что строки соответствуют значениям одной, а столбцы — другой переменной:
В |
В 2 |
Всего |
|
Я 1 |
/2 |
/0 |
|
Я 2 |
к |
f 22 |
f 20 |
Всего |
f o. |
f 02 |
f 00 |
Здесь / 11 — число элементов выборки, обладающих признаками A и B одновременно; f — число элементов выборки, обладающих признаком Я, но не обладающих признаком В ; f 21 — число элементов выборки, обладающих признаком В, но не обладающих признаком Л; f — число элементов выборки, не обладающих ни одним из признаков [2].
Построение таблиц сопряженности дает ответы на многие практические вопросы в экономике, и в частности в маркетинге, в массовых обследованиях и социологии, медицине и биологии, политологии и контроле качества и, конечно же, в педагогике и образовательном процессе [1; 5].
В области педагогики кросстабуляция играет большую роль, так как позволяет выявлять зависимости между качественными признаками, которые преобладают над количественными. В образовании в равных долях важен как сам процесс обучения, так и его результат, который выражается отметкой, полученной школьником или студентом. Так как на процесс обучения влияют и преподаватель, и обучаемые, то результат может зависеть от достаточно большого количества факторов.
Результат обучения обычно представляется как переменная, измеренная в ранговой шкале или шкале наименований. В том случае, если результат обучения — дифференцированная оценка, ее значениями будут категории, для которых справедливо отношение порядка. Например, известно, что отметка «три» хуже отметки «четыре». Данная система оценивания обычно используется на уроке, семинаре и экзамене. Достаточно часто можно встретить переменную «результат обучения», значениями которой являются объекты, разделенные на классы без отношения порядка и принимающие только два значения — «зачет»/ «незачет». В этом случае переменная «результат обучения» является дихотомической.
Дихотомия (от греч. разделять или рассекать на две части) — это переменная, принимающая два значения — 0 или 1, а в текстовом виде — «нет» или «да». При работе с такими переменными, как «пол» (мужской/женский), «статус обучаемого» (школьник/студент, обучение на бюджетной основе или на коммерческой, наличие/отсутствие задолженностей), дихотомия прослеживается явно, так как переменные имеют дискретную альтернативную природу [3].
Факторы, от которых зависит значение переменной «результат обучения», условно можно разделить на индивидуальные, зависящие от самого учащегося, и общественные, которые складываются под влиянием окружения. К индивидуальным относятся пол, возраст и возрастные особенности личности, качества обучаемого, заинтересованность в учебном процессе; к общественным — атмосфера в коллективе (классе, группе), наличие друзей среди одноклассников, отношения «преподаватель — обучаемый», методика преподавания, участие семьи в учебном процессе, престижность конкретного учебного заведения.
Все вышеперечисленные факторы можно табулировать с переменной «результат обучения», а некоторые из них и между собой.
Рассмотрим на конкретном примере, как с помощью кросстабуляции можно определить зависимость уровня успеваемости учащихся от выбранной методики преподавания. Для этого следует произвести выборку среди учащихся, а затем вычислить количество обучающихся, обладающих различными значениями сочетаний факторов. Пусть переменная «результат обучения» имеет четыре значения:«неудовлетворительно»,«удовлетворительно», «хорошо» и «отлично», а переменная «методика преподавания» — две категории, условно названные «Методика 1», «Методика 2». Построим таблицу сопряженности переменных:
Результат обучения |
Методика преподавания |
Всего |
|
мето дика 1 |
методика 2 |
||
Неудовлетворительно |
/> |
/2 |
/ 10 |
Удовлетворительно |
/ 21 |
/ 22 |
/ 20 |
Хорошо |
Л- |
/ 32 |
/ 30 |
Отлично |
/ц |
/ 42 |
/ 40 |
Всего |
- |
/ 02 |
/ 00 |
На основании данной таблицы можно сделать выводы:
Современные методы математической статистики призваны с максимальной тщательностью и достоверностью обрабатывать результаты различного рода исследований, в том числе педагогических. Чтобы наиболее эффективно и с минимальными затратами выявлять зависимость между переменными в области педагогики и в образовательном процессе, необходимо использовать методы непараметрической статистики, и в частности кросстабуляцию, так как они имеют ряд неоспоримых преимуществ и служат универсальными средствами для анализа и оценки тесноты связи между переменными различного рода.
СПИСОК
ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
-
1. Анализ нечисловой информации в социологических исследованиях / под ред. В. Г. Андреенкова [и др.]. — Москва : Наука, 1985. — 222 с.
-
2. Аптон, Г. Анализ таблиц сопряженности / Г. Аптон. — Москва : Финансы и статистика, 1982. — 145 с.
-
3. Бакаева, О. А. Предварительная обработка статистических данных / О. А. Бакаева // XXXVIII Огаревские чтения : материалы научной конференции : в 3 ч. — Саранск, 2010. — Ч. 2. — С. 303—306.
-
4. Грабарь, М. И. Применение математической статистики в педагогических исследованиях. Непараметрические методы / М. И. Грабарь, К. А. Краснянская. — Москва : Педагогика, 1977. — 136 с.
-
5. Новиков, Д. А. Статистические методы в педагогических исследованиях (типовые случаи) / Д. А. Новиков. — Москва : МЗ-Пресс, 2004. — 67 с.
Поступила 14.11.11.