Обоснование оптимального выбора статистического критерия для решения одновыборочной задачи при статистической обработке результатов психологических исследований
Автор: Куликов В.С.
Журнал: Волгоградский научно-медицинский журнал @bulletin-volgmed
Рубрика: Новые методы в эксперименте и клинике
Статья в выпуске: 1 (61), 2019 года.
Бесплатный доступ
Исследуются условия применимости статистических критериев Стьюдента и Вилкоксона при решении одновыборочной задачи о положении. Последствия нарушения соответствия формы распределения данных нормальному закону оцениваются методом Монте-Карло с последующей оценкой частот ошибок первого рода. Показано, что при выраженной асимметрии распределения признака использование критерия Стьюдента для решения одновыборочной задачи может вести к ошибочной интерпретации результатов при подведении итогов психологического исследования. Дан алгоритм непараметрического решения одновыборочной задачи в компьютерных статистических пакетах, которые включают непараметрический критерий Вилкоксона для парных (зависимых) выборок.
Психологическое исследование, статистическая одновыборочная задача о положении, одновыборочный критерий стьюдента, одновыборочный критерий вилкоксона
Короткий адрес: https://sciup.org/142224314
IDR: 142224314
Текст научной статьи Обоснование оптимального выбора статистического критерия для решения одновыборочной задачи при статистической обработке результатов психологических исследований
При статистической обработке результатов психологических экспериментов часто возникает необходимость сравнения некоторой константы и величины, отражающей меру центральной тенденции, полученной на выборке. Таковы, например, задача сравнения единичного наблюдения с выборочными дан- ными, задача сравнения известного математического ожидания генеральной совокупности с его выборочной оценкой, задача выбора оптимального шага шкалы при нормировании новой измерительной процедуры. Все эти задачи относятся к классу одновыборочных задач о положении.
Если анализ выборки позволяет предполагать нормальное распределение данных в генеральной совокупности, для решения одновыборочной задачи используется одновыборочный параметрический критерий Стьюдента. В этом случае константа сравнивается со средним арифметическим выборки. Использование одновыборочного критерия Стьюдента автоматизировано в большинстве популярных статистических компьютерных пакетов (SPSS, Statistica, AtteStat).
Иная ситуация складывается для случаев решения одновыборочной задачи о положении для распределений, не подчиняющихся нормальному закону, для которых использование критерия Стьюдента теоретически непригодно. Принципиально существует возможность решения этой задачи непараметрическими методами и разработан алгоритм её решения с помощью свободных от распределения критерия знаков и критерия знаковых рангов Вилкоксона [7]. Однако такое решение непопулярно, а в перечисленных выше компьютерных статистических пакетах функция непараметрического решения одновыборочной задачи включена только в SPSS, начиная с 21-й версии.
При этом в одних учебных пособиях по прикладной статистике для психологов, изданных в XXI веке, решение одновыборочной задачи о положении с использованием критерия Стьюдента рассматривается [4, 5, 7, 8], в других – нет [1, 3, 9, 10]. В то же время в доступной литературе не было встречено работ, рассматривающих непараметрическое решение одновыборочной задачи (некоторым исключением является учебник А. Н. Кричевца с соавт., где приведён пример построения доверительного интервала медианы с использованием критерия знаковых рангов Вилкоксона [4]).
Возникает вопрос, по какой причине литературные источники и разработчики статистических компьютерных пакетов обходят вниманием решение одновыборочной задачи непараметрическими методами. Может быть искажения, вызванные отличиями формы распределения от нормального, для рассматриваемого класса задач невелики и на практике достаточно использования во всех случаях одновыборочного критерия Стьюдента?
ЦЕЛЬ РАБОТЫ
Оценить величину искажений, вызванных использованием одновыборочного критерия Стьюдента в случаях значимых отличий формы исследуемых распределений от нормального закона.
МЕТОДИКА ИССЛЕДОВАНИЯ
Для оценки величины искажений использовался метод Монте-Карло. С помощью программных средств были сгенерированы семейства выборок случайных чисел с распределениями следующих форм:
-
- нормальное с параметрами (0;1);
-
- равномерное с параметрами (-1;1);
-
- асимметричное «кубическое» с формой плотности распределения, близкой к p(x) = x3 на интервале {0 – 1};
-
- асимметричное «обратно пропорциональное» с формой плотности распределения, близкой к p(x) = x(-1) на интервале {0 – 1};
Для каждой формы распределения было получено 1000 выборок. 500 выборок объёма 15–40 наблюдений; 500 выборок объёма 50– 100 наблюдений. Для семейства выборок с «кубическим» распределением среднее значение коэффициента асимметрии составило -1,5, для семейства выборок с «обратно пропорциональным» распределением среднее значение коэффициента асимметрии составило 2.
Для каждой выборки была решена одновыборочная задача о положении двумя способами: с использованием критерия Стьюдента и с использованием непараметического критерия Вилкоксона. Величина константы всякий раз подбиралась таким образом, чтобы уровень статистической значимости её отличия от среднего арифметического составлял около 0,05 (на границе критической зоны принятия решения о различиях).
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ И ИХ ОБСУЖДЕНИЕ
При нормальном распределении случайной величины средняя статистическая значимость различий по Стьюденту на 15 % менее (по величине), чем по Вилкоксону для выборок объёма менее 40 и на 3 % менее для выборок объёма 50–100. Имеет место сближение результатов этих тестов по мере увеличения объема выборки. Выявленные различия уровня значимости (рассчитанные параметрическим и непараметрическим способами) не имеют практического значения для анализа результатов психологических исследований.
При равномерном распределении случайной величины средняя величина статистической значимости различий по Стьюденту на 3 % более (по величине), чем по Вилкоксону для выборок объёма менее 40 и на 15 % более для выборок объёма 50–100. Для объёма выборки 100 и менее наблюдений наличие эксцесса не оказывает практически значимого влияния на результаты анализа психологических исследо- ваний. При увеличении объёма выборки имеет место тенденция нарастания вероятности ошибочно принять нулевую гипотезу, используя критерий Стьюдента. Поэтому для больших выборок (свыше 100 наблюдений), имеющих форму распределения, близкую к равномерной, предпочтительнее решать одновыборочную задачу с использованием критерия Вилкоксона.
Различие результатов решения одновыборочной задачи по Стьюденту и по Вилкоксону гораздо сильнее и практически значимо при наличии асимметрии распределения. При этом, на величину различий влияет не только объём выборки, но и положение сравниваемой константы относительно среднего арифметического выборки.
Так, при положительной асимметрии ( p(x) ≈ x-1 ) критерий Стьюдента завышает величину статистической значимости отличий для выборок объёма менее 40 в 1,5 раза, а для выборок объёма 50–100 – в 7 раз для случаев, когда сравниваемая константа находится правее среднего арифметического выборки на числовой оси. Если константа менее среднего арифметического, имеет место занижение по Стьюденту величины статистической значимости отличий на 50 % для выборок объёма менее 40 и на 85 % для выборок объёма 50–100.
Аналогичная, но обратная ситуация имеет место при отрицательной асимметрии ( p(x) ≈ x3 ). В этом случае, если константа более среднего арифметического, критерий Стьюдента занижает величину статистической значимости отличий для выборок объёма менее 40 на 50 %, а для выборок объёма 50–100 – на 90 %. Если константа менее среднего арифметического, имеет место завышение по Стьюденту величины статистической значимости отличий в 1,5 раза для выборок объёма менее 40 и в 5 раз для выборок объёма 50–100.
ЗАКЛЮЧЕНИЕ
При выраженной асимметрии распределения признака использование критерия Стьюдента для решения одновыборочной задачи может вести к противоположной (ошибочной) интерпретации результатов при подведении итогов психологического исследования, особенно в интервале статистической значимости различий от 0,01 до 0,05. Причём вероятность ошибки растёт с увеличением объёма выборки.
В психологии использование непараметрического метода решения одновыборочной задачи особенно актуально, поскольку количественные результаты значительной части психологических исследований получены методами субъективного шкалирования, что принципиально не гарантирует соответствия этих результатов интервальной шкале, необходимой для корректного использования критерия Стьюдента.
В соответствии с алгоритмом непараметрического решения одновыборочной задачи, использованным М. Холлендером и Д. Вулфом [7], корректным видится следующий порядок действий для её решения во всех статистических компьютерных пакетах, которые включают непараметрический критерий Вилкоксона для парных (зависимых) выборок, но не имеют в своём составе функции для непараметрического решения одновыборочной задачи:
-
1. Создать «искусственную выборку», равную по объёму исследуемой и состоящую только из значений константы, подлежащей сравнению с выборочными данными.
-
2. В соответствии с правилами интерфейса используемого статистического пакета провести процедуру непараметического сравнения исследуемой и искусственной выборок как парных, по критерию Вилкоксона.
-
3. Интерпретировать полученные результаты как результаты непараметрического решения одновыборочной задачи сравнения исследуемой выборки с рассматриваемой константой.
-
7. Холлендер, М. Непараметрические методы статистики / М. Холлендер, Д. Вулф. – М. : МЗ-Пресс, 2004. – 170 с.
-
8. Наследов А. Д. Математические методы психологического исследования. Анализ и интерпрета-
ция данных: учебное пособие / А. Д. Наследов. – СПб.: Речь, 2004. – 392 с.
-
9. Реброва О. Ю. Статистический анализ медицинских данных / О. Ю. Реброва // Применение пакета прикладных программ STATISTICA. – М.: МедиаСфера, 2002. – 312 с.
-
10. Сидоренко Е. В. Методы математической обработки в психологии / Е. В. Сидоренко. – СПб.: ООО «Речь», 2000. – 350 с.
Предлагаемая несложная процедура позволит избежать весьма вероятной ошибки, возникающей в ситуациях, когда данные, измеренные в интервальной шкале, не соответствуют нормальному закону из-за асимметрии и когда числовые данные получены методами субъективного шкалирования.
ЛИТЕРАТУРА ском образовании на основе педагогического эксперимента по плану Д. Кемпбелла / В. С. Куликов, С. В. Матвеев, В. И. Чумаков // Научное обозрение. Педагогические науки. – 2017. – № 6. – С. 84–92.
Список литературы Обоснование оптимального выбора статистического критерия для решения одновыборочной задачи при статистической обработке результатов психологических исследований
- Ермолаев О. Ю. Математическая статистика для психологов: учебник / О. Ю. Ермолаев. - 2-е изд. испр. - М.: Московский психолого-социальный институт: Флинта, 2003. - 336 с.
- Ермолаев-Томин О. Ю. Математические методы в психологии: учебник / О. Ю. Ермолаев-Томин. -5-е изд., испр. и доп. - М.: Издательство Юрайт, 2016. - 511 с.
- Кричевец, А. Н. Математическая статистика для психологов: учебник для студ. учреждений высш. проф. образования / А. Н. Кричевец, А. А. Корнеев, Е. И. Рассказова. - М.: Издательский центр "Академия", 2012. - 400 с.
- Кричевец, А. Н. Математика для психологов: Учебник / А. Н. Кричевец, Е. В. Шикин, А. Г. Дьячков / Под ред. А.Н. Кричевца. - М.: Флинта: Московский психолого-социальный институт, 2003. - 376 с.
- Куликов В. С. Исследование зависимости летной успеваемости курсантов ВВАУЛ от типа их информационного метаболизма / В. С. Куликов // Качинские чтения IV. Сборник статей. - Волгоград, Качинское ВВАУЛ, 1999 г. - 105 с.
- Куликов, В. С. Технология диагностики результативности педагогической технологии в медицинском образовании на основе педагогического эксперимента по плану Д. Кемпбелла / В. С. Куликов, С. В. Матвеев, В. И. Чумаков // Научное обозрение. Педагогические науки. - 2017. - № 6. - С. 84-92.
- Холлендер, М. Непараметрические методы статистики / М. Холлендер, Д. Вулф. - М.: МЗ-Пресс, 2004. - 170 с.
- Наследов А. Д. Математические методы психологического исследования. Анализ и интерпретация данных: учебное пособие / А. Д. Наследов. -СПб.: Речь, 2004. - 392 с.
- Реброва О. Ю. Статистический анализ медицинских данных / О. Ю. Реброва // Применение пакета прикладных программ STATISTICA. - М.: МедиаСфера, 2002. - 312 с.
- Сидоренко Е. В. Методы математической обработки в психологии / Е. В. Сидоренко. - СПб.: ООО "Речь", 2000. - 350 с.