К вопросу об оптимизации обработки результатов исследований аспирантами физкультурных вузов

Бесплатный доступ

Компетентностный подход в сфере высшего профессионального образования предполагает владение выпускниками информационными технологиями в профессиональной деятельности. В статье рассматривается пример использования возможностей электронных таблиц EXCEL при проверке статистической гипотезы. Применение «машинного» метода обработки данных позволяет избежать ошибок вычислительного характера и существенно экономит время будущих молодых ученых в области физической культуры и спорта.

Статистический инструментарий, "машинный" способ обработки результатов исследований

Короткий адрес: https://sciup.org/14263738

IDR: 14263738

Текст научной статьи К вопросу об оптимизации обработки результатов исследований аспирантами физкультурных вузов

Модернизация системы высшего образования настойчиво требует качественных изменений не только в организации образовательного процесса в целом, но и в более узких вопросах. Конкурентоспособность выпускника высшего учебного заведения на рынке труда не в последнюю очередь определяется уровнем владения статистическим инструментарием. Научноисследовательский компонент статистического мышления явля- ется определяющим при оценке потенциала научного сотрудника. Остановимся на проблеме выбора инструментов обработки результатов научных исследований. Актуальность перехода от «ручных» методик к широкому использованию «машинных» преобразований полученных данных не вызывает сомнений. Особенно важным является этот процесс для высших учебных заведений, специализация которых не предусматривает глубокого освоения статистических дисциплин. К этому классу относятся и физкультурные вузы. Студенты таких учебных заведений, осваивая математические основы обработки данных и интерпретируя полученные результаты, зачастую весьма условно определяют место данной отрасли человеческого знания в своей будущей профессиональной деятельности (если вообще полагают, что будут использовать в дальнейшем полученные умения и навыки). Между тем, уже в первые годы учебы в аспирантуре, определившись с темой диссертационного исследования, молодые люди сталкиваются с проблемой выбора математического аппарата, обеспечивающего высокий уровень значимости предполагаемых выводов.

Если учебно-методическая литература изобилует схемами выбора статистических критериев для проверки тех или иных статистических гипотез в зависимости от объема и количества сопоставляемых выборок, числа разрядов и тому подобное, то относительный объем литературы, позволяющей аспиранту избежать расчетных ошибок путем использования потенциала программных средств, к сожалению, невелик.

Рассмотрим в качестве образца один из наиболее простых в использовании непараметрических критериев – критерий знаков G. В пособиях по статистике определено, что указанный выше критерий предназначен для установления общего направления сдвига исследуемого признака. Он позволяет установить, в какую сторону в выборке в целом изменяются значения признака при переходе от первого измерения ко второму: изменяются ли показатели в сторону улучшения, повышения или усиления или, наоборот, в сторону ухудшения, понижения или ослабления.

Широкое использование указанного критерия аспирантами физкультурных вузов связан со спецификой исследований в данной сфере человеческого знания. Определение степени эффективности того или иного метода совершенствования физической подготовки спортсмена неразрывно связано со сравнительным анализом тех или иных показателей субъектов исследования до и после экспериментального воздействия. Наибольшую наглядность в этом случае обеспечивает критерий знаков.

Следует отметить, что при оценке сдвига значений исследуемого признака, проводимой на основе результатов двух замеров на одной и той же выборке испытуемых, наряду с критерием знаков G, может быть использован и критерий Т Вилкоксона. Последний позволяет установить не только направленность изменений, но и их выраженность. С его помощью можно определить, является ли сдвиг показателей в каком-то одном направлении более интенсивным, чем в другом. Однако критерий Т Вилкоксона применим только в тех случаях, когда значения признака измерены по крайней мере по шкале порядка и сдвиги между вторым и первым замерами также могут быть упорядочены. Проводится ранжирование всех сдвигов по абсолютной величине, а затем суммируются ранги отдельно по каждому виду сдвигов. При случайности сдвигов полученные суммы будут приблизительно равны. В противном случае одна из сумм будет существенно ниже. К числу недостатков критерия Т Вилкоксона также относится ограниченность объема выборки (от 5 до 50 человек). Алгоритм исследования при помощи данного критерия имеет вид [2]:

  • 1.    Составить список испытуемых в любом порядке, например, в алфавитном.

  • 2.    Вычислить разность между индивидуальными значениями во втором и первом замерах. Определить, что будет считаться «типичным» сдвигом и сформулировать соответствующие гипотезы.

  • 3.    Перевести разности в абсолютные величины и записать их по отдельным столбцам (иначе трудно отвлечься от знака).

  • 4.    Проранжировать абсолютные величины разностей, начисляя меньшему значению меньший ранг. Проверить совпадение полученной суммы рангов с расчетной.

  • 5.    Отметить кружками или другими знаками ранги, соответствующие сдвигам в «нетипичном» направле-

  • нии.
  • 6.    Подсчитать сумму рангов по формуле:

    T = Z R


  • 7.    Определить критические значения Т по таблице для данного объема выборки n .

  • 8.    Если эмпирическое значение критерия меньше

, где Rt – ранговые значения сдвигов с бо- лее редким знаком.

или равно критическому, сдвиг в типичную сторону по интенсивности достоверно преобладает.

Несомненным достоинством критерия знаков G по сравнению с критерием Т Вилкоксона является его применимость как к тем сдвигам, которые можно определить количественно (например, сокращение времени работы над заданием после экспериментального воздействия), так и к тем сдвигам, которые могут быть измерены лишь качественно (например, изменение отрицательного отношения к чему-либо на положительное). Простота расчетов и «универсальность» критерия определяют его привлекательность для аспирантов. В теоретической статистике с помощью критерия знаков проверяется нулевая гипотеза о том, что две выборки имеют одну и ту же функцию распределения. Кроме того, данный критерий может быть использован при распределениях, далеких от нормального, позволяет обнаружить существенные различия, когда t-критерий Стьюдента их не выявляет [3].

Ограничения критерия знаков достаточно условны: количество наблюдений в проводимых замерах может колебаться от 5 до 300.

Использование критерия предполагает классификацию сдвигов на «типичные» и «нетипичные». Преобладающие сдвиги называем типичными сдвигами, а сдвиги более редкого, противоположного направления, нетипичными. Суть критерия знаков состоит в том, что он определяет, не слишком ли много наблюдается «нетипичных сдвигов», чтобы сдвиг в «типичном» направлении считать преобладающим. Ясно, что чем меньше «нетипичных сдвигов», тем более вероятно, что преобладание «типичного» сдвига является преобладающим. Gэмп. – это количество «нетипичных» сдвигов. Чем меньше Gэмп., тем более вероятно, что сдвиг в «типичном» направлении статистически достоверен.

Приведем алгоритм расчета критерия знаков, который рассмотрен в пособиях по приложению математических методов в исследовательской деятельности [2]:

  • 1.    Проверить выполнение ограничений.

  • 2.    Занести данные измерений до и после экспериментального воздействия в таблицу.

  • 3.    Сдвиг количественно не подсчитывается, ставится просто знак разности (« + » или « – »), когда из значения «после воздействия» вычитается значение «до воздействия»; если разность эта равна нулю, то в таблице пишут нуль.

  • 4.    Подсчитать количество нулевых реакций и исключить их из рассмотрения, задав новый объем выборки на основе количества ненулевых сдвигов.

  • 5.    Определить, каких сдвигов больше: положительных или отрицательных, и задать «типичные» и «нетипичные» сдвиги.

  • 6.    Сформулировать гипотезы:

  • 7.    Подсчитать количество «нетипичных» сдвигов и найти эмпирическое значение G-критерия: Gэмп. равно количеству «нетипичных» сдвигов.

  • 8.    По таблице согласно значению n найти Gкр (p ≤ 0,05) и Gкр. (p ≤ 0,01). .

  • 9.    Если Gэмп. ≤ Gкр. на некотором уровне значимости, то H0 отвергается, а H1 принимается на этом уровне значимости; если Gэмп. > Gкр. на некотором уровне значимости, то H0 принимается на том же уровне значимости.

Но: Сдвиг в типичную сторону является случайным;

H1: Сдвиг в типичную сторону является неслучайным.

Однако некоторые аспиранты, получив в результате проведенного эксперимента доминирующие положительные сдвиги исследуемого признака, полагают, что произведенные ими воздействия достаточно эффективны и пренебрегают научным обоснованием этого заключения. Между тем, отвлекаясь от прикладной направленности исследования и полагаясь на оптимальность математической модели, они односторонне интерпретируют итоги проверки статистических гипотез.

Рассмотрим пример анализа результатов эксперимента, проведенного аспиранткой Л.

В одной и той же группе спортсменов примерно одинакового уровня физического развития и физической подготовленности произведены два замера показателя жизненной емкости легких (ЖЕЛ) – до начала цикла тренировок с увеличенным аэродинамическим сопротивлением дыханию или «до эксперимента» и после окончания цикла данных тренировок или «после эксперимента». Можно ли считать эксперимент эффективным, если результаты таковы:

QJ 3

>4 E 3 5 s

1

2

3

4

5

6

7

8

9

10

О

i=;

3400

3600

3000

3500

2900

3100

3200

3400

3200

3400

cu E^

О

3800

3600

3300

3400

3100

3200

3200

3700

3500

3600

Решение:

Оценки испытуемых в общей массе после воздействия возросли, то есть без статистической обработки данных можно было бы сделать вывод об эффективности обучения.

  • 1.    Так как речь идет об одной группе испытуемых, то следует применить G – критерий знаков, согласно алгоритму.

  • 2.    Проверим ограничения. Так как n = 10 и 5 < 10 < 300, то критерий применим.

  • 3.    Заполним таблицу:

    QJ 3

    §4 E 3

    s

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    6

    1=;

    3400

    3600

    3000

    3500

    2900

    3100

    3200

    3400

    3200

    3400

    0

    1=;

    ^

    3800

    3600

    3300

    3400

    3100

    3200

    3200

    3300

    3500

    3600

    6

    5C

    0

    5

    +

    0

    +

    -

    +

    +

    0

    -

    +

    +

  • 1.    Подсчитаем количество нулевых реакций и найдем новый объем выборки. Количество n0 = 2, значит n = 10 – 2 = 8 – новый объем выборки.

  • 2.    Подсчитаем количество положительных и отрицательных сдвигов: сдвигов « + » – 6, сдвигов « – » – 2. Значит, « + » сдвиги – «типичные», а « – » сдвиги – «нетипичные».

  • 3.    Сформулируем гипотезы:

  • 4.    Найдем Gэмп., равное количеству «нетипичных сдвигов» – 2.

  • 5.    По таблице для критерия знаков приложения для n = 8 найдем Gкр. (p ≤ 0,05) = 1 и Gкр. (p ≤ 0,01) = 0.

  • 6.    Так как Gэмп. > Gкp. (p ≤ 0,05), то Но принимается, т. е. различия случайны.

H0: Сдвиг показателей в типичную сторону является случайным;

H1: Сдвиг показателей в типичную сторону является неслучайным.

Вывод: эксперимент нельзя считать эффективным.

Полученный статистически вывод приводит аспирантов в замешательство. Очевидный факт опровергнут, и это вызывает чувство дискомфорта. Ошибка начинающих исследователей состоит в том, что они не учли малый объем рассмотренной выборки. Устранить возникший внутренний конфликт можно путем существенного увеличения количества испытуемых. Однако при этом возникает проблема возможной ошибки при подсчете количества нулевых, положительных и отрицательных сдвигов, что влечет за собой неверное определение критических значений критерия, его эмпирического значения, и, в конечном итоге, приводит к неверной интерпретации результатов исследования.

Исключить негативные моменты, возникающие при рассмотрении выборок большого объема, может использование потенциала различных статистических пакетов. Широкими возможностями в данном аспекте обладают электронные таблицы EXCEL.

Рассмотрим, как может быть осуществлена проверка выдвинутых ранее статистических гипотез в EXCEL. Используем правила оформления, предложенные в учебно-методической литературе [1].

При этом в соответствующие ячейки таблицы вводятся следующие формулы (символ « » разделяет адрес ячейки и формулу):

(E6) =ЕСЛИ(D6-C6>0;”+”;ЕСЛИ(D6-C6<0;”-”;”0”))

(E15) =ЕСЛИ(D15-C15>0;

”+”;ЕСЛИ(D15-C15<0;”-”;”0”))

(многоточие означает дублирование формулы со сменой адресов ячеек)

(E16) =СЧЁТЕСЛИ(E6:E15;»+»)

(E17) =СЧЁТЕСЛИ(E6:E15;»-»)

(E18) =ЕСЛИ(МАКС(E16:E17);B16;B17)

(E19) =МИН(E16:E17)

(F21) =E19

(F22) =G20-F21

A

в

Е

F

G

Н

I

J

1

Применение критерия знаков G.

2

3

Показатели ЖЕЛ (мл) спортсменов до и после эксперимента

4

5

X до экспер.

Уi после экспер

Сдвиг

6

1

3400

3800

-

7

2

3600

3600

0

8

3

3000

3300

-

9

4

3500

3400

-

10

5

2900

3100

-

11

6

3100

3200

■+

12

7

3200

3200

0

13

8

3400

3300

-

14

9

3200

3500

-

15

10

3400

3600

■+

16

Положит сдвиги

6

17

Отрицательные сдвиги

2

18

Типичные сдвиги

Положит сдвиги

19

Нетипичные сдвиги GM

2

20

п=

10

21

пз=

2

22

значит п=

8

новый объем выборки

23

сдвигов **» - 6. сдвигов «-» - 2. Значит, «+» сдвиги - «типичные», а « - » сдвиги - «нетипичные»:

24

Выдвигаем гипотезу: НуСдвиг показателей в типичную сторону является случайным

25

Н, Сдвиг показателей в типичную сторону является неслучайным

26

G1Un. равное количеству «нетипичных сдвигов» = 2

27

По таблице для п = 8 найдем GKp. (р 2 0.05) =

1

28

GKP. (р^ 0.01) =

0

29

Проверяем нуль-гипотезу сравнивая G3un и GKp

30

Так как G^n > GKp (р 2 0,05). то Но принимается, т. е различия случайны.

31

Вывод: эксперимент нельзя считать эффективным.

Очевидно, что увеличение объема выборки в несколько десятков раз повлечет только изменение адресов ячеек.

Выводы

Рассмотренный пример является наиболее простой иллюстрацией целесообразности использования возможностей электронных таблиц EXCEL. Таким образом, широкое использование современных инструментов обработки статистических данных позволяет оптимизировать деятельность молодого ученого, что особенно важно для будущих специалистов в области физической культуры и спорта.

CONCERNING THE OPTIMIZATION OF THE PROCESSING

THE RESULTS OF SOME RESEARCHES

MADE BY POST-GRADUATE STUDENTS

Статья научная