Упрощенная методика проверки нормальности распределения статистической совокупности на основании показателей асимметрии и эксцесса в среде Microsoft Word
Автор: Евтушенко Б.В., Евтушенко М.Б.
Статья в выпуске: 1 (5), 2015 года.
Бесплатный доступ
Рассматривается упрощенная методика проверки нормальности распределения статистической совокупности в среде пакета Microsoft Word с использованием таблиц-закладок, которые позволяют существенно повысить надежность ввода исходных данных и всего расчета в целом. После ручного или автоматического ввода исходных данных весь дальнейший вычислительный процесс происходит при автоматической передаче исходных данных и результатов промежуточных расчета в далее расположенные вычислительные таблицы.
Таблица-закладка, асимметрия, эксцесс, проверка нормальности распределения, центральный эмпирический момент, условная варианта
Короткий адрес: https://sciup.org/140129901
IDR: 140129901
Текст научной статьи Упрощенная методика проверки нормальности распределения статистической совокупности на основании показателей асимметрии и эксцесса в среде Microsoft Word
На практике нередко характеристики эмпирических статистических рядов рассчитывают в предположении, что ряды распределены по нормальному закону без должного обоснования этой гипотезы, так как этот закон распределения наиболее распространен и детально разработан. Вместе с тем такое обоснование должно является необходимым этапом при рассмотрении эмпирических совокупностей, что позволит избежать весьма серьезных ошибок.
Наиболее просто проверить исходную статистическую совокупность на нормальность можно на основании показателей асимметрии и эксцесса, по значениям которых судят о близости распределения статистической совокупности к нормальному закону, что бывает существенно важно при оценке результатов корреляционного и регрессионного анализа и вероятностной оценки прогнозов.
Если распределение можно считать нормальным, то характеристики, рассчитанные на основании этой статистической совокупности, будут достоверными. Если же фактическое распределение не удовлетворяет требованиям к асимметрии и эксцессу нормального распределения, то необходимо применить более мощные критерии.
При нормальном распределении показатели асимме- трии и эксцесса равны нулю, поэтому задача сводится к определению показателей (коэффициентов) асимметрии и эксцесса я оценки фактического ряда распределения.
Эмпирические коэффициенты асимметрии и эксцесса определяются по формулам: m3
m4 ств
ек =
“s — 3 "в
где m3 и m4 — центральные эмпирические моменты тре- тьего и четвертого порядков; <7g — эмпирическое среднее квадратное отклонение случайной величины от ее среднего значения.
Ограничиваясь в дальнейшем рассмотрением равноотстоящих вариационных рядов с постоянным шагом h (шаг равен разности между любыми двумя соседними вариантами ряда) удобно вычислять эти моменты методом сумм по формулам:
_ м;-зм;м;+2(м;)3 тз -
М;-4М;Мз+6(М1*)2М2-3(М1*)4
где м — — условные моменты k -го порядка;
II ■ = ——-
' h условная варианта: xi — первоначальная варианта; С — ложный ноль — варианта, имеющая наибольшую частоту либо любая варианта, расположенная примерно в середине вариационного ряда.
При совместном использовании метода сумм и метода условного нуля условные моменты вычисляют по формулам:
d
Ml
M^
п
8г + 252
П
м; =
п d^+6d2 + 6d3

где di=ai–bi, si=ai+bi где ai, bi — накопленные частоты первой и второй половины вариантов эмпирического ряда.
Дальнейшее рассмотрение методики вычисления параметров фактического ряда рассмотрим на конкретном при- мере расчета асимметрии и эксцесса для эмпирического ряда объемом n=100 заданного в таблице-закладке 1, в первой строке которой указаны варианты ряда, а во второй — частоты вариант.
Таблица 1
Вариант, хi |
48 |
52 |
56 |
60 |
64 |
68 |
72 |
76 |
80 |
84 |
Частота, ni |
2 |
4 |
6 |
8 |
12 |
30 |
18 |
8 |
7 |
5 |
Исходные данные в таблицу 1 вводятся вручную непо- средственно с клавиатуры, а затем ее превращают в закладку.
Вычисления асимптоты и эксцесса начинают с определения накопленных частот , которые вычисляют в таблице закладке 2, исходные данные в которую вводятся автоматически при пуске программы на вычисления. При вычислении в таблице 2 необходимо иметь в виду, что в качестве условного нуля переменой величины принимается варианта фактического ряда, которая стоит на шестом месте .Это же место будет занимать условный ноль и при выполнении любого другого расчета с другими исходными данными.
Для запуска программы на вычисление производят щелчком по маркеру ее (по маленькому квадрату, расположенном в верхнем левом углу таблицы), а затем нажимают клавишу «F9». Далее в автоматическом режиме выполняется вычислительная программа, записанной в ячейках ее в символах вычислительного процессора MicrosoftWord. После выполнения вычислений, предусмотренных в таблице-программе 2, таблица принимает нижеприведенный вид.
В ячейках второй строки последней строки «Итого» будут указаны накопленные частоты: в верней строке — величины bi , а в строке «Итого» — величины ai , которые используются в виде исходных данных для дальнейшего расчета.
Далее вычисляют искомые параметры асимметрии и эксцесса по программе, записанной в таблице 3, в которой одновременно с характеристиками эмпирического ряда вычисляют выборочную среднюю величину –xВ, среднее квадратическое отклонение σВ и величины ошибок оценки асимметрии σА и эксцесса σЕ по формулам:
Хв = М, /1 + С
<7В = м = >ж-ю2№
О" д ^ ^^^^^^^^^^~
А (п+1)(п+3)
I 24п(п-2)(п-3)
dir ^ ^^^^^”^^"————^— “ ь (п+1)2(п+3)(п+5)
Таблица 2.
Вычисление накопленных частот ai , bi |
|||||
x i |
n i |
b1=72,00 |
b2=70,00 |
b3=42,00 |
b4=14,00 |
48,00 |
2,00 |
2,00 |
2,00 |
2,00 |
2,00 |
52,00 |
4,00 |
6,00 |
8,00 |
10,00 |
12,00 |
56,00 |
6,00 |
12,00 |
20,00 |
30,00 |
0,00 |
60,00 |
8,00 |
20,00 |
40,00 |
0,00 |
0,00 |
64,00 |
12,00 |
32,00 |
0,00 |
0,00 |
0,00 |
68,00 |
30,00 |
0,00 |
0,00 |
0,00 |
0,00 |
72,00 |
18,00 |
38,00 |
0,00 |
0,00 |
0,00 |
76,00 |
8,00 |
20,00 |
37,00 |
0,00 |
0,00 |
80,00 |
7,00 |
12,00 |
17,00 |
22,00 |
0,00 |
84,00 |
5,00 |
5,00 |
5,00 |
5,00 |
5,00 |
Итого |
n =100,00 |
a1=75,00 |
a2=59,00 |
a3=27,00 |
a4=5,00 |
Таблица 3
Вычисление параметров асимметрии и эксцесса |
||||
Объем выборки, n |
100 |
Шаг между вариантами, h |
4,00 |
|
Величины d i |
d1=3,00 |
d1=-11,00 |
d1=-15,00 |
|
Величины s i |
s1=147,00 |
s2=129,00 |
s3=69,00 |
s4=19,00 |
Условные моменты, М‘к |
M1*=0,03 |
M2*=4,05 |
M3*=-1,53 |
M4*=48,93 |
Эмпирические моменты 3 4 порядков, mi |
m3=-121,24 |
m4=12578,68 |
||
Выборочная средняя, |
68,12 |
|||
Среднее эмпирическое квадратическое отклонение, (7g |
8,05 |
|||
Асимметрия, as |
-0,23 |
|||
Эксцесс, ek |
0,00 |
|||
Средняя квадратическая ошибка асимметрии, Од |
0,24 |
|||
Средняя квадратическая ошибка эксцесса, ^Е |
0,45 |
В заключении расчета проводят оценку гипотезы о том, что эмпирическая совокупность имеет нормальное распределение. Проверка проводится в два этапа.
На первом этапе проверяют выполнение следующих неравенств:
ksl < l,5aA
ek ^--< 1>5сте
К 71 + 11 Ь
Если выполняются оба эти неравенства, то гипотеза о нормальном распределении фактического ряда не отвергается.
На втором этапе проверяют выполнение других неравенств:
|as| > 2ак ек Н--> 2аЕ I к п+1 £
Если выполняется хотя бы одно из этих неравенств, то гипотезу о нормальном распределении фактического ряда неравенств отвергают.
В других случаях нужна дополнительная проверка с помощью боле мощных критериев, например, методом Пирсона, методом спрямления диаграмм и т.д.
Поверка первой пары соотношений имеет вид:
|as| < 1,5ста |-0,23| < 1,5 * 0,24=0.36
Так как оба соотношения выполняются, то гипотеза о нормальном распределении не отвергается (принимается).
На этом проверка нормальности распределения фактического ряда завершается. Заключительную часть оценки гипотезы о нормальном распределении заданной статистической совокупности при необходимости тоже можно запрограммировать, но в дидактических целях это не сделано, так как пользователь компьютера не должен забывать, что за достоверность этой проверки отвечает он, а не компьютер.
Разработанная программа проверки нормальности распределения статистических совокупностей с использованием вычислительного процессора пакета прикладных программ MicrosoftWord и таблиц-закладок существенно расширяет область применения указанного пакета. Использование таблиц-закладок существенно снижает трудоемкость ввода исходных данных и результатов промежуточных результатов расчета, практически устраняя вероятность ошибок ввода исходных данных, так как их записывают только в таблицу исходных данных, а далее от таблицы к таблице данные и результаты промежуточных расчетов передаются автоматически. Более того исходные данные могут передаваться в электронном виде отдельным файлом в виде таблиц-закладок, подготовленным заказчиком в составе задания на расчет или при задании студенту варианта расчета в электронном виде. В этом случае локализуется источник (причина) породившая ошибку ввода исходных данных и при необходимости могут быть разработаны мероприятия исключающие вероятность ввода недостоверных данных.
Список литературы Упрощенная методика проверки нормальности распределения статистической совокупности на основании показателей асимметрии и эксцесса в среде Microsoft Word
- Глушков С.В., Сурядный А.С., Струков М.А. Microsoft Word 2007. Лучший самоучитель. М.: АСТ: АСТ МОСКВА; Владимир, 2008.-320c
- Гмурман В.Е. Теория вероятностей и математическая статистика. М.: Высшая школа, 2005. 479 с
- Евтушенко Б.В. Статистический анализ эмпирических данных средствами MicrosoftWord. -Тула, изд-во Папирус, 2011, 311 с
- Хислоп Бренд, Энжел Дэвид, Кент Питер. Word 2003. Библия пользователя: Пер. с англ. -М.: Издательский дом «Вильямс», 2004, 784 с