Оценка числа слагаемых нормальной аппроксимации сумм независимых случайных величин

Бесплатный доступ

В работе решается задача определения количества независимых случайных величин с одинаковыми математическими ожиданиями и разными дисперсиями, сумма которых с заданной точностью имеет нормальный закон распределения. Аналогичная задача рассмотрена для средней арифметической выборки из нормального распределения вероятностей. Доказана теорема и получено следствие из нее. Доказательство теоремы основано на разложении характеристических функций в ряд Маклорена. По зависимостям, полученным в теореме, рассчитаны таблицы для определения необходимого числа слагаемых при заданной точности для разных средних квадратических отклонений выборочных наблюдений. Построены графики полученных зависимостей. Зависимость потребного числа слагаемых от точности аппроксимирована полиномом шестой степени. Доказанная в статье теорема и полученные зависимости могут быть использованы в системах тестирования, контроля, наблюдений и диагностики.

Еще

Центральная предельная теорема, нормальное распределение, средняя выборочная, дисперсия, рекуррентный метод, характеристическая функция, ряд маклорена, точность, относительная погрешность

Короткий адрес: https://sciup.org/148323398

IDR: 148323398   |   DOI: 10.18101/2304-5728-2022-1-26-34

Текст научной статьи Оценка числа слагаемых нормальной аппроксимации сумм независимых случайных величин

Проблема оценки числа слагаемых, при котором сумма независимых случайных величин имеет нормальный закон распределения вероятностей, связана с центральной предельной теоремой (ЦПТ).

ЦПТ имеет особое место среди практических применений теории вероятностей. Она позволяет решать многие задачи в различных областях, где рассматриваются суммы случайных величин. Проблема распределения суммы случайных величин по нормальному закону решается в статьях [1; 2; 3] методом моделирования. В статье [1] получено, что при 30 и более слагаемых график плотности распределения близок к нормальному. В работе [2] указывается, что для нормально распределенной генеральной совокупности ЦПТ справедлива даже для выборок с объемом менее 30. Размер выборки 200 слагаемых использовался в работе [3].

Данное исследование является дальнейшим развитием метода из [4] определения числа слагаемых ЦПТ. Новым является распространение этого метода на случай разных значений средних квадратических отклонений [4].

Целью статьи является определение числа слагаемых ЦПТ для получения нормального закона распределения вероятностей с заданной точностью. Для этого нужно получить число n в виде его функциональной зависимости от параметров закона распределения суммы или средней выборочной.

1 Основная теорема и следствие

Сформулируем и докажем следующую теорему.

Теорема. Средняя выборочная (x) n независимых случайных величин с одинаковыми математическими ожиданиями m и разными дисперсиями, ограниченными сверху значением <гmax, будет иметь нормальный за кон распределения (с точностью £ ) при n > n 0 = max <

[ v 4 .5 ° max J + 2,

4,5 ^ max

+ 1, L 0,41 + Ь ° max J ” .

Здесь символом ^ J обозначена целая часть числа.

Доказательство.

Определим число n0 методом характеристических функций. Рассмот- рим непрерывные случайные величины.

Пусть

qx j

—t

У n 0 J

« ‘^x j

= J e n 0 f ( x ) dx ,

-to

характеристическая функция

Xj случайной величины —(j = 1, n0). Тогда n 0 x n 0

q 1 t )= H q x ,

itx en 0

J = 1 -to

f ( x ) dx j

характеристическая функция величины x , т. к. X f независимы.

Не нарушая общности, считаем, что m = 0 . Разложим qx

в ряд

i to                                  i

Маклорена. Получим: qx ( 0 ) = 1; qx ( 0 ) = — j x j f ( x j ) dx j = —m = 0. j                  j n 0 --to                          n 0

Вторая производная будет равна:

i 2 г

2 ° j .

n 0 2

qXj^ 0 ) =   J Xf ( xj) dxi =

n 0 —г

Остаточная сумма ряда Sост определяется выражением:

С учетом того, что q (0) = 1, она будет равна: Socm (0) = 0. Тогда qxj

— t | = 1

n о

2 n 0 ' * ° ' '

n 0

qx (t)=П i—A • t"°,2

j 1 к

Пусть выполняются следующие условия:

—3 • ° max

' max , при t 2 = 9 ° max 9 ' ° max

< 2 n 2 и скобки в (2) поло-

жительные. Заметим, что условие положительности скобок в (2) вытекает из условия n 0 4,5 ° max . Поэтому

n о д/4,5 ° ma X.

Для дальнейших выводов будем считать, что

n 0 max

Найдем логарифм от (2):

n 0

ln q x ( t ) = E l n 1 t1^ t2 2 n 0

° 2

j = 1

Ряд Маклорена для данного выражения будет:

2 n 0 2         j

1 1 4 ° 4 4 n 0 4 2        j

- -

1 k 2 k 2 n 0 2 k

t 2 k

2 k

Имеем сумму n0 рядов. Погрешность (остаточный член) каждого ряда будем оценивать в форме Коши, т. е.

( , xk + 1 (1 ^ ) k

0 ^ 1.

r ( x ) =-- k +1(1 — ^x)k+1

В знаменателе стоит разность, т. к. рассматриваем in (1 x ).

Для каждого ряда суммы имеем:

22 t ° , 2 n 0 2

k

------- <  1, т. к. £ x £ ;

1 £ x

< n 0, т. к. n 0 2 и 1 £ x .

x k + 1

Поэтому r ( x ) < -—- • n 0 , т. е.

n 0       t 2 k + 2 a 2 k + 2

R x ( t ^l^ k + 1 n 0 2 k + 1 •( k + 1 )"

Потребуем в записанном неравенстве для k = 1 выполнения условия:

A t 4 a 4 ^s

= 8 n 03 "2,                      1

где s — сколь угодно малое положительное число.

Так как t 3 a max , то, усилив неравенство (5), получим:

3   a max

8 n 0 2

s

< —

.

Отсюда:

4,5 • a max

+ 1.

Можно было бы, заменив t на 3 a max в (5), использовать рекуррентный метод. Полагаем сначала n 0 = 2 и проверяем выполнение неравенства (5) для двух законов распределения при заданных средних квадратических отклонениях a 1 и a 2 .Если оно выполняется, то завершаем рекуррентный процесс. В противном случае полагаем n 0 = n 0 + 1 и снова проверяем выполнение неравенства (5) для трех законов распределения при заданных a 1 , a 2 и a 3 и т. д.

Из (4) и (6) находим

+ 4- (7)

n n 0 = max <

+ 2,

4,5 a max

s

n 0

, 2 _2                     S

t a, с точностью —. j 2

Таким образом, ln qx ( t ) = — = — 2—

' = 1 2 n 0

Положим n0

12 a = — a : a'.

n 0 v ' = 1

Тогда a t

n 0

S = Z A t "a a , 2 '" = 1 2 n 0 2 '

n 0

— <  l nqx ( t ) <— У — t - t ^a 2 2 xA) 4 = 1 2 n 0 2 '

S      12 2 S

+ - = —a 2 1 2 + -. (8)

2    2       2

Получаем

qx(t)

n 0

E 1 ,2 ^2 t a 2 j 2 n 0

e ' = 1

—t a

= e

1 t 2

2/ a г

.

Используя дифференциал, оценим погрешность определения функции q x ( t ) . А именно:

n

qx (t)- e

2 n 02

e

n 0

Z 1 ,2 ^2

2 n о2    j 8    8

"      — < —.

Очевидно, относительная погрешность также будет меньше 8 . Из определения характеристической функции имеем:

да qx (t )= J eixt • f (x) dx.

-да

Тогда плотность распределения вероятностей i да f (x ) = — Je" itxqx (t)dt.

2 n

С

учетом

да

1 ‘

-да

Ax 2 ± 2 Bx - C

формулы, AC - B 2

-да приведенной

в

книге

[5],

e A , формул (8)–(10) получаем

При о 0,399 -Д- e - V 2 по

) = —1 e 2о 2 f 1 -

) 72 Ло e I 1

x 2

2 о 2 1. Поэтому с

8

8

точностью

1        -

,— • e 2 о

2по

.

Очевидно, относительная погрешность не

превосходит

8

. Путем со-

ответствующего масштабирования ограничения на о можно снять.

Значит, x имеет нормальное распределение с m x = 0, o x = о .

Заметим, что при вычислении f ( x ) используется несобственный интеграл при t е ( -да , да ). А именно:

1 x

1   -? ^2

= — e 2 о

2 п

да

1 Г   - itx eitx

2 n

-да

2п

о

- 1 1 2 о 2

e 2

да dt = — [ e 2 n J

-да

1 t 2 о 2 + itx 2

1 да

-да

- 1 о 2

dt =

e

2по

2 о о

.

Однако t е [ - 3 о max , 3 o max ]. Покажем, что с любой заданной точностью

8

— при соответствующем n0 интеграл (12) в пределах от 3оmax до да бу- дет сколь угодно мало отличаться от —. Положим u = -° t + -ix- , тогда 4               V2 V

, О , О .^ ) du = —^dt . Пусть b =     3 о яv + —г .

1max 2

V2             V2 V о )

to — 102It+^У1

Имеем: j e 2 V О ) dt =~7=je u du. 30max

Для вычисления последнего интеграла возведем его в квадрат, затем перейдем к двойному интегралу в полярных координатах:

to j e-udu

V b to

О Г — u-

to

to

П to

= j e u du - J e v dv = j d ^- j re r dr , где r 2 = u 2 + v 2 , т. е.

b 1

b 1

ПО 1 b l I2

--e 2

< . Отсюда l b ,|2 >- 2in —

4              1 11           2 х П

Поскольку x m - 9 o max венство, получим:

с вероятностью 0,99, то, усилив последнее нера-

4,5 0 min

■ max + 45,5 n 2 + 2 n oln /? n

2 V ПО max

где ° min = min o

j = 1, n 0 , т. е.

22,75 n 2 + n o (ln + jin n o 1,264 In о _) + 2,25 o min - о m^ 0. (13)

Из этого неравенства при заданных , о min и о max находится соответствующее значение n 0 .

Поскольку n 0 -^-in n 0, то последнее неравенство можно усилить так:

21,75 n 0 >- in + 1,264 - in о х , т. е.

0max

7 +1,264 + in оах nn > т. к. минимальное — будем рассматривать равным 0,001. Отсюда n 0 > 0,41 + in О max.

Это более простая, но более грубая оценка, чем получаемая из неравенства (13).

Аналогично рассматривается интеграл от -to до - 3 о max.

3 o max

Следовательно, f ( x ) = j e

3 o max

—1

' qx (t)dt с точностью 2 приn- удов- летворяющем (14).

Таким образом, с точностью £ средняя арифметическая количества n n 0 суммируемых независимых случайных величин с одинаковыми математическими ожиданиями и разными дисперсиями при выполнении условия

4,5 a max

n 0 = max <

£

+ 1, |h a ma. + 0,41J> (15)

имеет нормальный закон распределения.

Теорема доказана .

2 Исследование зависимости числа слагаемых ЦПТ от точности

В таблице 1 для заданного значения £ приведены соответствующие значения n 0 для a max = 1.

Зависимость n 0 от £               Таблица 1

£

0,001

0,002

0,0028

0,003

0,004

0,005

0,01

0,1

0,5

0,9

n 0

102

72

61

59

51

46

33

11

6

6

Зависимость числа слагаемых n 0 от точности £ графически изображена на рис. 1.

Рис. 1. Зависимость n 0 от £

С помощью средства MS Excel «Линия тренда» эту зависимость можно аппроксимировать полиномом шестой степени (коэффициент детерминации R 2 = 0,9959 ):

n 0 =^- 0,0013 £ 6 + 0,0587 £ 5 - 0,9298 £ 4 + б,4444 £ 3 - 18,65б £ 2 + 5,5б39 £ + 109,25 j .

Следствие из теоремы. При числе слагаемых n n 0 ( n 0 удовлетворяет равенству (14)) сумма n независимых случайных величин (с одинаковыми математическими ожиданиями и дисперсиями, ограниченными 32

сверху значением о max ) имеет нормальный закон распределения вероятностей.

При значениях n n 0 величина X имеет нормальное распределение, поэтому Y = nX будет иметь нормальное распределение (при тех же значениях n ).

Заключение

На основе доказанной теоремы и ее следствия выведены условия, определяющие количество слагаемых, для которого средняя выборочная и сумма слагаемых (в ЦПТ) имеют нормальный закон распределения (с заданной точностью). Исследована зависимость числа слагаемых ЦПТ от заданной точности и дисперсии выборки.

Список литературы Оценка числа слагаемых нормальной аппроксимации сумм независимых случайных величин

  • Пименов С. Ю., Тинаев В. В. Применение центральной предельной теоремы для компьютерного моделирования случайных сигналов // Наука и образование: новое время. 2017. Т. 19, № 2. С. 227-231. Текст: непосредственный.
  • Цурганов А. Г., Макеенко Г. И. Простая иллюстрация центральной предельной теоремы в медицинской статистике // Достижения фундаментальной, клинической медицины и фармации: материалы 71-й научной сессии сотрудников университета. Витебск: ВГМУ, 2016. С. 330-331. Текст: непосредственный.
  • Парахин А. С. Численная проверка центральной предельной теоремы // Математика, информатика, компетентностный подход к обучению в вузе и школе: материалы Всероссийской научно-практической конференции. Курган: Изд-во КГУ, 2015. С. 24-27. Текст: непосредственный.
  • Ганичева А. В. Оценка числа слагаемых центральной предельной теоремы // Прикладная математика и вопросы управления. 2020. № 4. С. 7-19. Текст: непосредственный.
  • Вентцель Е. С. Теория вероятностей. Москва: Изд-во физ.-мат. лит-ры, 2003. 564 с. Текст: непосредственный.
Статья научная