О теоретическом выравнивании вариационныхрядов
Автор: Леоненко Т.А., Новиков М.А.
Журнал: Вестник Бурятского государственного университета. Математика, информатика @vestnik-bsu-maths
Рубрика: Теория вероятностей и математическая статистика
Статья в выпуске: 1, 2026 года.
Бесплатный доступ
В статье обсуждаются некоторые свойства вариационных рядов. В большей части это касается асимметричных теоретических распределений. Особый интерес представляет вопрос сравнения двух и более вариационных рядов, допускаемых с разными объемами выборки и разным размахом варьирования. Симметричное теоретическое распределение при выполнении основных условий центральной предельной теоремы не требует дополнительного анализа в вычислениях экстремальных значений исследуемых рядов. Для асимметричных теоретических распределений предложен алгоритм составления дополнительного абстрактного ряда, который выравнивает исходный, сводя центральный момент третьего порядка к нулю. Он получается смещением исходного ряда с теми же характеристиками размаха вариации, дисперсии. При этом вычислительный процесс нахождения смещения сопровождается приближенными вычислениями. Одна из границ построенного вспомогательного ряда выражает комплексное экстремальное значение исходного ряда, где учитывается ближняя окрестность соответствующей границы. Преимущественно выявленные свойства установлены при представлении рядов теоретическим нормальным законом распределения. Предложенный подход может оказаться пригодным в критических ситуациях установления приоритетного ряда.
Вариационный ряд, нормальный закон распределения, выборочная средняя, дисперсия, среднее квадратичное отклонение
Короткий адрес: https://sciup.org/148333168
IDR: 148333168 | УДК: 519.213: 519.222 | DOI: 10.18101/2304-5728-2026-1-15-25
On the Theoretical Alignment of Variation Series
This article discusses some properties of variation series. This primarily concerns asymmetric theoretical distributions. Of particular interest is the issue of comparing with two or more variation series, accepted in different sample sizes and different ranges of variation. The symmetrical predicted distribution does not require additional analysis in the computation of extremal values under review series when the main conditions of the central limit theorem are met. For asymmetric predicted distributions, an algorithm is proposed for compiling an additional abstract series that aligns the original one, reducing the moment about mean of the third-order to zero. This series is obtained by shifting the original series with the same characteristics of the range of variation, variance. In the process, the computational process of finding the blas is accompanied by approximate calculations. One of the borders of the constructed intermediary series evaluates the complex ex- tremal value of the original series, where the next vicinity of the corresponding border is taken account. The predominantly identified properties were established when representing the series by the theoretical normal law of distribution. The proposed approach may prove to be suitable in critical situations of establishing a priority series.
Текст научной статьи О теоретическом выравнивании вариационныхрядов
Многие процессы, связанные с значительным числом объектов, выражаются количественными оценками и описываются вариационными рядами [1]. Аналитическое выражение изучаемого процесса (явления) всегда более предпочтительно по сравнению с графическим или табличным способами задания. При соответствующих условиях [2; 3], выраженных прежде всего значительными величинами дисперсии, вариационные ряды можно моделировать нормальным распределением Гаусса с функцией плотности
f ( x ) =
■ ( x - a ) ‘
2 &
где a — математическое ожидание; & — среднее квадратическое отклонение, равное квадратному корню из дисперсии. Для статистических (вариационных) рядов математическим ожиданием полагается «среднее выборочное» ряда; дисперсией — «выборочная дисперсия»; средним квадратическим отклонением считается квадратный корень из «выборочной дисперсии».
Хотя вариационный ряд задан дискретной случайной величиной, а аналитическое теоретическое распределение — непрерывной случайной величиной, между их представлениями имеются общие свойства. Одно из них состоит в том, что гистограмма относительных частот часто в значительной мере совпадает с контуром графика плотности соответствующего нормального распределения f ( x ) [1]. Если при этом график гистограммы относительных частот симметричен, то их контуры совпадают почти в точности [1]. Многие свойства вариационного ряда в таких случаях при соответствующих условиях [2; 3] проще описывать нормальным распределением Гаусса [1-3]. Другое сходство состоит в том, что случайные величины можно ограничить соответствующими множествами: исходный вариационный ряд задан конечными величинами на конечном множестве x е X ; а для теоретического нормального распределения, используя интегральную теорему Лапласа, можно утверждать фактически о всех значениях случайных величин, расположенных на отрезке [ a — 5 & ; a + 5 & ].
Вариационные ряды характеризуются основными величинами: объемом выборки, равным n, наименьшим значением xmin, наибольшим значением xmax, размахом варьирования L = xmax — xnin. Далее к ним добавляется понятие «среднее выборочное», равное
n
a= ∑xi n 1
. По нему
составляются
центральный момент второго порядка
n
M 2 ( X ) = — ^( xt — a ) 2 , и центральный момент третьего порядка n 1
n м з( X ) = — ^(xi — a)3 (при этом центральный момент первого порядка n1
n
M i ( X ) = - £( X i — a ) = 0 ).
n 1
Часто в случаях принятия решений возникает необходимость сравнения двух или более вариационных рядов с необязательно одинаковыми объемами выборки.
-
1 Постановка задачи
Сравнение определенных значений рядов наиболее важно во многих прикладных областях. Можно различать такие виды сравнений:
-
1) выбор наименьших (наибольших) значений рядов в отдельности;
-
2) выбор наименьших (наибольших) значений рядов в среднем;
-
3) выбор наименьших (наибольших) значений рядов в совокупности.
В первом виде выделяются только значения x или x каждого из min max рядов, что является самой простой операцией. Такое возможно, например, при сопоставлении абсолютных показателей в какой-либо сфере деятельности.
К второму виду относится сравнение необязательно крайних элементов рядов, а их средних значений. Типичным примером будет сравнение успеваемости нескольких школьных классов одной параллели. Основным показателем здесь является среднее арифметическое.
К третьему виду относится сравнение не только крайних элементов, а и их ближайших окрестностей. Так, например, спортивная команда с одной «золотой медалью» будет менее предпочтительна в смысле командных достижений, чем такая же команда с двумя или тремя «серебряными медалями».
При одинаковом размахе вариации и объемах выборки второй и третий виды сравнения непосредственно связаны. Так, для точек сгущения у максимальной варианты и средняя выборочная будет более высокая.
Более сложный вопрос возникает для третьего вида сравнений, когда при разных объемах выборки и размахах вариаций интерес представляют наибольшие и наименьшие значения вариант. Наибольшее значение такой задачи требует численных расчетов. Тогда необходимы способы оценки значений рядов, связанные с определенными свойствами каждого ряда.
Для симметричного графика относительных частот, что имеет место для M3 (X) = 0, можно отметить некоторое свойство. Сопоставляя дискретное и непрерывное распределения, можно полагать, что ненулевые значения графика гистограммы относительных частот, начинающиеся с величины x = xmin, будут сравнимы с вероятностью попадания в интервал (^, xmin) для нормального закона распределения.
Пусть для определенности a = 0 , что всегда можно достичь смещением переменных (вариант), тогда функция плотности нормального распределения имеет вид:
-
1 - x 2
f ( x ) = —= e ' 2 .
C2n
Согласно [1] в общем случае вероятность попадания в интервал ( x ;0) при x < 0 приближенно равна f ( x )(0 - x ) = - xf ( x ) .
Вместе с тем по известной теореме [1] вероятность попадания случайной величины в интервал (^; x ) для нормального закона распределения
x вычисляется интегральной формулой Лапласа J f (t) dt. Как ранее
-w упоминалось, графически они должны быть примерно равными. Их совпадение при распределении Гаусса приводит к интегральному уравнению:
x
(2.1)
-w
Данное уравнение можно упростить дифференцированием по переменной x. При этом производная по переменному верхнему пределу принимает значение подынтегральной функции в этой точке верхнего предела [4], а производная от функции плотности распределения будет f'(x ) = —e
Дифференцированием
(2.1)
x f (x) = -f (x) + f (x)—, откуда
CT
Учитывая всюду f ( x ) ^ 0 , для
x 2
2с ’(-4)=- f (-x) 4 > 0. C C по переменной x получим x2
I следует уравнение f ( x )(— ^ - 2) = 0 . c 2
значений x < 0 получим решением
x=-C2.
В правой части того же графика гистограммы относительных частот
+w при x > 0 составляется аналогичное (2.1) уравнение J f (t)dt = f (x) dx .
x
Производная по переменному нижнему пределу здесь [4] определяется значением подынтегральной функции в точке нижнего предела, взятой с обратным знаком. В результате также получается x = +&42 .
Следовательно, можно составить свойство 1.
Свойство 1
Элементы вариационного ряда X при равном нулю центральном моменте третьего порядка нормального распределения с достаточно большим значением дисперсии располагаются в интервале J 1 = ( a - о 42; a + а 72) .
Здесь достаточные значения дисперсии оговариваются из условий представления ряда нормальным законом распределения [2; 3], для существования центральной предельной теоремы. Для этого будем считать дисперсию удовлетворяющей условию
2^42 > L , (2.2)
(нарушение этого неравенства можно отнести к невыполнению условий центральной предельной теоремы).
При достаточно больших значениях дисперсии сформулированное данным свойством условие часто является завышенной оценкой . Для этого можно составить значительно меньшую область , задаваемую отрезком J 2 = [ a — L /2; a + L /2] с J 1 .
Очевидно наименьшим множеством, содержащим элементы вариационного ряда X , при M 3 ( X ) = 0 является отрезок J 2 .
Наряду с описанными множествами введем в рассмотрение отрезок
—fx ;х ] = Глу —LI2;хп + L/2], где х,,—(х +х )/2.
-
3 L^min ; max L^0 ; 0 , д^ ^о min max
В данных условиях при M 3 ( X ) = 0 он полностью совпадает с J 2 .
-
3 Асимметричное нормальное распределение
Большее распространение получили вариационные ряды с несимметричным графиком относительных частот, хотя они также могут описываться нормальным распределением с теми же характеристиками ряда. Пусть для определенности центральный момент третьего порядка является положительной величиной (для M3 (X) < 0 выкладки и результаты проводятся аналогично). На графике гистограммы относительных частот такое предположение означает [1] расположение величины средней выборочной a в левой половине отрезка J3 и вершина гистограммы также находится в левой половине отрезка J3 . При этом левая часть графика (до вершины) является крутой, а правая часть пологой [1]. Конечно, здесь можно вводить особое распределение с плотностью Грама — Шарлье1, но оно не совсем удачно годится для решения данной задачи.
Далее за основу принимаются ряды вида J 3 . При упомянутом расположении гистограммы и выполнении основных условий центральной предельной теоремы [1–3] будут выполняться очевидные соотношения:
a - а 22 < a - L /2 < xm,„; a + L /2 < хтя„ < a + a 22 .
min max
Здесь левая граница J 2 находится вне отрезка J 3 . Ситуация будет близкой к ранее описанной для симметричного расположения гистограммы, если построить абстрактный ряд одинаковых размеров с J 3 , для которого теоретический момент будет равным нулю. Уточним, что этот момент должен вычисляться относительно оси x = a . Такое предположение равносильно вычислению момента третьего порядка исходного ряда относительно некоторой оси x = b , рассматриваемого в [1] «условным моментом». Условимся обозначать его 1 n
Mз(X,b) =“Е(xi -b)3 , тогда M3(X,a) будет обычным n l=1
центральным моментом M 3 ( X ) . Очевидно, величина x = b будет расположена правее значения x = a .
К вычислению M 3( X , b ) привлечем ранее известные центральные моменты до третьего порядка включительно. Условно обозначим смещение s = b — a > 0 . Тогда искомое требование запишется
M 3( X , b ) = - У ( x , — a — s )3 = - У [( x , — a )3 — 3 s ( x , — a )2 + 3 s 2( x , — a ) — n , = 1 n , = 1
— s 3 ] = M 3 ( X ) — 3 sM 2 ( X ) + 3 s2 M 1 ( X ) — s3 = 0 .
Так как здесь по определению центральный момент первого порядка равен нулю, то последнее выражение упростится:
s 3 + 3 M 2( X ) s — M 3( X ) = 0 . (3.1)
Центральный момент второго порядка численно равен дисперсии и поэтому он положителен. Для неполного кубического уравнения (3.1) вычислим дискриминант [5]
Q = ( M C X )) 3 + ( — M з ( X ) )2 = M 3 ( X ) + M 2( X )/4 > 0 .
Следовательно, уравнение (3.1) имеет только одно вещественное решение [5]. Тогда в исследуемом случае целесообразно непосредственное нахождение единственного вещественного корня данного уравнения, и его лучше проводить численным способом. Обычно в приближенных вычислениях применяется метод касательных Ньютона [6].
Начальным приближением для корня s возьмем в = M3(X)/(3M2(X)) (при малых значениях P1 оно будет и решением для s).
так:
Первая итерация метода касательных запишется п в3
в = в --о---------. Следующая итерация будет такой:
2 11 3( р 2 + M 2 ( X ))
Р з = в 2
P 2 3 + 3 M 2( X ) в 2 - м 3( X ) 3( в 22 + M 2 ( X ))
Последующие итерации при необходимости будут точно такие же, только с увеличенным индексом
P i + 1 = P i
p i + 3 M 2 ( X ) P i - м 3 ( X ) 3(P- + M 2 ( X ))
Точность вычислений будет задаваться исходя из точности представления членов исходного ряда и цели задачи.
Заметим, что решающее значение в выборе знака имеет величина р .
В рассматриваемом случае при M 3 ( X ) > 0 она положительна.
Следовательно, b = a + s , что означает смещение исходного ряда «вправо».
Теперь составим абстрактный отрезок J4 = [b - L /2;b + L /2] и будем сопоставлять его границы с левой границей J3. Как ранее упоминалось, при M3 (X) > 0 выполняется a < x0. Очевидно, ввиду большинства элементов X в левой половине отрезка J3 теоретический момент третьего порядка относительно оси x = x0 будет отрицательным. Так как M3 (X, a) = M3 (X) > 0 и вместе с тем M3 (X, x0) < 0, то единственное решение уравнения (3.1) будет расположено в интервале (o;x0 - a) [6]. Тогда левая граница J4 будет такой: b - L / 2 = a + s - L / 2 <
— L / ^ — — L / ^ — — (x ■ + x )—(x — x ■ ) — x ■ .
0 ~ ^0 2 V min max/ 2 v max nin ' min .
Следовательно, левая граница абстрактного ряда смещена влево относительно исходного ряда. В целом такое свойство можно характеризовать тенденцией нижней границы моделируемого ряда.
Аналогичные выкладки осуществляются для асимметричного ряда с отрицательным центральным моментом третьего порядка. При этом абстрактный ряд смещается вправо относительно исходного.
Отсюда следует свойство 2.
Свойство 2
При отличном от нуля центральном моменте третьего порядка абстрактный ряд сдвинут на величину ( x 0 — a — s ) в сторону вершины гистограммы относительных частот.
Процесс построения абстрактного ряда для простоты будем называть «выравниванием» вариационного ряда X .
Многие примеры показывают, как и в случае симметричного теоретического распределения, для асимметричного распределения имеет место аналогичное свойству 1 утверждение, что элементы ряда X расположены внутри интервала ( b — с т 22; b + о42 .
Невыполнимость последнего проявляется при нарушении условия (2.2).
Тем самым подтверждается выполнение свойства, подобного в случае симметричного теоретического распределения.
-
4 Обсуждение полученных результатов
Полученный в результате выравнивая ряд обладает определенным свойством: выполняется смещение исходного ряда X в сторону одной из границ, в окрестности которой находится большинство значений этого ряда. Такая интерпретация абстрактного ряда вполне приемлема, в частности, при дополнительном выявлении вопроса в целом, когда возникают одинаковые «выборочные средние». Пусть задан вариационный ряд X 1 , состоящий из четырнадцати школьников с оценкой «удовлетворительно», двух — с оценкой «хорошо» и четырех — с оценкой «отлично». Другой ряд X 2 параллельного класса состоит из тринадцати школьников с оценкой «удовлетворительно», четырех — с оценкой «хорошо» и трех — с оценкой «отлично». Целью является подбор более успевающего класса.
Их выборочные средние одинаковы a 1 = a 2 = 3.5 и одинаковы объемы выборки. Вычисления центральных моментов для первого ряда получают:
M 12 ( X 1 ) = ^[( - °.5) 2 Х 14 + (°’5) 2 Х 2 + (1’5) 2 Х 4] = °’65 , M 13 ( X 1 ) = ^)[( - °’5) 3 х 14 + (°-5) 3 х 2 + (1 -5) 3 х 4] = °-6 .
Далее
вычислим в 1(1) ® °.3°77 ; в 1 = °.3°77
—
0.3077 3
3(°.3°77 2 + °.65)
0.2977 .
Значения 0 3 находятся с точностью, меньшей 1 ° 3 . В результате получаются Ь 1 я 3.7947 , J 14 = [2.7947; 4.7947] .
Аналогичные вычисления для второго ряда будут такими:
M 22 ( X 2 ) = ^[( - 0-5) 2 Х 13 + (°-5) 2 Х 4 + (1 -5) 2 Х 3] = 0-55 ’
M 23 ( X 2) = ^[( — °-5) 3 х 13 + (0.5) 3 х 4 + (1-5) 3 х 3] = 0.45 .
Далее вычислим
в (2) « 0-2727 , в = 0-45--°-г5----- * 0.2619 ,
-
1 2 3(0.452+0.55)
b 2 = 3.7619 , J 24 = [2.7619; 4.7619] .
Сравнивая средние выровненных рядов, более предпочтительным можно заключить первый ряд. Подобные заключения можно получить и при различных объемах выборки.
Построение выровненных рядов приемлемо и при сравнении на экстремум какой-либо из границ интервалов вариационных рядов.
Пусть заданы ряды: X 1 = {2,2,2,8,10,12} , X 2 = {1,4,5,5,5} .
Ставится цель нахождения нижней границы в совокупности.
Такая задача может рассматриваться для выявления аварийной ситуации, когда меньшая величина характеризует наибольшую близость к аварийности. При этом начиная со значения «три» ситуация считается некритической и меньшие значения характеризуют большую приверженность к аварийности.
Для первого ряда основные характеристики: n = 6; L = 10; a , = 6 . Вычисления центральных моментов для первого ряда приводят к:
M i2 ( X ) = 1[( - 4) 2 х 3 + 2 2 + 4 2 + 6 2 ] « 17.3333 ,
-
12 v - 6
M iз( X 2) = 1[( - 4) 3 х 3 + 2 3 + 4 3 + 6 3 ] = 16 .
-
13 2 6
Далее вычисляются в1 » 0.3077, 021 » 0.3071. Окончательно получаются b * 6.3071; J14 = [1.3071; 11.3071].
Для второго ряда основными характеристиками будут: n 2 = 5; L 2 = 4; а 2 = 4 .
Аналогичные вычисления для второго ряда:
M 22 ( X 2 ) = 5[( - 3) 2 + 1 2 Х 3] = 2.4 ,
M 23 ( X 2 ) = 1[( - 3) 3 + 1 3 Х 3] = - 4.8 .
Далее с точностью 10 - 3 вычисляются величины β 1 (2) ≈ - 0.6667 , β 2 (2) ≈ - 0.6320 . В результате получаются значения: b 2 = 3.3680 ; J 24 = [1.368; 5.368] . Окончательно следует предпочтительность левой границы выровненного первого ряда. Хотя левая изолированная граница второго ряда меньше левой границы первого ряда, но окрестность левой границы первого ряда является преобладающей. Здесь явно выражен известный тезис «перехода количества в качество».
Заключение
Основной результат статьи состоит в изучении вариационных рядов с асимметричным теоретическим распределением. Предложенная методика предназначена для составления абстрактных рядов, близких к исходным и имеющим свойства рядов с симметричным распределением. Построенный интервал значений абстрактного ряда имеет установленное свойство: приближать извне одну из границ построенного абстрактного ряда к границе исходного ряда, имеющей в ее окрестности большее число «точек сгущения». При этом тенденция к смещению соответствует благополучной ситуации. Последнее смещение численно находится приближенными вычислениями.
Данный подход может оказаться подходящим прежде всего в ситуациях неопределенности, когда необходим дополнительный анализ.