Построение многомерных дискретных распределении с заданной корреляционной структурой

Автор: Новоселов Аркадий Арсеньевич

Журнал: Сибирский аэрокосмический журнал @vestnik-sibsau

Рубрика: Кибернетика, системный анализ, приложения

Статья в выпуске: 5 (31), 2010 года.

Бесплатный доступ

Рассмотрены методы воспроизведения многомерного дискретного распределения с заданной корреляционной структурой и маргинальными распределениями. Для воспроизведения используются смеси базовых распределений и решение некоторых оптимизационных задач.

Дискретное распределение, корреляция, копула, смесь

Короткий адрес: https://sciup.org/148176355

IDR: 148176355

Текст научной статьи Построение многомерных дискретных распределении с заданной корреляционной структурой

Пусть заданы нормальные распределения со сред-

ними значениями μ1, …, μ d и стандартными отклонениями σ1, …, σ d . Для произвольной корреляционной матрицы R существует единственное многомерное нормальное распределение, обладающее такими маргинальными распределениями и корреляционной матрицей. Хорошо известный алгоритм воспроизведения соответствующего случайного вектора X = ( X 1 , , X d ) основан на факторизации ковариационной матрицы.

Обозначим

(G 1

л =

П 2

0 )

( 0   0

n d)

диагональную матрицу со стандартными отклонениями на диагонали, тогда C = Λ R Λ является ковариационной матрицей распределения вектора X . Будучи неотрицательно определенной и симметричной, ковариационная матрица C может быть представлена в виде

C = A′A (1)

с некоторой матрицей A , причем последняя определяется не одним образом. Примерами такого представления являются разложение Холецкого и ортогональное разложение.

При наличии разложения (1) вектор X воспроизводится из стандартного нормального случайного вектора Z по формуле

X = A′Z. (2)

Действительно, для Z справедливо E ZZ′ = I , где I – единичная матрица соответствующего размера, поэтому E XX′ = E ( A′ZZ′A ) = A′ ( E ZZ′ ) A = A′A = C , так

что X обладает требуемой ковариационной структурой.

В случае, когда компоненты X имеют фиксированные дискретные распределения, аналогичный метод оказывается неприменимым. Во-первых, заданным маргинальным распределениям и ковариационной матрице соответствуют, вообще говоря, многие многомерные дискретные распределения. Может оказаться и так, что подходящее многомерное распределение не существует.

Во-вторых, алгоритм вращения (2) не сохраняет дискретную решетку значений, на которой задано распределение.

В работах [1; 2] анонсированы методы воспроизведения двумерного дискретного распределения с заданными маргинальными распределениями и корреляцией, основанные на смесях некоторых базовых распределений и минимизации уклонения от независимого распределения. В настоящей работе предлагается обоснование этих методов.

Описание двумерного дискретного распределения. Пусть размерность d = 2 . Обозначим K = {1,…, m } × {1,…, n } . Дискретное распределение вектора X = ( X 1 , X 2) задается на прямоугольной сетке значений { x 11 ,…, x 1 m } × { x 21 ,…, x 2 n } в виде P ( X 1 = x 1 i ; X 2 = x 2 j ) = r ij , ( i , j ) e K . Обозначим совместное распределение компонент вектора X :

r = { r j , ( i , j ) e K }.                     (3)

Здесь P(X1 = x1i) = pi, i = 1,…,m и P(X2 = x2j) = qj, j = 1,…,n, так что векторы p = (p1,…,pm), q = (q1,…,qn)           (4)

описывают маргинальные распределения компонент.

Средние значения

a 1 = EX 1 = Е Х 1 / Л , a 2 = EX 2 = lx 2j q j , i = 1                                      j = 1

a ,, = E ( XX , ) = E E^ x- , i = 1 j = 1

стандартные отклонения a = VE(X1 - EX1)2 , ^2 = VE(X2 - EX,)2

u v 2/5 - u - v

1/3 - u 1/2 - v u + v - 7/30

Область допустимых значений параметров задается неравенствами

0 < u 1/3,0 v 1/2,7/30 < u + v < 2/5   (13)

и представлена на рисунке. Окружностями на нем от-

мечены антикомонотонное R ( p , q )

и коэффициент корреляции

E ( X 1 X 2) - EX 1 EX 2 a 1 a 2

Г 0   7/30 1/6 )

R ( p , q ) =                        ;

(1/3 4/15   0 J независимое R0(p, q)

вычисляются как обычно.

Если маргинальные распределения (4) известны, то выполняются следующие соотношения:

0        Г 2/15 1/5 1/15 )

R 0( p , q ) =                          ;

( 1/5  3/10 1/10 J

комонотонное R+ ( p , q ) распределение

m

E r = q j , j = 1, - , n ;               (6)

i = 1

n

E r j = Pi , i = 1, - , m .                (7)

j = 1

1/3  1/15   0

R - ( p , q ) =                         .           (16)

( 0   13/30 1/6 J

Отметим, что среди m + n уравнений (6), (7) имеется лишь m + n – 1 независимых, поскольку сумма компонент любого распределения равна 1.

Если же дополнительно известен коэффициент корреляции c компонент X , то справедливо и уравнение

mn

EE x 1i x 2j r j = c a 1 a 2 + a 1 a 2 .          (8)

i = 1 j = 1

Обозначим F ( p , q ) класс всех двумерных распределений (3) с маргинальными распределениями (4) (его еще называют классом Фреше), а Fc ( p , q ) его подкласс распределений с корреляцией c . Известно [3], что среди всех распределений в F ( p , q ) наименьшей корреляцией c min = c min ( p , q ) обладает антикомонотон-ное распределение R ( p , q ), а наибольшей корреляцией c max = c max ( p , q ) обладает комонотонное распределение R+ ( p , q ), причем c min > –1 и c max <  1. Класс Фреше представим в виде

f ( p , q ) =    U F c ( p , q ).          (9)

c G [ c min , c max ]

Обозначим еще R 0( p , q ) независимое распределение из класса Фреше F ( p , q ) .

Пример . Пусть на сетке значений

Допустимая область в плоскости параметров ( u , υ ): ––– – некоррелированные компоненты; О (слева направо) – антикомонотонное, независимое и комонотонное распределения; –––– – решения задачи 1

Класс F c ( p , q ) описывается в параметрическом представлении следующим уравнением:

v = — + c

- 2 u .

Некоррелированные распределения лежат на отрезке прямой, описываемом выражением

u + v = —,— <  u < — . 15 15

{0, 1, 2} × {0, 1}                 (10)

Коэффициент корреляции в данном примере за-

заданы маргинальные распределения

p = (1/3, 1/2, 1/6), q = (2/5, 3/5).       (11)

ключен в интервале c G

^—

Основные характеристики маргинальных

распре-

102;

делений равны:

a 1 = , a 2 = - , a 1

—, a, = —. 6 2 5

Двухпараметрическое представление класса Фреше имеет вид

Критерий близости к независимому распределению. Теперь сформулируем две задачи выбора из всего множества совместных распределений, удовлетворяющих условиям (6)–(8), единственного распределения, наименее уклоняющегося от независимого распределения в смысле критерия

1mn

f(r)=tEE(r-pq/) ^min.

2 i=i j =1

сле этих операций система уравнений запишется в виде

A Y = b ,                      (25)

Задача 1. В первой задаче целевая функция (19) минимизируется при ограничениях (6)–(8).

Функция Лагранжа этой задачи имеет вид

1 m n               2 n Л mA

L(r,x,ц,v)=-EE(rij-pa^ +EXjlEг-qj l+ 2 i=1 j=1                        j=1 V i=1

m    nmn

+Е ц . l E r u -р. l+vl EE xnx 2j r ij- c ° 1 ° 2 - a a 2 i = 1 V j = 1            у V i = 1 j = 1

Дифференцируя функцию Лагранжа по всем переменным и приравнивая производные к нулю, получаем уравнение aL / а гы = (rH - pq)+x i+ц k+v x 1 kx 21 = = 0, k = 1,- m, l = 1,- n,

а также выражения (6)–(8). Отметим, что ввиду соот-mn ношения E Pi =E qj = 1 в системе (6)—(8) одно из i =1          j =1

уравнений, например первое, является следствием остальных, и его можно отбросить вместе с соответствующим множителем Лагранжа X 1 . Для решения полученной системы уравнений выразим элементы матрицы r из уравнения (20) в виде функции множителей Лагранжа X , ц , v :

ry = P , qy - ( X j +^+v xtix 2 j ) = 0,( i , j ) e K . (21)

Подставив полученное выражение в уравнения (6)–(8), имеем:

-mXj-'EЦ—vx2j^Exn = 0,j = 2,-n ;(22)

i=1

  • -EXj-nц-vxUE*2j = 0,i = 1,-m ;(23)

j=1

mn

EE x 1 i x 2j ( Pqj - ( X j + v x 1 i x 2 j ) ) = c ° 1 ° 2 + a 1 a 2 . i = 1 j = 1

m    mmn

Обозначив 51 = e x1i, 52=Ex 2j, s12=E x2Ex 2j, i =1                j =1                  i =1

преобразуем последнее уравнение к виду

  • -51 IEXjx2j- s2EEЦiX1i - v512 = cЦ°2.(24)

j=1

Обозначим In единичную матрицу размера n×n, а Jmn – прямоугольную матрицу размера m × n, все элементы которой равны 1. Далее обозначим x2 = (x22,-,x2n)',x 1 = (x11,-,x 1 m)'. В системе уравнений (6)–(8), как уже отмечалось, первое уравнение является следствием остальных, поэтому его можно отбросить. Кроме того, в полученной системе m + n уравнений относительно m + n + 1 неизвестных одну из неизвестных можно выбрать произвольным образом. Мы будем полагать X1 = 0 , что соответствует отбрасыванию первого столбца в матрице системы. По- где неизвестные множители Лагранжа обозначены

Y = ( X 2 , , X n , Ц 1 , , ц n , v )',

а матрица системы А и вектор правых частей имеют вид

- mIn-1 -J n-1, m - 51 x 2 A = - J , m, n-1 - nIm - 5 2 x 1 ' V - 51 x 2 ' -52 x1 512 У b = (0,-,0,cc1c2).

Квадратная система линейных уравнений (25) имеет единственное решение (26), добавляя в которое значение λ1 = 0, из (21) вычисляем искомое распреде- ление.

Задача 2. Целевая функция (19) минимизируется при ограничениях (6)–(8) и ги> 0,(i, j) e K.                (27)

Аналитическое решение этой задачи в общем виде недоступно, однако численные методы позволяют эффективно решать ее. Приведем решения для рассмотренного примера.

Максимальному значению c = cmax = 8 / V102 соот- ветствует решение

Г 1/3  1/15    0

r =

V 0   13/30 1/6

которое, как нетрудно заметить, представляет собой комонотонное распределение (16).

Минимальному значению c = cmin = -7 / V102 со- ответствует решение

/ 0   7/30 1/6

r =

V 1/3 4/15   0

представляющее собой антикомонотонное распределение (14).

Результаты работы позволяют эффективно строить дискретные вероятностные модели с заданной корреляционной структурой. Предложенная методика без труда обобщается на многомерный случай d > 2.

Статья научная