Параметризация моделей управляемых систем

Бесплатный доступ

Описывается применение метода ортогональных рядов для построения моделей управляемых систем параметрического вида в условиях непараметрической неопределенности. Ключевым элементом метода является выбор длины ортогонального ряда по данным наблюдений, т. е. определение параметрической структуры модели. Продемонстрировано применение метода к оцениванию плотности распределения и функции регрессии. Предложены пути обобщения оценок на многомерный случай.

Плотность распределения, функция регрессии, ортогональный ряд, непараметрическая оценка

Короткий адрес: https://sciup.org/148176356

IDR: 148176356

Текст научной статьи Параметризация моделей управляемых систем

В классической теории управления [1] обычно используются параметрические модели, которые строятся в условиях параметрической неопределенности. Здесь предполагается известным факт принадлежности модели к некоторому заранее определенному конечномерному классу моделей. Процедура идентификации (оценивания) модели сводится при этом к оцениванию по данным наблюдений некоторого конечного набора параметров.

Столь полную априорную информацию можно считать доступной далеко не всегда, поэтому параллельно развивается и непараметрическая теория управления [2; 3], в которой априорный класс моделей предполагается бесконечномерным; при этом говорят о непараметрической неопределенности. Малое количество априорной информации приходится компенсировать при этом большим количеством статистических наблюдений.

Основными строительными блоками для создания математических моделей систем управления по наблюдениям являются оценки плотности распределения и функции регрессии [1–3]. Непараметрическая оценка плотности распределения ядерного типа была впервые рассмотрена в [4; 5], а соответствующая непараметрическая оценка функции регрессии – в работах [6; 7].

Классические параметрические оценки этих функций гораздо проще для человеческого восприятия и лучше приспособлены для анализа, чем непараметрические оценки. Поэтому постоянно предпринимаются попытки построения оценок параметрического вида в условиях непараметрической неопределенности. Это направление можно назвать параметризацией моделей.

Одной из ветвей этого направления является использование оценок в виде отрезков ортогональных рядов, называемых еще проекционными оценками ввиду прозрачной геометрической аналогии. Оценка такого типа для плотности распределения была предложена Н. Н. Ченцовым в [8], а оценка для функции регрессии – в [9].

Проекционные оценки были подвергнуты тщательному изучению. Так, в статьях [10–13] исследовались вопросы сходимости оценок в различных смыслах, в публикациях [14; 15] проводилось сравнение различных непараметрических оценок. В [16–19] исследовались проекционные оценки в конкретных базисах. Во всех этих исследованиях длина отрезка ортогонального ряда выбиралась произвольно. В работах [20–24] предложен некий принцип оптимального выбора длины отрезка ортогонального ряда в проекционных оценках, исследованы свойства получаемых оптимальных проекционных оценок. В настоящей работе приведен обзор результатов [20–24], и представлены соображения по поводу обобщения оптимальных проекционных оценок на многомерный случай.

Проекционное приближение. Пусть Lr2 – гильбертово пространство функций f, заданных на подмножестве U вещественной оси и интегрируемых с квадратом с весом r в смысле f f 2(x)r (x)dx <”,

U где r – неотрицательная весовая функция на U. Скалярное произведение и норма задаются в Lr2 выражениями:

( f , g ) = J f ( x ) g ( x) r ( x ) dx , Il f 11= V ( f , f ).

U

Любая функция f из L r 2 представима в виде ряда [25]

f (x) = 2 ajgj( x), j■=0

в смысле сходимости последовательности его частич- ных сумм

N fN (x ) = 2ajgj( x )

j = 0

по норме пространства Lr 2 , что означает || f - fN\\ ^ 0 при N ^ Здесь G = { g j , j = 0, 1, ...} обозначена произвольная полная ортонормированная система в L r 2 , а a j = ( f , g j ), j = 0, 1, … представляют собой коэффициенты Фурье функции f относительно системы G .

Выбор ортонормированной системы G зависит от конкретной задачи; в различных ситуациях могут быть использованы, например, классические ортогональные многочлены [26] или тригонометрическая система функций [27].

Оценка плотности распределения. Пусть X , X 1, …, Xn , … – последовательность независимых, одинаково распределенных на U с R случайных величин, и пусть распределение X имеет неизвестную плотность f . Рассмотрим задачу оценивания неизвестной плотности распределения f по выборке наблюдений X 1, …, Xn объема n в ситуации, когда априори неизвестен какой-либо конечномерный класс плотностей, которому заведомо принадлежит f , т. е. в ситуации непараметрической неопределенности.

В [4; 5] для этого была предложена ядерная оценка плотности f            ГxXL)

fn. h (x)     , 2K I L I nh'=i   1 h 7            (2)

1 n

=-2 Kh (x - XD, xe U, n i=i где K – некоторая плотность распределения на R, называемая ядром оценки, Kh(u) = K(u/h)/h; h – параметр оценки, называемый параметром размытости или параметром ширины окна.

В [8] рассматривалась проекционная оценка плотности, основанная на отрезке ряда (1), в котором коэффициенты Фурье a j заменены на оценки по выборке наблюдений вида

n aj = - 2 gj( Xi) r (Xi), j = 0,1, -n i=i

Таким образом, проекционная оценка плотности имеет вид

N

  • f , N ( x ) = 2 a lj g j( x ), x e U .           (3)

j = 0

Отметим, что в результате несложных преобразований эту оценку можно представить следующим образом:

n f., N (x) = - 2 Kn (x, Xi), n i=i

N

K n ( x , u ) = 2 g j ( x ) g j ( u ) r ( x ), x , u e U .

j = 0

Это представление по виду напоминает второе представление в оценке (2), как среднее выборочное значение некоторого ядра. Существенное отличие состоит в том, что ядро в последнем выражении не является плотностью распределения, в частности, оно может принимать отрицательные значения. Таким же недостатком обладает и проекционная оценка (3), она не является, вообще говоря, плотностью распределения, поскольку может принимать отрицательные значения. В некоторых случаях избавиться от этого недостатка позволяет следующий прием. В качестве оценки плотности рассматривается среднее арифметическое первых частичных сумм ряда

N fn,n (x)=iftt2 fn,j(x), x e U.

N + 1 j = 0

Такой прием позволяет обеспечить неотрицательность оценки плотности, например, при использовании тригонометрической ортонормированной системы [27]. При этом оценка оказывается построенной посредством так называемых сумм Фейера [27].

Длина разложения N выбирается в [8] произвольно, там также приводятся некоторые асимптотические соображения по поводу выбора N . В работах [20–22; 24] предложен и исследован оптимальный принцип выбора длины отрезка ряда, основанный на следующем наблюдении. Обозначим t j = g j ( X ) r ( X ), j = 0, 1, … и вычислим среднеквадратичное отклонение проекционной оценки плотности (3) от неизвестной плотности f . Получаем выражение

2    NN

T n (N ) = Sf - Ц =1 f Г - nT 2 a 22+ - 2 Et 2,- (4)

n j = 0       n j = 0

Оказывается [20; 24], что величина T n ( N ) при фиксированном n достигает минимума по N , это означает, что при любом объеме выборки имеется оптимальная длина отрезка ряда в проекционной оценке (3), причем оптимальность понимается в смысле среднеквадратического критерия (4). Для приближенной минимизации критерия (4) с использованием выборки наблюдений заметим [20; 24], что слагаемое ║f║ в правой части (4) не влияет на положение точки минимума, и его можно отбросить, а остальные члены оцениваются следующим образом:

~ n n + 1 ^ a 2   2 N -

T n ( N ) =-- 2 a 2 +- 2 1

n    j = 0        n j = 0

~”

j ,

n tj=12 g j( X) r ^( X).

n t1

Минимизация Tˆn (N) по N дает оптимальное значение Nˆ длины отрезка ряда, подстановка которого в выражение (4) дает оптимальную проекционную оценку ■ N f (x)=Zajgj(x), xe U.          (6)

j = 0

В качестве примера рассмотрим тригонометрическую ортонормированную систему на [–1; 1], которая состоит из функций j 2,sin(njx ),cos(njx), x e [-1; 1], j = 1,2, „.j.

При использовании этой ортонормированной системы удобно включать члены в ортогональное разложение парами, при этом оптимальная проекционная оценка приобретает вид

  • 1    N ˆ

f(x) = + Z(Cjcos(njx) + S/sinm/x))-

  • 2    j = i

Здесь

1n1

Cj = - Z cos( n /X i ), v      Z sin( n /X i ), j = 1, 2,

П i=1

Рассмотрим случайную величину X , имеющую распределение с треугольной плотностью на [–1; 1], т- е- fx ) = 1- |x| , x e [ - 1;1]- Методами статистического моделирования нетрудно получить выборку наблюдений такой случайной величины, для целей иллюстрации мы возьмем объем выборки равным n = 50. График оценки критериальной функции (5), построенный по полученной выборке, приведен на рис. 1. Видно, что в оптимальное разложение входит только первая пара тригонометрических функций ( N = 1). Графики модельной плотности распределения f и ее оптимальной проекционной оценки показаны на рис. 2. С ростом объема выборки качество оценивания довольно быстро возрастает. Более подробный анализ оптимальных проекционных оценок плотности можно найти в работах [20–24].

Рис. 1. График оценки критериальной функции (5), построенный по выборке наблюдений объема n = 50

Оценка функции регрессии. Пусть теперь (X, Y), (X1, Y1), …, (Xn, Yn), … – последовательность незави- симых одинаково распределенных случайных векторов. Обозначимfx) = E(Y\X = x), x e U функцию регрессии Y на X. Для непараметрического оценивания этой функции по наблюдениям (Xi, Yi), i = 1, …, n в [6; 7] была предложена ядерная оценка

— 'Zy^K I x—Xi-nh и I h

f ( x ) =

1 5 f x - X,) , z K I I

nh        h i=1

x e U .

Здесь объекты K , h имеют тот же смысл, что и для ядерной оценки плотности (2).

Рис. 2. График модельной треугольной плотности распределения и ее оптимальной проекционной оценки (7), объем выборки n = 50

Для простоты предположим, что U = [0; 1] и случайная величина X имеет равномерное распределение на [0; 1] так, что ее плотность равна P(x) = 1, x e [0; 1]. Положим также, что весовая функция постоянна: r(x) = 1, x e[0;1]. При этом коэффициенты Фурье имеют вид aj = j f (x)gy(x)dx = E(Ygj(X)), j = 0, 1, ^ 0

Поэтому проекционная оценка функции регрессии имеет вид (3), где оценки коэффициентов Фурье вычисляются по формулам:

n aj= - Z Yg( X,), j = 0,1, -n ,=1

Все свойства критерия выбора длины ортогонального разложения сохраняются и в случае оценивания функции регрессии, оптимальная проекционная оценка вычисляется по той же формуле (6), а качество приближения получается даже лучше, чем для плотности распределения, что связано со спецификой данной задачи.

Случай известной, но не равномерной плотности распределения X отличается лишь повышенной громоздкостью формулировок. В случае неизвестной плотности X можно использовать фейеровские оценки [23; 24].

Многомерное обобщение. Представляет интерес обобщение описанных оценок на многомерный случай, когда область распределения случайной величи- ны X имеет размерность, превышающую 1. Для осуществления такого обобщения по существу нужно лишь уметь строить многомерные ортонормирован-ные системы. Это легко достигается на основе одномерных ортонормированных систем, что мы и продемонстрируем для двумерного случая.

Пусть { g j (x ), j = 0, 1, ■■■}> x e U и { h k (y ), k = 0, 1, ...}, y e V - одномерные полные ортонормированные системы на соответствующих областях определения. Тогда полная ортонормированная система на U × V образуется из всевозможных произведений одномерных функций, а именно:

Gjk( x, y ) = gj( X) hk (y), j = 0,1, ^, k = 0,1, _,(x, y) e U X V.

Следует иметь в виду, что с ростом размерности очень быстро нарастают комбинаторные сложности в вычислении ортонормированных функций, поэтому применимость описанного способа оценивания в пространствах высокой размерности сомнительна. Кроме того, метод проекционного оценивания не обладает свойствами локальных оценок, вследствие чего не может использовать «трубчатое» строение выборочных данных. По-видимому, возможно построение специальных ортонормированных систем, адаптированных под имеющуюся структуру данных, что позволит использовать такое специальное строение, однако, нам неизвестны исследования в этом направлении.

В работе дан краткий обзор оптимальных проекционных оценок плотности распределения и функции регрессии, которые применяются при построении моделей управляемых систем по наблюдениям. Описаны основные алгоритмы, участвующие в построении оценок, приведены примеры и иллюстрации. Отмечается возможность многомерного обобщения процедуры оценивания и имеющиеся ограничения по размерности.

Статья научная