Научные статьи \ Математика. Естественные науки \ Математика \ Исследование операций

Минимаксное программное терминальное управление в двухуровневой иерархической нелинейной дискретной динамической системе

Автор: Шориков А.Ф.

Журнал: Вестник Пермского университета. Математика. Механика. Информатика @vestnik-psu-mmi

Рубрика: Механика. Математическое моделирование

Статья в выпуске: 2 (33), 2016 года.

Бесплатный доступ

Рассматривается дискретная динамическая система, состоящая из набора управляемых объектов, динамика каждого из которых описывается соответствующим векторным нелинейным дискретным рекуррентным соотношением при наличии управляемых параметров и возмущений (помех). В системе выделены два уровня принятия управленческих решений - доминирующий (первый уровень) и подчиненный (второй уровень), имеющие различные критерии функционирования и объединенные между собой априори определенными информационными и управленческими связями. Рассматривается задача двухуровневого минимаксного программного терминального управления в дискретной динамической системе. Для исследуемой задачи в данной работе предлагается математическая формализация и общая схема ее решения.

Еще

Иерархическая дискретная динамическая система, минимаксное программное терминальное управление

Короткий адрес: https://sciup.org/14730032

IDR: 14730032 | УДК: 519.83 | DOI: 10.17072/1993-0550-2016-2-124-132.

Текст научной статьи Минимаксное программное терминальное управление в двухуровневой иерархической нелинейной дискретной динамической системе

В статье рассматривается дискретная динамическая система, состоящая из набора управляемых объектов, динамика каждого из которых описывается соответствующим векторным нелинейным дискретным рекуррентным соотношением при наличии управляемых параметров и возмущений (помех или ошибок моделирования). В данной системе выделены два уровня принятия управленческих решений – доминирующий уровень I , управляемый доминирующим игроком P , и подчиненный уровень II , управляемый игроком E . Оба

Работа выполнена при финансовой поддержке РФФИ (проект № 15-01-02368).

уровня управления объединены между собой априори определенными информационными и управляющими связями. Качество управления рассматриваемыми динамическими объектами на каждом уровне управления оценивается соответствующими им выпуклыми функционалами, которые определены на их терминальных (финальных) фазовых состояниях и удовлетворяют соответствующим условиям Липшица. Предполагается, что управляющие воздействия и возмущения в рассматриваемой динамической системе в каждый момент времени стеснены заданными конечными множествами или выпуклыми многогранниками в соответствующих конечномерных векторных пространствах.

Для исследуемой динамической системы в данной работе предлагается математическая формализация в форме решения многошаговой задачи двухуровневого иерархического минимаксного (оптимизации гаранти- рованного результата) программного терминального управления и предложена общая схема ее решения.

Полученные в работе результаты основываются на исследованиях [1]–[5] и могут быть использованы при компьютерном моделировании и создании многоуровневых систем управления для сложных динамических процессов, функционирующих в условиях риска и неопределенности. Математические модели таких процессов представлены, например, в работах [1]–[7].

1. Динамика дискретной управляемой системы

На заданном целочисленном промежутке времени 0, T = {0,1,..., T} (T > 0) рассматривается многошаговая динамическая система, которая состоит из (n+1) -го управляемого объекта (n e N; здесь и далее, N - множество всех натуральных чисел). Динамика объекта I (основного объекта динамической системы), управляемого доминирующим игроком Р описывается векторным нелинейным дискретным рекуррентным уравнением вида y (t +1) = f (t, y (t), u (t), v (t), w (t)),

У ⁽⁰⁾ = У 0 , (1)

динамика объекта II_i ( i -го вспомогательного объекта динамической системы), управляемого подчиненным игроком E i ( i е 1, n ), описывается следующим уравнением:

z « ( t + 1) = f « ( t , z « ( t ), u ( t ), v « ( t ), w « ( t )), z ⁽⁰⁾ = z 0 , ⁽²⁾

где t е 0, T — 1; y(t) = (y(t),y2(t),...,Уг(t))'е eRr - фазовый вектор объекта I в момент k времени t; для k e N, здесь и далее, R - k -мерное евклидово пространство векторов-столбцов, даже если из экономии места они записаны в строку: z(‘) (t) = (z1(‘) (t),z2i)(t), ^, zS ‘)(t))' eRsi - фазовый вектор объекта si

IIi (i e1, n ) в момент времени t; u(t) = (u1(t), u2(t),...,up(t))'e Rp - вектор управляющего воздействия (управления) доминирующего игрока P в период времени t (t е 0,T), удовлетворяющий заданному ограничению:

p u (t) e U 1(t) c R , (3)

где U 1 ( t ) , для каждого t e 0, T - 1 , есть набор из N ( N t e N ) векторов в R ^P ( p e N ) ; v (i\ t ) = ( v «( t ), v 2 i ) ( t ),..., v qⁱ ⁾( t )) 'e R qi - вектор управляющего воздействия (управления) подчиненного игрока E i ( i e 1, n ) в период времени t ( t e 0,T — 1) , который зависит от допустимой реализации управления u ⁽ j ) ( t ) e U 1 ( t ) игрока P ( j e 1, N t ) , удовлетворяющий заданному ограничению:

v ⁽ i ) ( t ) e V ⁱ ) ( u⁽ j ) ( t )) c R qi , (4)

где V ₁ ⁽ ⁱ ⁾ ( u ⁽ ^j ⁾ ( t )) для каждого момента времени ( t e 0, T — 1) и управления u ⁽ j ) ( t ) e U 1 ( t ) игрока P есть конечный набор из Q_t ⁽ ⁱ ⁾ ( j ) ( Q ti ) ( j ) e N , j e 1, N_t ) векторов в R qi ; v ( t ) = ( v ⁽¹⁾( t ), v ^<2)( t ),..., v ⁽ ⁿ ) ( t )) 'e R q - вектор управления обобщенного подчиненного игрока E , объединяющего всех подчиненных игроков E i , i e 1, n ( q = E q i e N ).;

i = 1

w(t) = (W1 (t),W2(t),...,Wm(t))'e Rm- вектор помехи (возмущения) в уравнении (1), который в каждый период времени t (t e 0, T — 1) зависит от допустимой реализации управления u(j)(t) e U1(t) игрока P (j e1, Nt) и удовлетворяет ограничению w (t) eW1( u(j)(t)) c Rm, (5)

где W ₁ ( u ⁽ ^j ⁾ ( t )) – выпуклый, замкнутый и ог- m раниченный многогранник пространства R

(m eN); (wi)(t),wi)(t),...,wm\t))' e i e Rmi - вектор помехи (возмущения) в уравнении (2), который в каждый период времени t (t e 0, T — 1) зависит от допустимой реализации управления u(j)(t) eU1( t) игрока P (j e1, Nt), от допустимой реализации управле- ния v (1, k)(t) eV/ i’( u(j’(t)) игрока Ei, (j e1,Nt ; k e 1, Qti’(j)) и удовлетворяет ограничению:

w ⁽ⁱ) ( t ) e W ₁ ⁽ ⁱ ’ ( u ^(j) , v ⁽ⁱ,^k ’ ( t )) c R mi . 6)

Предполагается, что в векторном рекуррентном уравнении (1), описывающем динамику объекта I , для каждого фиксированного и допустимого набора ( t , y , u , v ) e e 0 ,T - 1 x R r x R p x R q вектор-функция f :

x R s ² x - x R sⁿ = 0, T x R r x ^ R s' ( g (0) = i = 1

= {0,у(0),z”’(0),;B(0),„, z(0) = {у0, z 011,:02.....z 0n ’(т ) = g 0), который будем на зывать его τ -позицией. Игроку P известен также принцип формирования управления v”(■) = {v<'’(t)},т- Vt ет,T — 1: v'i’(t) e eV/ ‘ ’(u (t))’ каждым из игроков Ei, i e1, n , на промежутке времени τ,T , который зависит от выбора на этом промежутке управления u(•) ={u(t)}t —. (Vtет.T —1:

u(t ) e U ₁ ( t ) ’ игроком P , которое сообщается им, и для каждого i е 1, n описывается соотношением (4), причем выбранное каждым игроком E_i управление сообщается игроку P .

Результат реализации рассматриваемого процесса управления с позиции игрока P оценивается значением выпуклого функционала α , определенного на допустимых финальных фазовых состояниях y ( T ) и z ⁽ ⁱ ⁾ ( T ) объектов I и II i , i е 1, n , который удовлетворяет соответствующему условию Липшица. Тогда на промежутке времени τ , T целью игрока P в рассматриваемом процессе управления является минимизация значения выбранного функционала α .

Учитывая эти обстоятельства, мы будем говорить, что такие возможности поведения игрока P совместно с объектами I и II_i , i е 1, n , определяют доминирующий или уровень управления I для рассматриваемого процесса управления в дискретной динамической системе (1)–(6).

Предполагается, что в сфере интересов каждого игрока E i ( i е 1, n ’ находятся только возможные терминальные фазовые состояния z ⁽ ⁱ ⁾ ( T ) объекта II i и для любого рассматриваемого промежутка времени τ , T ему сообщается реализация управления u ( • ) = { u ( t )} _t e- T — 1 ( V t е т , T — 1: u ( t’ e U 1 ( t ) ’ игрока Р на этом промежутке времени, которую он должен учитывать при формировании своего управления v ⁽ ‘ ’ ( t ’ e V/ i ’ ( u ( t ))

для всех t ∈ τ , T - 1 . При этом для каждого целочисленного промежутка времени τ , T ⊆ 0, T ( τ < T ) ему также известен набор g ⁽ ⁱ ⁾ ( τ ) = { τ , z ⁽ ⁱ ⁾ ( τ )} ∈ 0, T × R ^si

( g ⁽ ⁱ ⁾ (0) = {0, z ⁽ ⁱ ⁾ (0)} = g 0⁽ ⁱ ⁾ ), который будем называть τ -позицией игрока E i .

Результат реализации рассматриваемого процесса управления с позиции игрока E_i оценивается значением выпуклого функционала β ⁽ ⁱ ⁾ , определенного на допустимых финальных фазовых состояниях z ⁽ ⁱ ⁾ ( T ) объекта II_i ( i ∈ 1, n ), который удовлетворяет соответствующему условию Липшица. Тогда на промежутке времени τ , T целью каждого игрока E_i ( i ∈ 1, n ) в рассматриваемом процессе управления является минимизация значения функционала β ⁽ ⁱ ⁾ .

Совокупность n игроков E_i , i ∈ 1, n , называемых также игроком Е , и управляемых ими объектов II i , i ∈ 1, n , образуют подчиненный или уровень управления II для рассматриваемого процесса управления (подчиненный доминирующему или уровню управления I ).

3. Определения и критерии качества в процессе управления

Введем ряд определений, которые необходимы для строгой математической формализации задачи двухуровневого иерархического минимаксного программного терминального управления для рассматриваемой дискретной динамической системы (1)-(6).

Для k ∈ N и любого целочисленного промежутка i , j ( i ≤ j ) , символом S _k ( i , j ) будем обозначать метрическое пространство функций целочисленного аргумента ϕ : i,j → R ^k , в котором метрика ρ_k задается соотношением

ρ _k ( ϕ ₁( ⋅ ), ϕ ₂( ⋅ )) = m ax II ϕ ₁( t ) - ϕ ₂ ( t )II k t ∈ i , j

((ϕ1(⋅),ϕ2(⋅)∈ Sk(i,j)Sk(i,j), а символом comp( Sk (i, j)) – множество всех непустых и компактных, в смысле этой метрики, подмножеств пространства Sk(i, j) .

Здесь и далее, для любого x ∈ R ^k ( k ∈ N ) символом II x II _k обозначается евклидова норма вектора x в пространстве R ^k .

Используя ограничение (3), определим множество U ( τ , T ) ⊂ S _p ( τ , T ) всех допустимых программных управлений u ( ⋅ ) = { u ( t )} _t _∈ _τ _T _- ₁ игрока Р на промежутке времени τ , T ⊆ 0, T ( τ < T ) соотношением

U ( τ , T ) = { u ( ⋅ ): u ( ⋅ ) ∈ S p ( τ , T ) , ∀ t ∈ τ , T - 1, u ( t ) ∈ U 1 ( t )} , (7)

которое в силу (3) является конечным множеством.

Для фиксированных индекса i ∈1,n и программного управления u(⋅) ∈ U(τ,T), используя ограничение (4) определим конечное множество V(i) (τ,T;u(⋅)) ⊂ Sq (τ,T) всех до-qi пустимых программных управлений v(i) (⋅) = {v(i) (t)}t∈τ,T-1 игрока Ei на промежутке времени τ,T соответствующих u(⋅), соотношением аналогичным (7).

Далее, для фиксированного программного управления u ( ⋅ ) ∈ U ( τ , T ) , используя ограничение (5), опре делим множество W ( τ , T ; u ( ⋅ )) ∈ comp( S _m ( τ , T - 1)) всех допустимых программных помех w ( ⋅ ) = { w ( t )} _t _∈ _τ _T _- ₁ для объекта I на промежутке времени τ , T соответствующих u ( ⋅ ) .

Для фиксированных индекса i ∈ 1, n , пары программных управлений u ( ⋅ ) ∈ U ( τ , ϑ ) и v ⁽ ⁱ ⁾ ( ⋅ ) ∈ V ⁽ ⁱ ⁾ ( τ , T ; u ( ⋅ )) , используя ограничение (6), определим множество

W(i)(τ,T;u(⋅),v(i)(⋅))∈ comp(Sm (τ,T-1)) i всех допустимых программных помех w(i) (⋅) = {w(i) (t)}t∈τ T-1 для объекта IIi на промежутке времени τ,T соответствующих паре (u(⋅),v(i) (⋅)) .

Далее, для фиксированных программного управления и ( • ) е U (т, &) и набора программных управлений v ⁽ i ) ( • ) е V ⁽ i ) ( т , T ; и ( • )) , i е 1, n , введем следующие множества:

V ( т , т ; и ( • )) = П V ⁽ⁱ⁾ T T ; и ( • )) ;

i = 1

W ( т , T ; и ( • ), v ( • )) = n

= П W "(т, T ; и ( • ), V ^(О0) (8)

i = 1

соответственно всех возможных наборов v ( ■ ) = (?“( ■ ), . , v '^2>(T, v' " ’ ( • )) е V (Тт ; и ( • )) допустимых программных управлений совокупности игроков E i i е 1, n , или допустимых программных управлений v ( • ) игрока Е на промежутке времени τ , T , и всех наборов 1 V ( . ) = ( w ⁽¹⁾ ( • ), . , w ⁽²⁾0 , w⁽" ) ( • )) е W ^J ; и ( • ), v ( • )) допустимых реализаций программных помех для совокупности объектов II i , i е 1, n (или обобщенного объекта II ), на промежутке времени τ , T .

Далее, обозначим:

W ( Т , Т ) = { W (ТТ ; и ( • ) ), и ( • ) e U (Тт )};

W_n ( т , Т ) = { W 0 , Т ; и ( • ), v ( • )),

и ( • ) е U ( т , Т ), v ( • ) е V (ГТ ; и ( • ))}.

Пусть для любого промежутка времени т , Т с 0, Т ( т < Т ) множество G (т ) е 0, Т х x R r х П R si есть множество всех т -позиций i = 1

g ( т ) = { т , у ( т ), z ⁽¹⁾ ( т ), z ⁽²⁾ ( т ), ..., z⁽ " ) ( т )} е е 0,Т х R r хП R si ( g (0) = {0, у (0), z ⁽¹⁾(0), i = 1

z ⁽²⁾(0), . , z⁽ ⁿ ) (0)} = g 0 ) игрока Р ( G (0) = = { g (0)} = { g 0 } = G 0 ).

Тогда для оценки качества рассматриваемого динамического процесса на уровне управления I введем функционал α :

G (т ) x U (тТ ) x V тТ ) x W (тТ ) x W n тТ ) =

= Г ( т , Т ; а ) ^ Е = ] -« , +® [ , (9)

значения которого для допустимых на промежутке времени τ , T реализаций

g ( т ) е G ( т ), и ( • ) е U ( т ,Т ),

v ( • ) = { v ^w( • ), v ⁽²⁾( • ),.., v ⁽ " ) ( • )} е V (тТ ) , w ( • ) e W (т,Т ) и w ( • ) =

= { w ⁽¹⁾0 , w ⁽²⁾O, . , w⁽ " ) ( • )} £ W n тТ ) определяются следующим конкретным соотношением:

^а ⁽ g ⁽ ^т ), ^и (О, ^v ( • ), ^w ⁽), ^w ( • ⁾⁾ =

= pY у ( Т )) + £ _Л-в “’ ( ^'(Т )) . 10) i = 1

Здесь символами у (Т ) = у_т (т, Т ; у (т ), и ( • ), v ( • ), w ( • )) и z "(Т ) = z (т,Т ; z «( т ), и ( • ), v ⁽‘) ( • ), w ⁽ i ) ( • )) обозначены состояния в финальный момент времени Т траекторий объектов I и II i , i е 1, n , на промежутке времени

τ , T , которые порождены соответственно наборами ( у ( т ), и ( • ), v ( • ), w ( • )) и

( z"(т ), и(),v «0, w i ')0) ; р e R ¹ и р ⁽ ⁱ ⁾ e R ¹ , i е 1, n - заданные числовые параметры, которые удовлетворяют следующим условиям:

р > 0; V i е^ : р_; > 0; £ p_t = 1 - р ; (11) i = 1

функционалы у: R r ^ R ¹ и в⁽‘): R si ^ R ¹ , i е 1, n , являются выпуклыми и удовлетворяют соответствующим условиям Липшица.

Далее, обозначим через G ⁽ i \т ) =

= { т } x R si множество всех возможных т -позиций g ⁽ i ) ( т ) = { т , z ⁽ i ) ( т )} е { т } x R si игрока Е , ( i еЦ ? ; g ^w(0) = (0, _; ^я(0)) = {0, z j° ! = = g«> ; G '»(0) = { g^l ⁱ > (0)} = { g 0» } = G 0° ), а через G 0 ) = { т } x П R si обозначим множество i = 1

всех возможных т -позиций g(c ) = { т , z ⁽¹⁾( т ), z ⁽²⁾( т ),..., z ⁽ ⁿ ) ( т )} е 0 Т x R r xП R si i = 1

( g (0) = {0, У’ (0), z <⁵’ (0), . , z ⁿ ’ (0)} = g , )

для совокупности игроков E i , i е 1, n , или игрока E , т. е. для II уровня процесса управления ( ( 7(0) = { g (0)} = { 0} = G 0 ).

Введем следующие обозначения:

V "тТ ) = { V«0 0; и ( • )), и ( • ) е U (^Т )};

w "T, t ) = { W ⁽ ⁱ ⁾ T T ; u ( • ), v ( • '),

u ( • ) e U ( t , T ), v ⁽% ) e V⁽ⁱ ' ( T , T ; u ( • ))}.

Тогда качество управления для рассматриваемого динамического процесса каждым из игроков E_i ( i e l, n ) на уровне управления II оценива-ется соответствующим ему функционалом β ⁽ ⁱ ⁾ вида β ˆ ⁽ ⁱ ⁾ :

G ⁽ⁱ⁾ ( т ) x U ( t , T ) x V ⁽ ^/ ⁾ ( t , T ) x W ⁽ ^/ ⁾ ( t , T ) =

= r ( TT ; e⁽ ⁱ ⁾ ) ^ E , (12)

значения которого для допустимых на промежутке времени t , T реализаций g ⁽‘ ' ( t ) e e G⁽ ⁱ ⁾ T ) , u ( • ) e U (TT ) , v ⁽ ^/ ⁾0 e V ^{i\Tj ) и w (‘ ' ( • ) e W ⁽ i ) ( т , T ) определяются следующим конкретным соотношением:

e⁽ⁱ ⁾ ( g ⁽ ⁱ ⁾ ( T ), u ( • ), v ⁽^(0, w «( • )) =

= в ⁽ ⁱ ⁾ ( z ⁽ⁱ⁾ (T )) , (13)

т.е. этот функционал оценивает качество управления игроком E_i на фиксированном промежутке времени τ , T финальными фазовыми состояниями z ⁽ ⁱ ⁾ ( T ) объекта II_i ( i e l, n ).

Следует отметить, что если рассмотреть функционал

Y : G ( t ) x U (TT ) x V (TT ) x W TT ) =

= r ( TT ; Y ) ^ E , (14)

значения которого для допустимых на промежутке времени τ ,T реализаций g (T ) eG (t ), u (•) eU (t, T),

v(•) = {v”f).v'M..., v"’(•)} eV(TT), w (•) eW (t, T) определяются соотношением

^Y(g ⁽ ^t ). ^u 0. ^v ( • ⁾, ^w ( • ⁾⁾ = Y ⁽ У ⁽ ^T )) . ⁽¹⁵⁾

оценивая качество управления игроком Р на фиксированном промежутке времени τ ,T финальными фазовыми состояниями объекта I на уровне управления I для рассматриваемой динамической системы (1)–(6), и ввести векторный функционал 5 = (Y, вт, /3^,., βˆ (n) ) такой, что n

5: Г ( т , T ; Y ) x П Г ( t , T ; £⁽ i ) ) ^ E n ⁺ ¹ , (16) i = 1
4. Постановка задачи двухуровневого минимаксного программного терминального управления

значения ( n + 1) -го параметра которого определяются для допустимых на промежутке времени τ , T реализаций их аргументов согласно соотношениям (12)–(15), то можно утверждать, что функционал α , определенный соотношениями (9)–(11), является его сверткой, полученной в соответствии с применением метода скаляризации (см., напр., [7]) векторных функционалов.

Из условий для уровня управления II следует, что игрок Ei (i e1, n ), используя имеющиеся у него информационные и управляющие возможности, заинтересован в таком исходе процесса программного управления в динамической системе (1)–(6) на промежутке времени τ,Т , при котором функционал βˆ(i) , определяемый соотношениями (12), (13), для любых допустимых реализаций его τ -позиций gio(t) = {t,z«'(t)} e G"'(t)(glo(0) = g<» e e G0 ‘') и программного управления i^eUT,T) игрока Р на этом промежутке времени принимает наименьшее возможное значение.

Для осуществления этой цели игрока E_i ( i e 1, n ) ниже формулируется следующая задача минимаксного программного терминального управления объектом II _i на уровне управления II двухуровневой иерархической системы управления для динамической системы (1)–(6).

Задача 1. Для фиксированных индекса i e 1, n , промежутка времени т , Т о 0, T ( т < T ), допустимой на уровне управления II для динамической системы (1)–(6) реализации τ -позиции

g(i'(т' = {т, z(''(т)} e G(‘' (т)(g(i'(0) = g0i' e g(>' игрока Ei и допустимой реализации программного управления u(•) eU(t,T) игрока Р на уровне управления I требуется найти множество V(i,e) (τ,T;g(i) (τ), u(⋅)) ⊆ V(i) (τ,T;u(⋅)) минимаксных программных управлений v(i,e) (⋅) ∈V(i) (τ,T;u(⋅)) игрока Ei , соответствующих управлению u(⋅) игрока Р, которое определяется следующим соотношением

V ⁽ ⁱ ^, ^e ⁾ ( τ,T ; g ⁽ ⁱ ⁾ ( τ ), u ( ⋅ )) =

= { v ⁽ ⁱ ^, ^e ⁾ ( ⋅ ): v ⁽ ⁱ ^, ^e ⁾ ( ⋅ ) ∈ V ⁽ ⁱ ⁾ ( τ,T ; u ( ⋅ )), c ⁽ _ˆ ^e ₍ ⁾ _i ₎ ( τ , T ; g ⁽ ⁱ ⁾ ( τ ), u ( ⋅ )) = m a x {

β w ⁽ ⁱ ⁾( ⋅ ) ∈ W ⁽ ⁱ ⁾( τ , T ; u ( ⋅ ), v ⁽ ⁱ ^, ^e ⁾( ⋅ ))

( i )

β ⁽ ⁱ ⁾ ( g ⁽ ⁱ ⁾ ( τ ), u ( ⋅ ), v ⁽ ⁱ ^, ^e ⁾ ( ⋅ ), w ⁽ ⁱ ⁾ ( ⋅ ))} =

= min max {

v ⁽ ⁱ ⁾ ( ⋅ ) ∈ V ⁽ ⁱ ⁾ ( τ , T ; u ( ⋅ )) w ⁽ ⁱ ⁾ ( ⋅ ) ∈ W ⁽ ⁱ ⁾ ( τ , T ; u ( ⋅ ))

( i )

β ⁽ ⁱ ⁾ ( g ⁽ ⁱ ⁾ ( τ ), u ( ⋅ ), v ⁽ ⁱ ⁾ ( ⋅ ), w ⁽ ⁱ ⁾ ( ⋅ ))} , (20) где функционал β ⁽ ⁱ ⁾ определен соотношениями (12), (13).

Отметим, что, учитывая конечность множества допустимых программных управлений V ⁽ ⁱ ⁾ ( τ , T ; u ( ⋅ )) игрока E_i ( i ∈ 1, n ) и многогранные свойства множества допустимых программных помех W ⁽ ⁱ ⁾ ( τ , T ; u ( ⋅ )) , соответствующего фиксированному программному управлению u ( ⋅ ) ∈ U ( τ , T ) игрока P , и соотношения (7)–(20), можно показать (см., напр., [3, 5]), что решение задачи 1 существует и сводится к решению конечного числа задач линейного и выпуклого математического программирования, а также конечного числа задач дискретной оптимизации.

Для реализации достижения цели игрока Р , связанной с уровнем управления I для динамической системы (1)–(6), формулируется следующая задача минимаксного программного терминального управления объектами I и II_i , i ∈ 1, n .

Задача 2. Для фиксированных промежутка времени τ , Т ⊆ 0, T ( τ < T ), допустимой на уровне управления I для динамической системы (1)–(6) реализации τ -позиции

g(т) = {т,у(т),z(1)(т), z(2)(т),,z(n)(т)} е е G(т) (g(0) = {0, у(0), z(1) (0), z(2) (0), ., ., z(n )(0)} = g 0е G0) игрока Р требуется найти множество U(e)(τ,T;g(τ)) минимаксных программных управлений u(e) (⋅) ∈U(τ,T) игрока Р, которое определяется следующим соотношением:

U ⁽ ^e ⁾ ( τ , T ; g ( τ )) =

{ u ⁽ ^e ⁾ ( ⋅ ): u ⁽ ^e ⁾ ( ⋅ ) ∈ U ( τ , T ), c α ⁽ ^e ⁾ ( τ , T ; g ( τ )) = = m i n max {

v ⁽ ^e ⁾ ( ⋅ ) ∈ V ⁽ ^e ⁾ ( τ , T ; g ˆ( τ ), u ⁽ ^e ⁾ ( ⋅ )) w ( ⋅ ) ∈ W ( τ , T ; u ⁽ ^e ⁾ ( ⋅ ))

w ˆ ( ⋅ ) ∈ W ^ˆ ( τ , T ; u ⁽ ^e ⁾ ( ⋅ ), v ⁽ ^e ⁾ ( ⋅ ))

α ( g ( τ ), u ⁽ ^e ⁾ ( ⋅ ), v ⁽ ^e ⁾ ( ⋅ ), w ( ⋅ ), w ˆ( ⋅ ))} =

= min mi n m a x {

^u ⁽ ^⋅ ⁾ ^∈ ^U ⁽ τ ^, ^T ⁾ v ⁽ ^e ⁾( ⋅ ) ∈ V ⁽ ^e ⁾( τ , T ; g ˆ( τ ), u ( ⋅ )) ^w ⁽ ^⋅ ⁾ ^∈ ^W ⁽ τ ^, ^T ^; ^u ⁽ ^⋅ ⁾⁾ w ˆ( ⋅ ) ∈ W ^ˆ( τ , T ; u ( ⋅ ), v ( ⋅ )) α ( g ( τ ), u ( ⋅ ), v ⁽ ^e ⁾ ( ⋅ ), w ( ⋅ ), w ˆ( ⋅ ))} . (21)

На основании решений сформулированных выше задач 1 и 2 рассмотрим следующую задачу.

Задача 3. Для фиксированных промежутка времени τ , Т ⊆ 0, T ( τ < T ), допустимой на уровне управления I двухуровневой иерархической динамической системы (1)–(6) реализации τ -позиции g ( τ ) = { τ , y ( τ ), z ⁽¹⁾ ( τ ),

z ⁽²⁾ ( т ),..., z ⁽ n ) ( т)} е G (т ) ( g (0) = {0, у (0), z ⁽¹⁾ (0), z ⁽²⁾ (0), . , z ⁽ n ) (0)} = g 0 е G 0 ) игрока Р , допустимой на уровне управления II этой системы реализации τ -позиции g ˆ( τ ) = { τ , z ⁽¹⁾ ( т ), z ⁽²⁾( т ), . , z⁽ n ) ( т )} е G (т ) ( g (0) = {0, z ⁽¹⁾ (0), z ⁽²⁾ (0), . , z ⁽ n ) (0)} = g 0 е G 0 ) игрока Е , сформированной из τ -позиции g ( τ ) , и допустимой реализации минимаксного программного управления u ⁽ ^e ⁾ ( ⋅ ) ∈ U ⁽ ^e ⁾ ( τ , T ;

g ( τ )) игрока Р на уровне управления I , которое можно сформировать из решения задачи 2, требуется найти множество V ˆ ⁽ ^e ⁾ ( τ,T ; g ˆ( τ ),

u ⁽ ^e ⁾ ( ⋅ )) ⊆ V ⁽ ^e ⁾ ( τ,T ; g ˆ( τ ), u ⁽ ^e ⁾ ( ⋅ )) ⊆ V ( τ , T ;

u ⁽ ^e ⁾ ( ⋅ )) и вектор c _β ⁽ _ˆ ^e ⁾ ( τ , T ; g ˆ( τ ), u ⁽ ^e ⁾ ( ⋅ )) = ( c _β ⁽ _ˆ ^e (⁾1) ( τ , T ; g ⁽¹⁾ ( τ ), u ⁽ ^e ⁾ ( ⋅ )) , c _β ⁽ _ˆ ^e (⁾2) ( τ , T ; g ⁽²⁾ ( τ ), u ⁽ e ) ( • )), . , с^/^T ; g ⁽ n ) ( т ), u ⁽ e )0 )) ‘е E n , которые в соответствии с (20) и (21) определяются соотношениями:

V ˆ ⁽ ^e ⁾ ( τ,T ; g ˆ( τ ), u ⁽ ^e ⁾ ( ⋅ )) = { v ˆ ⁽ ^e ⁾ ( ⋅ )}: v ˆ ⁽ ^e ⁾ ( ⋅ ) ∈ V ⁽ ^e ⁾ ( τ,T ; g ˆ( τ ), u ⁽ ^e ⁾ ( ⋅ )),

c(e)(τ,T;g(τ))=

α w ( ⋅ ) ∈ W ( τ , T ; u ( ⋅ ))

w ˆ( ⋅ ) ∈ W ^ˆ ( τ , T ; u ( ⋅ ), v ˆ⁽ ^e ⁾ ( ⋅ ))

α ( g ( τ ), u ⁽ ^e ⁾ ( ⋅ ), v ˆ ⁽ ^e ⁾ ( ⋅ ), w ( ⋅ ), w ˆ( ⋅ ))} =

= min

v ⁽ ^e ⁾ ( ⋅ ) ∈ V ⁽ ^e ⁾ ( τ , T ; g ˆ( τ ), u ⁽ ^e ⁾ ( ⋅ )) ^w ⁽ ^⋅ ⁾ ^∈ ^W ⁽ τ ^, ^T ^; ^u ⁽ ^⋅ ⁾⁾ w ˆ( ⋅ ) ∈ W ^ˆ( τ , T ; u ( ⋅ ), v ⁽ ^e ⁾( ⋅ ))

α(g(τ), u(e) (⋅), v(e) (⋅), w(⋅), wˆ(⋅))}};(22)

i ∈ 1, n : c _β ⁽ _ˆ ^e (⁾ i ) ( τ , T ; g ⁽ ⁱ ⁾ ( τ ), u ⁽ ^e ⁾ ( ⋅ )) =

= m ax { w ⁽ ⁱ ⁾( ⋅ ) ∈ W ⁽ ⁱ ⁾( τ , T ; u ⁽ ^e ⁾( ⋅ ), v ˆ⁽ ⁱ ^, ^e ⁾( ⋅ )) β ˆ ⁽ ⁱ ⁾ ( g ⁽ ⁱ ⁾ ( τ ), u ⁽ ^e ⁾ ( ⋅ ), v ˆ ⁽ ⁱ ^, ^e ⁾ ( ⋅ ), w ⁽ ⁱ ⁾ ( ⋅ ))} =

= min m a x {

v ⁽ ⁱ ⁾ ( ⋅ ) ∈ V ⁽ ⁱ ⁾ ( τ , T ; u ⁽ ^e ⁾ ( ⋅ )) w ⁽ ⁱ ⁾( ⋅ ) ∈ W ⁽ ⁱ ⁾( τ , T ; u ⁽ ^e ⁾( ⋅ ), v ⁽ ⁱ ⁾( ⋅ ))

β ˆ ⁽ ⁱ ⁾ ( g ⁽ ⁱ ⁾ ( τ ), u ⁽ ^e ⁾ ( ⋅ ), v ⁽ ⁱ ⁾ ( ⋅ ), w ⁽ ⁱ ⁾ ( ⋅ ))} . (23)

5. Общая схема решения задачи двухуровневого иерархического минимаксного программного управления

Для любого фиксированного промежутка времени τ , Т ⊆ 0, T ( τ < T ) можно рассмотреть решения сформулированных задач 1–3. Тогда общую схему реализации процесса двухуровневого иерархического минимаксного программного терминального управления для нелинейной динамической системы (1)– (6) можно представить в виде реализации следующей последовательности действий:

1) для каждых фиксированных управления u ( ⋅ ) ∈ U ( τ , T ) игрока Р на уровне управления I и индекса i ∈ 1, n из решения соответствующей задачи 1 формируются множество V ⁽ ⁱ ^, ^e ⁾ ( τ,T ; g ⁽ ⁱ ⁾ ( τ ), u ( ⋅ )) минимаксных программных управлений игрока E_i и число c ⁽ _ˆ ^e ₍ ⁾ _i ₎ ( τ , T ; g ⁽ ⁱ ⁾ ( τ ), u ( ⋅ )) – значение результата минимаксного программного управления для этого игрока на уровне управления II , соответствующее управлению u ( ⋅ ), которые удовлетворяют соотношению (20); на основании этих элементов, из решения n задач 1 для всех значений индекса i ∈ 1, n , формируются множество V ⁽ ^e ⁾ ( τ,T ; g ˆ( τ ), u ( ⋅ )) ⊆ V ( τ,T ; u ( ⋅ )) минимаксных программных управлений v ⁽ ^e ⁾ ( ⋅ ) ∈ V ( τ,T ; u ( ⋅ )) игрока E на уровне

управления II и вектор cβ(ˆe) (τ, T; gˆ(τ), u(⋅)) = (^„(Tj; g <«(t ), u (•)), . T; g ^), , u(•)), , св>,)(Tj;g")(«•),u(•))) eEn - значение результата минимаксного программного управления для игрока Е на уровне управления II этой системы, соответствующие управлению u( ) игрока Р на уровне управления I;

2) из решения задачи 2 формируются множество U ⁽ ^e ⁾ ( τ , T ; g ( τ )) минимаксных программных управлений u ⁽ ^e ⁾ ( ) ∈ U ( τ , T ) игрока Р на уровне управления I и число c _α ⁽ ^e ⁾ ( τ , T ; g ( τ )) – значение результата минимаксного программного управления для игрока Р на уровне управления I этой системы, удовлетворяющие соотношению (21);
3) для любого допустимого минимаксного программного управления u ⁽ ^e ⁾ ( ) ∈ U ⁽ ^e ⁾ ( τ , T ; g ( τ )) игрока Р на уровне управления I , которое можно сформировать из решения задачи 2, на основании решения задачи 3 формируются множество V ⁽ ^e ⁾ ( τ,T ; g ˆ( τ ), u ⁽ ^e ⁾ ( )) ⊆ V ( τ , T ; u ⁽ ^e ⁾ ( )) минимаксных программных управлений { v ˆ ⁽ ^e ⁾ ( )} = { v ˆ ^(1, ^e ⁾ ( ), v⁽ 2e ) ( • ),, v ⁽2 ^e ) ( • ), . , v⁽ n , ^e ) ( • )} e V^(e ) ( Tj ; g ˆ( τ ), u ⁽ ^e ⁾ ( )) игрока Е для уровня управления II и вектор c _β ⁽ _ˆ ^e ⁾ ( τ , T ; g ˆ( τ ), u ⁽ ^e ⁾ ( )) =

(cβ(ˆe()1)(τ,T;g(1)(τ), u(e)( )), cβ(ˆe()2)(τ,T;g(2)(τ), uu)(.)),..„ . )(T,T;g(n)T), u •(.)))‘£ En -значение результата минимаксного программного управления для игрока Е на уровне управления II данной системы, соответствующие управлению u(e) (⋅) игрока Р и удовлетворяющие соотношениям (22), (23), такие, что для каждого фиксированного индекса i ∈ 1,n образующие их элементы vˆ(i,e) (⋅) и c(ˆe()i) (τ,T; g(i) (τ), u(e)(⋅)) совместно с управлением u(e) (⋅) игрока Р удовлетворяют и соотношению (21).

Заключение

Для исследуемой в данной работе задачи управления предлагается математическая формализация в форме решения многошаговой задачи двухуровневого иерархического минимаксного программного терминального управления в дискретной динамической системе (1)-(6), и предложена общая схема ее решения. Конкретные алгоритмы формирования предлагаемой двухуровневой системы управления могут быть разработаны на основе результатов работ [3–5].

Список литературы Минимаксное программное терминальное управление в двухуровневой иерархической нелинейной дискретной динамической системе

Красовский Н.Н. Теория управления движением. М.: Наука, 1968.
Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
Шориков А. Ф. Минимаксное оценивание и управление в дискретных динамических системах. Екатеринбург: Изд-во Урал. гос. ун-та, 1997.
Шориков А.Ф. Двухуровневое минимаксное управление в нелинейной многошаговой системе//Тез. докл. V Всесоюз. конф. по оптимальному управлению в механических системах. Казань: Изд-во КАИ, 1985. С. 62.
Шориков А. Ф. Алгоритм решения задачи е-оптимального программного терминального управления для дискретной динамической системы//Теория управления и теория обобщенных решений уравнения Га-ми льтона-Якоби: тр. междунар. семинара, поев. 60-летию акад. А.И. Субботина: в 2 т. Екатеринбург: Изд-во Урал. гос. ун-та, Т. 2. С. 190-196.
Месарович М., Мако Д., Такахара И. Теория иерархических многоуровневых систем. М.: Мир, 1973.
Базара М., Шетти К. Нелинейное программирование. Теория и алгоритмы. М.: Мир, 1982.