Моделирование отсрочки поимки цели в ADT-игре с тремя защитниками
Автор: Самохин А.С.
Журнал: Вестник Пермского университета. Математика. Механика. Информатика @vestnik-psu-mmi
Рубрика: Компьютерные науки и информатика
Статья в выпуске: 3 (70), 2025 года.
Бесплатный доступ
Рассматривается вариант Attacker-Defender-Target задачи с тремя защитниками. Задача рассматривается в простых движениях в плоской постановке: цель и защитники двигаются прямолинейно с постоянной скоростью. Начальное положение цели и атакующего задано. В этом случае движение цели определяется её начальным вектором скорости, а защитников – моментом и углом выпуска. Считается, что все защитники выпускаются сразу в начальный момент времени обнаружения атаки, так как их выпуск позже может быть шумным и демаскировать цель для атакующего. Защитники представляют собой ложные цели, фактически задача заключается в определении таких траекторий защитников, при которых атакующий вначале занимается их перехватом, и только после этого переключается на преследование основной цели. Тем самым время перехвата основной цели увеличивается, и при некоторых значениях параметров она может стать недостижима для имеющего ограниченный запас энергоресурса атакующего. В исследовании рассматривается модель работы системы самонаведения автономного атакующего аппарата, основанная на пропорциональной навигации, при этом сначала атакующий решает задачу совместного преследования целей, затем обходит цели по очереди. Разработан программный комплекс, проведено численное моделирование, определены оптимальные углы выпуска трех защитников для различных курсовых углов цели. Для каждого из рассмотренных случаев найдено решение, при котором атакующему не хватает энергоресурса для перехвата основной цели.
Преследование, система самонаведения, использование защитников, автономный аппарат, оптимизация, численное моделирование, перехват, ADT, пропорциональная навигация, ложная цель
Короткий адрес: https://sciup.org/147252175
IDR: 147252175 | УДК: 004.942 | DOI: 10.17072/1993-0550-2025-3-102-110
Текст научной статьи Моделирование отсрочки поимки цели в ADT-игре с тремя защитниками
лицензии, перейдите по ссылке
Существуют различные способы защиты подвижного объекта в водной среде от мобильного атакующего, оснащенного системой самонаведения: маневр уклонения, выпуск ловушки, генерирующей пузырьки [1], использование пассивных ложных целей, отражающих гидроакустический сигнал, буксируемых постановщиков гидроакустических помех (jammer, towed decoy, towed acoustic countermeasures, false-target generator) [2, 3], активный защитник, который перехватывает атакующего (hard-kill) [3], активная ложная цель (decoy) [4–5].
В настоящей статье рассматривается случай активной защиты, в то время как основная цель уклоняется от атаки, она может выпустить три ложных цели. Ложные цели отвлекают внимание атакующего, вынуждают атакующего тратить энергоресурс на свою поимку, и позволяют тем самым основной цели уйти от перехвата атакующим в связи с исчерпанием его запаса хода (soft-kill). В таком случае взаимодействие объектов может быть математически описано как ADT-игра (Attacker–Defender–Target), "атакующий – защитник – цель" [6–11].
В [8] приводится обзор методов определения управления для каждого из игроков ADT-игры. Управление может определяться на основе как нейросетевых [8, 9], так и классических подходов. В статье [10] Рубиновичем Е. Я. задача решена геометрически – найдено управление, при котором защитник, обладающий большей маневренностью, чем цель, гарантированно перехватит атакующего на его пути движения к цели.
В работах [11–13] ADT-игры исследуются на основе подхода теории дифференциальных игр, предполагается, что защитник движется быстрее цели.
В большинстве исследований каждая из сторон "атакующий – защитник – цель" представлена одним игроком. Отметим работы [12, 13], в которых проанализирована игра в случае двух атакующих. В [14] при этом решается уравнение Риккати. В работе [15] рассмотрен случай сразу нескольких преследователей, в статье [16] исследовалась дифференциальная игра с несколькими нападающими, несколькими защитниками в случае неподвижной цели.
Настоящая работа является развитием [17], в которой рассматривалась ADT-игра в плоской постановке при использовании одного или двух защитников, движущихся медленнее цели и атакующего, на случай трех защитников.
1. Постановка задачи
Все игроки представляют собой материальные точки. Перемещение цели и защитников рассматривается в простых движениях. В декартовой системе координат движение цели описывается соотношениями:
(xT = v T cos(yt), lУ т = Vt sin(YT),
(1.1)
где ( xT ( t ) , yT ( t )) = r T ( t ) - координаты цели в момент времени t , при этом xT (0) = yT (0) = 0.
Движение защитников описывается аналогичными соотношениями:
(* Di = vd COS(Y Di ).
(1.2)
IУ Di = Vd sin(YDi) , где i = 1..3, (xD(tt), yD(tt)) = rDitt) — координаты i -го защитника в момент времени t,
Автономный атакующий аппарат двигается с постоянной скоростью и в качестве системы самонаведения использует пропорциональную навигацию [18–20]. Его перемещение задается уравнением:
r A (t)=v A (t)
r(t)-rA(t) \f‘(t)—r A (t)\ ,
(1.3)
где r A (t) - положение атакующего в момент времени t, r(t) - положение выбранной для преследования цели. Вначале атакующий движется к центру масс всех видимых объектов, осуществляя совместное преследование, т.е. r(t) = 1 (r T (t)+r D1 (t) + r D2 (t) + r D3 (t)). Далее атакующий преследует объекты отдельно, по очереди, пока не поразит основную цель или пока у него не закончится энергоресурс, т.е. пока не наступит момент времени T ax .
Курсовой угол цели ут полагается постоянным, углы выпуска защитников yDi оптимизируются с целью максимизации времени перехвата цели атакующим:
T — > max. (1.4)
2. Методы исследования
Положения цели и защитников в любой момент времени вычисляются аналитически по формулам (1.1)–(1.2). Для определения траектории атакующего необходимо интегрировать уравнение (1.3), что в работе осуществлялось численно методом Рунге–Кутты с автоматическим выбором шага. Корректность работы метода была проверена на тестовых примерах с известным ответом.
На первом этапе преследования на каждом шаге интегрирования сравнивалось расстояние l = \r A (t) — r(t) | между атакующим и центром масс коалиции цели и защитников со всеми расстояниями между игроками коалиции l ij . В случае существования таких i,j, что l > l ij , начинался второй этап преследования, на котором атакующий переключался с преследования центра масс на поочередное преследование ближайших целей. Ближайшая цель при этом определялась на каждом шаге интегрирования, атакующий мог переключаться между ними.
На каждом шаге обоих этапов преследования определялись расстояния от атакующего до ложных целей и в случае, если оказывалось, что расстояние до i-го защитника меньше е , то атакующий распознает его как ложную цель и далее этот защитник не оказывает на него влияние, движение же самого i-го защитника в этот момент прекращается.
Оптимизируемые углы выпуска защитников yDi перебирались на сетке их возможных значений с измельчением данной сетки в окрестности максимумов функционала (1.4), полученных при решении на более грубой сетке.
Игра заканчивалась проигрышем коалиции цели и защитников в момент времени т: гд (т)= гт(т), т < T maх, такой что в этот момент происходит поражение цели атакующим или выигрышем коалиции по полной выработке энергоресурса атакующим в момент t = T maх, если к этому моменту цель не была достигнута атакующим.
В случае проигрыша атакующего, вычислялось расстояние между ним и целью на момент окончания игры d ( T ), а также проводилось дальнейшее моделирование до перехвата им цели в некоторый момент T в предположении о неограниченности энергоресурса атакующего, что всегда возможно при условии v A > v T .
3. Результаты численного моделирования
Моделирование проводилось для обезразмеренных значений параметров: vD = 0.3 , vT = 0.6, vA = 0.9 - скорости игроков, d (0) = 10 - начальное расстояние между атакующим и целью, Tm = 30 - запас энергоресурса атакующего, е = 1 - расстояние на котором атакующий распознает защитника как ложную цель.
На рисунках 1–3 закрашенными кругами отражено положение всех игроков в момент перехода атакующего от совместного преследования к поочередному, квадратом – центр масс сигналов коалиции в этот момент времени, треугольниками – начальное положении цели, защитников и атакующего. Черной линией показана траектория движения атакующего, синей – цели, красными – защитников.
Рис. 1. Траектории движения атакующего, цели, трех защитников, соответствующие оптимальным углам выпуска защитников для курсового угла цели уТ = 0°
В случае курсового угла цели ут = 0 ° оптимальными углами выпуска трех защитников оказались 61.3 6°, 13 7.56° и 147.17° соответственно. При этом d ( T maх) = 8.04 , T = 56.49, см. рис. 1.
В случае ут = 30 ° оптимальными углами выпуска защитников оказались -133.40°, -4.3 8° и 143.41°. При этом d ( T max) = 7.82, T = 55.78, см. рис. 2.
Рис. 2. Траектории движения атакующего, цели, трех защитников, соответствующие оптимальным углам выпуска защитников для курсового угла цели уТ = 30°
Рис. 3. Траектории движения атакующего, цели, трех защитников, соответствующие оптимальным углам выпуска защитников для курсового угла цели уТ = 45°
В случае ут = 45 ° оптимальными углами выпуска защитников оказались 7.47°, 160.12° и 174.65°. При этом d (T^ х) = 7.19, T = 53.75, см. рис. 3.
Отметим, что в каждом из рассмотренных случаев атакующему хватает энергоресурса для перехвата цели в случае отсутствия защитников.
В результате проведенного численного моделирования, в котором оптимизировался выпуск защитников, во всех трех рассмотренных случаях получены сценарии выпуска защитников, при которых атакующий не сумеет догнать цель до исчерпания своего энергоресурса, что означает целесообразность выпуска ложных целей для защиты от атакующего, оснащенного системой самонаведения.
4. Заключение
В работе рассмотрена ADT-игра пяти игроков: атакующего и коалиции из цели и трех защитников. Динамика задачи рассматривается в простых движениях, цель и защитники движутся прямолинейно. Атакующий оснащен системой самонаведения, его траектория определяется законом пропорциональной навигации.
Проведено численное моделирование для трех различных курсовых углов цели, найдены оптимальные углы выпуска защитников, позволяющие максимально отсрочить поимку цели атакующим. В каждом из случаев найдены решения для коалиции, при которых атакующий последовательно преследует ложные цели и в итоге ему не хватает энергоресурса для перехвата основной цели.
В качестве развития работы задача может быть рассмотрена в 3-мерной постановке с более сложной динамикой объектов, с ограничением на время выпуска защитников, может быть исследован вопрос оптимизации угла маневра защищаемого объекта и проанализирован случай нескольких атакующих.