Агентно-ориентированная интеллектуальная система поддержки принятия решений: архитектура и разработка

Автор: Зайцев Е.И., Нурматова Е.В.

Журнал: Вестник Российского нового университета. Серия: Сложные системы: модели, анализ и управление @vestnik-rosnou-complex-systems-models-analysis-management

Рубрика: Информатика и вычислительная техника

Статья в выпуске: 3, 2025 года.

Бесплатный доступ

В статье рассматривается архитектура, анализ, проектирование и реализация агентноориентированной интеллектуальной системы поддержки принятия решений. Описываются структура программных агентов, организация их совместной работы, реализуемые программными агентами функции и запросы к распределенной базе знаний, алгоритмы многоагентного обучения с подкреплением. Рассматриваются методы повышения производительности и надежности системы. Описана подсистема управления распределенной базой знаний, способная адаптироваться к меняющимся условиям внешней среды, а также своевременно и адекватно реагировать на ситуации, возникающие при дефиците вычислительных или временных ресурсов. Полученные результаты демонстрируют эффективность использования агентно-ориентированного подхода для создания интеллектуальной системы поддержки принятия решений, способной находить и анализировать решения сложных проблем в условиях неопределенности и динамичной внешней среды.

Еще

Многоагентная система, программные агенты, распределенная база знаний, искусственная нейронная сеть, обучение с подкреплением

Короткий адрес: https://sciup.org/148331947

IDR: 148331947 | УДК: 004.89 | DOI: 10.18137/RNU.V9187.25.03.P.85

Текст научной статьи Агентно-ориентированная интеллектуальная система поддержки принятия решений: архитектура и разработка

Разработка агентно-ориентированной интеллектуальной системы поддержки принятия решений (далее – АИСППР), состоящей из слабосвязанных интеллектуальных программных модулей, независимо решающих свои частные задачи и объединяющих свои локальные возможности для решения общей проблемы, расширяет сферу автоматизации информационных процессов на плохоформализуемые проблемные области, в которых для принятия обоснованных решений требуется анализировать большие объёмы данных, осуществлять логические выводы и адаптироваться к условиям неопределенности и не-стационарности внешней среды.

Интеграция низкоуровневого (реактивного) восприятия с высокоуровневым логическим мышлением является одной из наиболее актуальных задач в области искусственного интеллекта [1; 2]. При разработке АИСППР основные аспекты интеграции реактивной (нейросетевой) и когнитивной (семиотической) моделей рассматриваются в контексте агентно-ориентированного подхода. Низкоуровневое восприятие прикладных программных агентов реализуется с помощью методов глубокого машинного обучения, а высокоуровневые рассуждения осуществляются с использованием логических и вероятностных представлений и логического вывода.

Подсистема представления и обработки знаний в АИСППР принципиально отличается от традиционных систем, базирующихся на знаниях (Knowledge-Based System – KBS), которые имеют только один интеллектуальный решатель и осуществляют поиск решения на графе редукции задачи с использованием полной и непротиворечивой базы знаний. Для повышения производительности традиционных KBS разработаны параллельные алгоритмы обработки редукционных графов, однако эти алгоритмы могут быть

Агентно-ориентированная интеллектуальная система поддержки принятия решений: архитектура и разработка реализованы только в мультипроцессорных системах с общей памятью (Shared Memory Processors – SMP).

В АИСППР, ориентированной на использование в мультикомпьютерных системах с распределенной памятью (No Remote Memory Аccess – NORMA), вместо одного интеллектуального решателя задач используется сеть автономных интеллектуальных (прикладных) программных агентов, взаимодействующих друг с другом посредством передачи сообщений. Инкапсулированные в прикладных программных агентах когнитивные структуры данных, методы логического вывода и искусственные нейронные сети позволяют агентам действовать рационально и адаптироваться к внешней среде. Подсистема обработки знаний и алгоритмы многоагентного обучения с подкреплением обеспечивают возможность накапливать опыт через взаимодействие агентов друг с другом и с окружающей средой [3].

В АИСППР для передачи сообщений используется специализированный механизм межпроцессного взаимодействия, реализованный с помощью системных программных агентов, входящих в состав системной библиотеки LibOS. Специализированные программные модули LibOS, ассоциированные с системными программными агентами, обеспечивают более высокую производительность по сравнению с универсальными библиотеками.

В процессе решения задач программные агенты обращаются к микросервисам, которые с целью повышения производительности и надежности АИСППР дублируются на разных вычислительных узлах. Балансировка нагрузки в вычислительном кластере, как и передача сообщений между узлами, осуществляется с использованием системных программных агентов. Повышение производительности АИСППР достигается также за счёт динамической оптимизации логической структуры распределенной базы знаний (далее – РБЗ) и адаптации её условиям нестационарной внешней среды.

Архитектура АИСППР

Агентно-ориентированная интеллектуальная система поддержки принятия решений имеет многоуровневую архитектуру, в которой на самом верхнем уровне прикладные программные агенты решают сложные плохоформализуемые задачи. На базовом уровне системные программные агенты планируют и управляют распределенными вычислительными ресурсами, взаимодействуя с помощью внутрипроцессных и внепроцессных вызовов API (Application Programming Interfaces) с операционной системой, системными службами и микросервисами (см. Рисунок 1).

В процессе обработки знаний прикладные программные агенты выполняют анализ, сравнение, спецификацию объектов и событий проблемной области. При спецификации осуществляется поиск в базе знаний значений атрибутов с использованием как четких, так и нечетких запросов.

Пример нечеткого запроса, включающего две лингвистические переменные (Performance, Price) с кусочно-линейными функциями принадлежности, а также результат его выполнения после обращения к реляционной таблице, содержащей пять записей, показан на Рисунке 2.

Для эффективной обработки большого количества запросов может потребоваться масштабирование системы, то есть добавление новых микросервисов для обработки возросшей нагрузки. Масштабирование повышает не только производительность, но и надежность АИСППР.

Вестник Российского нового университета

Серия «Сложные системы: модели, анализ и управление». 2025. № 3

Узел 1

Узел К

Методы

Промежуточное программное обеспечение (middleware) / Системные агенты LibOS

Службы операционной системы

Ядро операционной системы

Аппаратное обеспечение

СЕТЬ

Рисунок 1. Архитектура АИСППР

Источник: здесь и далее рисунки выполнены авторами.

Рисунок 2. Функции принадлежности и результат нечеткого запроса

При взаимодействии с микросервисами прикладные программные агенты отправляют запросы системным программным агентам, которые балансируют нагрузку, перенаправляя эти запросы соответствующим службам. В случае выхода из строя одного из вы-

Агентно-ориентированная интеллектуальная система поддержки принятия решений: архитектура и разработка числительных узлов запросы от программных агентов направляются на другие узлы (см. Рисунок 3).

Рисунок 3. Взаимодействие программных агентов с микросервисами

Проектирование программных агентов АИСППР

Для описания функционирования программных агентов используются диаграммы состояний-переходов. Пример диаграммы с пятью состояниями, два из которых являются составными (имеющими вложенные состояния), показан на Рисунке 4.

Рисунок 4. Диаграмма состояний-переходов

Из состояния «Инициализация» интеллектуальный агент переходит в составное состояние «Выбор», в котором формируется стратегия и выбирается необходимый источник знаний с учетом связей, установленных на этапе инициализации. Далее агент переходит в составное состояние «Координация», в котором активизируются новые источники знаний. Если решение найдено (состояние «Решение»), полученные в предыдущем состоянии данные используются для формирования новых запросов к базе знаний.

Вестник Российского нового университета

Серия «Сложные системы: модели, анализ и управление». 2025. № 3

Пример диаграммы взаимодействия программных агентов одного из узлов АИСППР представлен на Рисунке 5.

Рисунок 5. Диаграмма взаимодействия

На диаграмме взаимодействия время движется сверху вниз. Компоненты доступа к базе знаний и прикладные программные агенты представлены вертикальными линиями. Сообщения между программными агентами обозначены горизонтальными стрелками. В данном примере каждый агент с номером k взаимодействует только со своим ближайшим соседом, имеющим номер ( k - 1). Интеллектуальные агенты этой группы последовательно выполняют свои назначенные задачи в рамках одного процесса (без переключения контекста).

Каждый программный агент самостоятельно принимает решения и обучается, реализуя алгоритм мультиагентного глубокого обучения с подкреплением (Multi-Agent Deep Reinforcement Learning – MDRL), математической моделью которого является децентрализованный частично наблюдаемый марковский процесс принятия решений [4; 5].

В АИСППР реализована децентрализованная модель MDRL, которая позволяет использовать стандартные алгоритмы RL. В децентрализованной модели управление (выполнение) и обучение агентов происходят локально.

Согласно схеме обучения с подкреплением программные агенты наблюдают среду, предпринимают действия, меняющие состояние среды, получают сигналы подкрепления, увеличивающие или уменьшающие вероятность совершения определенного действия при тех же условиях в будущем [6–14].

В настоящее время для обучения агентов АИСППР используется мультиагент-ный алгоритм оптимизации проксимальной политики (Multi-Agent Proximal Policy Optimization – MAPPO), который является расширением эффективного и относительно простого в реализации алгоритма PPO (Proximal Policy Optimization) [15]. Этот алгоритм хорошо подходит для задач, которые решаются в условиях частичной информации и требуют высокой степени децентрализации и асинхронного управления. Однако, как и другие методы глубокого обучения с подкреплением, он имеет проблемы со стабильностью во время обучения в больших системах. В будущей версии АИСППР предполагается реализовать более эффективный иерархический MDRL, объединяющий алгоритмы Model-free и Model-based, что позволит множеству агентов стабильно обучаться в сложных средах с редкими вознаграждениями.

Агентно-ориентированная интеллектуальная система поддержки принятия решений: архитектура и разработка

Рисунок 6. Децентрализованная модель MDRL

Оптимизация базы знаний АИСППР

Подсистема управления распределенной базой знаний АИСППР динамически оптимизирует логическую структуру РБЗ и адаптирует её к меняющимся условиям нестационарной внешней среды [16]. Критерии эффективности синтеза оптимальной структуры приведены в Таблице. В качестве основного критерия используется минимум общего времени последовательного выполнения множества транзакций. Задача оптимизации по указанному критерию относится к классу NP-трудных задач, решение которой в данном случае осуществляется с помощью метода ветвей и границ.

Математическая постановка задачи имеет следующий вид:

min ^K 0 ^P 0 ^QQ

^{ a it b tr b jm ( ЦЛ

Z ^v:> Z (i - z^ ) ( с t =1 _ m =1

.acc । traanff \ । X^y tAksk . ^eer . Arans} 1 1

+ t rm ) + Z Z sr ( t + t rm + t rm ) ] ( ^, r =1

где t ^task – средняя длительность формирования одного запроса в составе транзакции;

t rmr - средняя длительность выбора маршрута, установления логических соединений между узлом-клиентом ( r ) и узлом-сервером ( m );
t_r^tr_m^ansf – средняя длительность передачи раздела данных (логической записи) с узла клиента ( r ) на узел сервера ( m ) по оптимальному пути;
t^acc - среднее время доступа к РБЗ и поиска записей;

kp - частота использования запроса ( p ) транзакцией ( к );

Q - бинарный признак использования запроса ( p ) транзакцией ( к ).

Вестник Российского нового университета

Серия «Сложные системы: модели, анализ и управление». 2025. № 3

Таблица

Критерии эффективности задачи синтеза

Переменная	Значения
a _it	Определяет распределение логической записи i РБЗ в раздел t : a _it = 1, если запись попала в раздел; a _it = 0 в противном случае
b tr	Определяет размещение раздела t на сервере узла r распределённой системы
v s ⁿ t	Определяет обновление транзакцией s, состоящей из n запросов, раздела t v _st ⁿ = 1, если раздел обновлен
^Z st	Показатель P_sr определяет множество узлов r серверов РБЗ, фиксируемых транзакцией s : TI P = Уа>Л sr st it tr Z = 1, если P > 1 t =1 i =1 st sr
Z ^m st	Показатель P_sm определяет множество узлов m серверов РБЗ, содержащих данные по транзакции s раздела j J ⁿ sm sj jm j =1 Z _sr = 1, если P _sr ≥ 1;

Источник: таблица составлена авторами.

На Риcунке 7 показаны основные этапы синтеза оптимальной логической структуры РБЗ.

Рисунок 7. Э тапы синтеза логической структуры РБЗ

В результате синтеза оптимальной логической структуры РБЗ определяется состав разделов РБЗ, формализованный в виде матрицы a _it; структура размещения разделов на вычислительных узлах АИСППР, формализованная в виде матрицы b _tr; граф распределения РБЗ на вычислительных узлах b _jm, содержащих данные по транзакциям конкретного

Агентно-ориентированная интеллектуальная система поддержки принятия решений: архитектура и разработка раздела. Оптимизация РБЗ повышает скорость доступа к знаниям АИСППР, обеспечивает возможность масштабирования системы и подключения новых источников знаний.

Подсистема обработки нечетких запросов

Автоматизация обработки фрагментов РБЗ, имеющих неопределённый характер, позволяет моделировать сложные причинные взаимосвязи и увеличивает диапазон выборки по запросу. В условиях неопределенности применение четких SQL-запросов к базе знаний во многих случаях не позволяет получить необходимую информацию, поэтому программные агенты используют нечёткие запросы.

На Рисунке 8 показана подсистема обработки запросов с нечёткими условиями, которая включает следующие модули:

• модуль добавления данных в таблицу лингвистических переменных (далее – ЛП), их терм-множеств;
• модуль формирования параметров нечеткого запроса: блоки выбора ЛП, терм-множеств, нечетких модификаторов, ослабляющих/усиливающих диапазон значений терм-множеств;
• модуль настройки параметров нечёткого запроса: блок добавления сформированного нечеткого запроса в текстовое поле со всеми выбранными параметрами;
• модуль обработки и отображения результатов запроса с нечетким условием.

Рисунок 8. Подсистема обработки нечётких запросов

Инструмент нечетких запросов позволяет согласовать формальные критерии и неформальные требования к объектам базы знаний. В таком случае данные, не удовлетворяющие какому-то одному критерию, могут быть выбраны, если они имеют хорошие показатели по другим критериям. Такими критериями являются длительности выполнения запроса, декомпозиции запроса на подзапросы, обслуживания запроса на сервере, фиксации и передачи сообщения о результатах завершения на сервер узла администратора, снятия блокировок с записей.

Заключение

В статье рассмотрены архитектура и разработка агентно-ориентированной интеллектуальной системы поддержки принятия решений, включающей системных и прикладных про-

Вестник Российского нового университета

Серия «Сложные системы: модели, анализ и управление». 2025. № 3

граммных агентов. Прикладные программные агенты решают сложные плохоформализуемые задачи и помогают конечному пользователю выбрать наилучшее решение. Прикладные программные агенты способны рационально действовать в неопределенной динамической среде, использовать для решения задач неполные и нечеткие знания, обучаться, формируя эффективную стратегию действий посредством глубокого обучения с подкреплением. Системные программные агенты повышают производительность и надежность АИСППР, реализуя эффективные специализированные методы управления информационными и вычислительными ресурсами. Повысить эффективность АИСППР позволяют также рассмотренные в статье алгоритмы синтеза оптимальной логической структуры распределенной базы знаний.