Методика управления агентами в мультиагентной экспертной системе
Автор: Арипова Ольга Владимировна, Гущин Артем Николаевич
Журнал: Сибирский аэрокосмический журнал @vestnik-sibsau
Рубрика: Математика, механика, информатика
Статья в выпуске: 1 (27), 2010 года.
Бесплатный доступ
Рассмотрены модели пользователей, взаимодействующих с распределенным сетевым ресурсом, с каждым из которых сопоставлен агент, и методика управления мультиагентной экспертной системой
Экспертная система, агент, взаимодействие, поведение, управление
Короткий адрес: https://sciup.org/148176155
IDR: 148176155
Текст обзорной статьи Методика управления агентами в мультиагентной экспертной системе
Управление распределенным сетевым ресурсом требует решения задач, связанных со сложностью организации взаимодействия ресурса и пользователя.
Для решения поставленной задачи [1] была разработана модель мультиагентной экспертной системы (рис. 1).
Для организации взаимодействия пользователей с распределенным сетевым ресурсом на основе разработанной модели мультиагентной экспертной системы рассмотрим следующие модели координации поведения агентов [2–6]:
-
1. Теоретико-игровые модели. Решают задачи выбора решений в условиях неопределенности и конфликта, позволяющие конструировать наборы правил и переговоров, следуя которым агенты приходят к равновесным соглашениям.
-
2. Модели коллективного поведения автоматов. Основаны на построении правил и протоколов переговоров в задачах, которые характеризуются большим количеством простых взаимодействий с неизвестными характеристиками.
-
3. Модели планирования коллективного поведения. Выявляют способ планирования поведения агентов (централизованное, частично централизованное, распределенное) для принятия решения о выборе своих действий в процессе координации частных планов.
-
4. Модели на основе BDI-архитектур. В этих модулях применяются аксиоматические методы теории игр и логической парадигмы искусственного интеллекта, задача координации поведения агентов заключается в согласовании результатов вывода в базах знаний отдельных агентов, полученных для текущего состояния внешней среды.
-
5. Модели на основе конкуренции. Используются понятие «аукцион» в качестве механизма координации поведения агентов, строящееся на предположении о возможности явной передачи «полезности» от одного агента к другому или к агенту-аукционеру.
Исходя из взаимодействия с распределенным сетевым ресурсом, из полного множества пользователей П были выделены следующие подмножества: А – подмножество администраторов (рис. 2); Э – подмножество экспертов, ЗП – зарегистрированные пользователи (рис. 3); ГП – гостевые пользователи (рис. 4).
Поскольку данные о возможных пользователях сформированы на основе обработки информации, поступающей от экспертов, которые также наделены правом влиять на все аспекты функционирования экспертной систе- мы, то было приято допущение, что подмножество Э нецелесообразно отождествлять с агентами. Построим модели поведения выделенных пользователей.
Со всеми выделенными классами пользователей были сопоставлены агенты следующих видов: каждому гостевому пользователю ГП i – реактивный агент РАГП i (рис. 5); каждому зарегистрированному пользователю ЗП i – реактивный агент РАЗП i (рис. 6); каждому пользователю-администратору А i – интеллектуальный агент ИАА i (рис. 7).
Помимо взаимодействия с распределенным сетевым ресурсом, необходимо организовать связи между существующими агентами, главными характеристиками которых являются направленность, избирательность, интенсивность и динамичность. При этом следует учитывать конечность времени существования каждого агента и влияние поведения агентов в рамках использования материалов, расположенных на распределенном сетевом ресурсе.
Рассмотрим требования к агентам [2; 3], сопоставленные с каждым подмножеством пользователей (см. таблицу).
В связи с тем что реактивные агенты не имеют развитого знания об окружающей среде и полностью зависят от цели, по которой формируют реакции на создаваемые ситуации, автономны и имеют конечный «жизненный» цикл, можно рассматривать построение их функционирования на основе продукционных систем с обязатель-

Рис. 1. Модель мультиагентной экспертной системы

Рис. 4. Модель поведения администратора Рис. 5. Модель «жизненного цикла» агента гостевого пользователя
Требования к агентам пользователей
-
r : p i ; a i ^ b i ,
где a ^ b — ядро, являющееся основным элементом продукции, интерпретируемое «если а, то b», под а понимается условие существования заключения b; i – имя, с помощью которого данная продукция выделяется из множества продукций; pi – условие применимости ядра продукции (предикат): если p – истинно, ядро активизируется.
Пусть для реактивного агента ai =Y Vak),

Рис . 6. Модель « жизненного цикла » агента зарегистрированного пользователя

Рис . 7. Модель « жизненного цикла » агента администратора
где aijk – четкий предикат над состоянием S агента; a ijk = a jk ( S ) , S = { s i , -, s j } , s i , s j — параметры состояния.
Пример:
КОГДА пользователь = зарегистрированному пользователю
И выполнен вход на распределенный сетевой ресурс
ЕСЛИ существуют непрочитанные сообщения
ТО пользователю предложено ознакомиться с сообщениями.
Тогда для интеллектуального агента требуется изменение структуры правил, а именно замена ядра на необязательное, с оценкой реализации на основе нечеткой логики и введением в структуру постусловий:
Г : PSa i ^ b i ;", где ni , – постусловие i -й продукции.
Пусть для интеллектуального агента
a
(S)=v ('^avk(S))fi fa.(S)=max (min fv(S)), где f(S) – функция принадлежности, зависящая от истинности предиката, такая, что fai (S) = 0 ^ bi - ложно, fai (S) = 1 ^ bi - истинно. Для определенности изменения со стояния агента введем fпорогi такое, что fa, ( S )> f порог, ^ bi - истинно и выполняется постусловие ni.
Пример:
ЕСЛИ существуют непрочитанные сообщения
И они не являются срочными
И НЕ(администратор занят)
ТО с f порог = 0,75: предложить показать сообщения администратору;
ПОСТУСЛОВИЕ = показать сообщения администратору.
ЕСЛИ существуют непрочитанные сообщения
И они являются срочными
И НЕ(администратор занят)
ТО c f порог = 0.1 показать сообщение администратору; ПОСТУСЛОВИЕ = показать сообщения администратору.
Такие требования позволяют проводить координацию поведения агентов с помощью модели на основе BDI- архитектур, так как акцент делается на описание таких понятий, как убеждения (belief), желания (desire) и намерения (intention). Логический вывод в базы знаний осуществляется непосредственно в процессе функционирования агентов.
Мультиагентная экспертная система, построенная на гибридной архитектуре, с использованием агентов двух видов – интеллектуальных для подмножества администраторов и реактивных для подмножеств зарегистрированных и гостевых пользователей, должна реализовывать рефлексивное управление распределенным сетевым ресурсом, сущность которого заключается в том, чтобы заставить пользователя осознанно подчиняться влиянию извне, т. е. сформировать у него такие желания и намерения, которые совпадают с требованиями окружения.
Под рефлексивным управлением будем понимать актуализацию социально значимой востребованности; построение множества уникальных управленческих по- нятий и отношений; осуществление деятельности множества, в том числе за счет привлечения к интерпретации понятий профессиональных специалистов (экспертов).
Сама экспертная система построена на основе продукционной модели с нечеткой логикой [7], где подсистема моделирования поведения агентов используется в качестве потенциального аргумента предикатов в антецеденте правил, т. е. наблюдаемое поведение агентов может быть использовано в правилах самой экспертной системы, но повлиять на поведение агентов возможно только изменениями внешней среды.
Пусть Sa – состояние агента, Sv – наблюдаемое состояние агентов, Se – состояние экспертной системы, Sr – состояние распределенного сетевого ресурса; R e = { r 1 ,..., r e . ,..., r e n } - множество правил, которыми обладает экспертная система вида re. : РеЛ % ^ be/, ne. где ae ( Se ) – условие существования заключения be , причем S e включает в себя Sv ( S „ = { S v 1 ,Sp v2 ,..., S v, ,..., S v n } ), S v c Sa ( S v c S e ), b i - приводит к изменениям S e , что в свою очередь может привести к изменению Sr . Поскольку Sr может приводить к изменениям поведения пользователя, что изменяет внешнюю среду, влияющую на поведение агентов, что в свою очередь наблюдается экспертной системой, то поведение пользователя в момент времени t 1 (начало работы экспертной системы) приводит к изменениям распределенного сетевого ресурса в момент времени t 2 и последующим возможным поведением пользователя в момент времени t 3 и так далее:
S r = ^ S‘; - 1 , S e n - 1 Пд t n - 1 ^ S r - - 2 ( S r n - 3 , S e n - 3,:
Пдtn-3 (S'"-4 (...(Sr2,Se2Пдt2 (Sr )))))J, где Пд – поведение.
Таким образом, разработана модель взаимодействия распределенного сетевого ресурса и пользователей, отличительной особенностью которой является использование мультиагентной экспертной системы. Методика управления агентами позволяет рационализировать данное взаимодействие путем рефлексивного управления поведением пользователей через динамические модификации представления и содержания распределенного сетевого ресурса.
Данная методика применима к задачам организации взаимодействия распределенного сетевого ресурса и пользователя на основе образовательного ресурса и на основе приборов измерения и контроля уровня радиации, что подтверждено актами внедрений.