Методика управления агентами в мультиагентной экспертной системе

Автор: Арипова Ольга Владимировна, Гущин Артем Николаевич

Журнал: Сибирский аэрокосмический журнал @vestnik-sibsau

Рубрика: Математика, механика, информатика

Статья в выпуске: 1 (27), 2010 года.

Бесплатный доступ

Рассмотрены модели пользователей, взаимодействующих с распределенным сетевым ресурсом, с каждым из которых сопоставлен агент, и методика управления мультиагентной экспертной системой

Экспертная система, агент, взаимодействие, поведение, управление

Короткий адрес: https://sciup.org/148176155

IDR: 148176155

Текст обзорной статьи Методика управления агентами в мультиагентной экспертной системе

Управление распределенным сетевым ресурсом требует решения задач, связанных со сложностью организации взаимодействия ресурса и пользователя.

Для решения поставленной задачи [1] была разработана модель мультиагентной экспертной системы (рис. 1).

Для организации взаимодействия пользователей с распределенным сетевым ресурсом на основе разработанной модели мультиагентной экспертной системы рассмотрим следующие модели координации поведения агентов [2–6]:

  • 1.    Теоретико-игровые модели. Решают задачи выбора решений в условиях неопределенности и конфликта, позволяющие конструировать наборы правил и переговоров, следуя которым агенты приходят к равновесным соглашениям.

  • 2.    Модели коллективного поведения автоматов. Основаны на построении правил и протоколов переговоров в задачах, которые характеризуются большим количеством простых взаимодействий с неизвестными характеристиками.

  • 3.    Модели планирования коллективного поведения. Выявляют способ планирования поведения агентов (централизованное, частично централизованное, распределенное) для принятия решения о выборе своих действий в процессе координации частных планов.

  • 4.    Модели на основе BDI-архитектур. В этих модулях применяются аксиоматические методы теории игр и логической парадигмы искусственного интеллекта, задача координации поведения агентов заключается в согласовании результатов вывода в базах знаний отдельных агентов, полученных для текущего состояния внешней среды.

  • 5.    Модели на основе конкуренции. Используются понятие «аукцион» в качестве механизма координации поведения агентов, строящееся на предположении о возможности явной передачи «полезности» от одного агента к другому или к агенту-аукционеру.

Исходя из взаимодействия с распределенным сетевым ресурсом, из полного множества пользователей П были выделены следующие подмножества: А – подмножество администраторов (рис. 2); Э – подмножество экспертов, ЗП – зарегистрированные пользователи (рис. 3); ГП – гостевые пользователи (рис. 4).

Поскольку данные о возможных пользователях сформированы на основе обработки информации, поступающей от экспертов, которые также наделены правом влиять на все аспекты функционирования экспертной систе- мы, то было приято допущение, что подмножество Э нецелесообразно отождествлять с агентами. Построим модели поведения выделенных пользователей.

Со всеми выделенными классами пользователей были сопоставлены агенты следующих видов: каждому гостевому пользователю ГП i – реактивный агент РАГП i (рис. 5); каждому зарегистрированному пользователю ЗП i – реактивный агент РАЗП i (рис. 6); каждому пользователю-администратору А i – интеллектуальный агент ИАА i (рис. 7).

Помимо взаимодействия с распределенным сетевым ресурсом, необходимо организовать связи между существующими агентами, главными характеристиками которых являются направленность, избирательность, интенсивность и динамичность. При этом следует учитывать конечность времени существования каждого агента и влияние поведения агентов в рамках использования материалов, расположенных на распределенном сетевом ресурсе.

Рассмотрим требования к агентам [2; 3], сопоставленные с каждым подмножеством пользователей (см. таблицу).

В связи с тем что реактивные агенты не имеют развитого знания об окружающей среде и полностью зависят от цели, по которой формируют реакции на создаваемые ситуации, автономны и имеют конечный «жизненный» цикл, можно рассматривать построение их функционирования на основе продукционных систем с обязатель-

Рис. 1. Модель мультиагентной экспертной системы

Рис. 4. Модель поведения администратора               Рис. 5. Модель «жизненного цикла» агента гостевого пользователя

Требования к агентам пользователей

Характеристики Типы агентов РАГПi РАЗПi ИААi Автономное выполнение + + + Взаимодействие с другими агентами + + + Реактивность + + + Адаптивное поведение – + + Обучение на основе взаимодействия с окружением – + + Терпимость к ошибкам и (или) неверным входным сигналам – – + Функционирование в режиме р еального времени – – + Конечность жизненного цикла + + + Сохранение поведения в БД экспертной системы – + + ным ядром. Тогда каждый агент обладает множеством правил R = {r1,..., r,..., rn}, имеющих следующую структуру:
  • r : p i ; a i ^ b i ,

где a ^ b — ядро, являющееся основным элементом продукции, интерпретируемое «если а, то b», под а понимается условие существования заключения b; i – имя, с помощью которого данная продукция выделяется из множества продукций; pi – условие применимости ядра продукции (предикат): если p – истинно, ядро активизируется.

Пусть для реактивного агента ai =Y Vak),

Рис . 6. Модель « жизненного цикла » агента зарегистрированного пользователя

Рис . 7. Модель « жизненного цикла » агента администратора

где aijk – четкий предикат над состоянием S агента; a ijk = a jk ( S ) , S = { s i , -, s j } , s i , s j — параметры состояния.

Пример:

КОГДА пользователь = зарегистрированному пользователю

И выполнен вход на распределенный сетевой ресурс

ЕСЛИ существуют непрочитанные сообщения

ТО пользователю предложено ознакомиться с сообщениями.

Тогда для интеллектуального агента требуется изменение структуры правил, а именно замена ядра на необязательное, с оценкой реализации на основе нечеткой логики и введением в структуру постусловий:

Г : PSa i ^ b i ;", где ni , – постусловие i -й продукции.

Пусть для интеллектуального агента

a

(S)=v ('^avk(S))fi fa.(S)=max (min fv(S)), где f(S) – функция принадлежности, зависящая от истинности предиката, такая, что fai (S) = 0 ^ bi - ложно, fai (S) = 1 ^ bi - истинно. Для определенности изменения со стояния агента введем fпорогi такое, что fa, ( S )> f порог, ^ bi - истинно и выполняется постусловие ni.

Пример:

ЕСЛИ существуют непрочитанные сообщения

И они не являются срочными

И НЕ(администратор занят)

ТО с f порог = 0,75: предложить показать сообщения администратору;

ПОСТУСЛОВИЕ = показать сообщения администратору.

ЕСЛИ существуют непрочитанные сообщения

И они являются срочными

И НЕ(администратор занят)

ТО c f порог = 0.1 показать сообщение администратору; ПОСТУСЛОВИЕ = показать сообщения администратору.

Такие требования позволяют проводить координацию поведения агентов с помощью модели на основе BDI- архитектур, так как акцент делается на описание таких понятий, как убеждения (belief), желания (desire) и намерения (intention). Логический вывод в базы знаний осуществляется непосредственно в процессе функционирования агентов.

Мультиагентная экспертная система, построенная на гибридной архитектуре, с использованием агентов двух видов – интеллектуальных для подмножества администраторов и реактивных для подмножеств зарегистрированных и гостевых пользователей, должна реализовывать рефлексивное управление распределенным сетевым ресурсом, сущность которого заключается в том, чтобы заставить пользователя осознанно подчиняться влиянию извне, т. е. сформировать у него такие желания и намерения, которые совпадают с требованиями окружения.

Под рефлексивным управлением будем понимать актуализацию социально значимой востребованности; построение множества уникальных управленческих по- нятий и отношений; осуществление деятельности множества, в том числе за счет привлечения к интерпретации понятий профессиональных специалистов (экспертов).

Сама экспертная система построена на основе продукционной модели с нечеткой логикой [7], где подсистема моделирования поведения агентов используется в качестве потенциального аргумента предикатов в антецеденте правил, т. е. наблюдаемое поведение агентов может быть использовано в правилах самой экспертной системы, но повлиять на поведение агентов возможно только изменениями внешней среды.

Пусть Sa – состояние агента, Sv – наблюдаемое состояние агентов, Se – состояние экспертной системы, Sr – состояние распределенного сетевого ресурса; R e = { r 1 ,..., r e . ,..., r e n } - множество правил, которыми обладает экспертная система вида re. : РеЛ % ^ be/, ne. где ae ( Se ) – условие существования заключения be , причем S e включает в себя Sv ( S = { S v 1 ,Sp v2 ,..., S v, ,..., S v n } ), S v c Sa ( S v c S e ), b i - приводит к изменениям S e , что в свою очередь может привести к изменению Sr . Поскольку Sr может приводить к изменениям поведения пользователя, что изменяет внешнюю среду, влияющую на поведение агентов, что в свою очередь наблюдается экспертной системой, то поведение пользователя в момент времени t 1 (начало работы экспертной системы) приводит к изменениям распределенного сетевого ресурса в момент времени t 2 и последующим возможным поведением пользователя в момент времени t 3 и так далее:

S r = ^ S‘; - 1 , S e n - 1 Пд t n - 1 ^ S r - - 2 ( S r n - 3 , S e n - 3,:

Пдtn-3 (S'"-4 (...(Sr2,Se2Пдt2 (Sr )))))J, где Пд – поведение.

Таким образом, разработана модель взаимодействия распределенного сетевого ресурса и пользователей, отличительной особенностью которой является использование мультиагентной экспертной системы. Методика управления агентами позволяет рационализировать данное взаимодействие путем рефлексивного управления поведением пользователей через динамические модификации представления и содержания распределенного сетевого ресурса.

Данная методика применима к задачам организации взаимодействия распределенного сетевого ресурса и пользователя на основе образовательного ресурса и на основе приборов измерения и контроля уровня радиации, что подтверждено актами внедрений.

Статья обзорная