О модификации процесса передачи данных в вычислительных сетях с помощью гибридной сети
Автор: Коваленко Татьяна Анатольевна
Журнал: Инфокоммуникационные технологии @ikt-psuti
Рубрика: Технологии компьютерных систем и сетей
Статья в выпуске: 3 т.9, 2011 года.
Бесплатный доступ
В статье исследованы вопросы передачи данных в сетях. Автор разрабатывает алгоритмы на основе нечетких множеств. Моделируется сеть для иссле- дования данного алгоритма. С помощью гибридной сети находится решение вопроса передачи данных в вычислительной сети. Наглядно демонстрируются все преимущества отслеживания сообщений с помо- щью гибридной сети.
Моделирование сети, нечеткая логика, нечеткие множества, нечеткие входные данные, выходные результаты, система типа суге- но, комбинация термов, нелинейная зависимость, синтезированная нечеткая система, гибридная сеть, нейрокомпьютерная сеть, передача данных, отсле- живание сообщений
Короткий адрес: https://sciup.org/140191492
IDR: 140191492
Текст научной статьи О модификации процесса передачи данных в вычислительных сетях с помощью гибридной сети
Интернет стал частью нашей жизни. В настоящее время процент людей, имеющих подключение к Интернету дома, составляет в больших городах до 80%. Сейчас встал вопрос о том, что в Интернет выкладывается информация, которая содержит экстремистские выпады, угрожает безопасности страны и. т.д. Проследить создание таких сайтов весьма сложно. Провайдер, отвечающий за трафик, не всегда может отследить, кто пользуется трафиком и в каких целях. Для определения этих факторов воспользуемся гибридной сетью.
Гибридная сеть – это нейрокомпьютерная сеть, в которой все расчеты делаются на основе нечетких множеств. В гибридных сетях выводы делаются с помощью нечеткой логики, а функции принадлежности подстраиваются с использованием алгоритмов обучения нейронных сетей. [1]
Гибридная сеть функционирует стандартным образом на основе четких действительных чисел, нечеткой является интерпретация результатов. При создании гибридной технологии используются настройки параметров функции принадлежности.
Традиционно функции принадлежности формируются двумя способами с помощью статистических или экспериментальных данных. При создании гибридной сети предлагается использовать метод выбора в качестве функции принадлежности параметризированную функцию формы, параметры которой настраиваются с помощью нейронных сетей. Настройка параметров может быть получена с помощью алгоритма обратного распространения ошибки [2].
Для того чтобы построить гибридную сеть, нам необходимо вначале создать нечеткую модель. Для этого используем нечеткий алгоритм, основанный на модели Сугено.
Введем несколько ключевых понятий.
Нечеткие числа – нечеткие переменные, определенные на числовой оси, то есть нечеткое число определяется как нечеткое множество А на множестве действительных чисел с функцией принадлежности //^(х)е[01], где х – действительной число [3].
В теории нечетких множеств, помимо переменных числового типа, существуют так называемые лингвистические переменные с приписываемыми им значениями. Лингвистической переменной называется переменная, значениями которой могут быть слова или словосочетания некоторого естественного или искусственного языка [4].
Терм-множеством именуют множество всех возможных значений лингвистической переменной. Термом называется любой элемент терм-множества. В теории нечетких множеств терм формируется нечетким множеством с помощью функции принадлежности [5].
Для отслеживания информации предлагается построить гибридную сеть. Следует учитывать, что современный сервер – это многопроцессорная вычислительная система, которая успешно может играть роль нейрокомпьютера. Кроме того, осуществляя ассоциативное мышление по принципу «на что это похоже», мы допускаем (конечно, в определенных пределах) неполные и неточные данные, заставляющие, по крайней мере, встревожиться и проверить то, что поступает на компьютер. В нашем случае – это наиболее продуктивно работающая система, так как мы не знаем, какая информация поступит в тот или иной момент. Использование просто нечеткой системы не дает полной картины происходящего – к тому же когда мы строим гибридную систему, то полностью автоматизируем процесс контроля получаемых сообщений.
Для этих целей создадим модель сети (см. рис. 1), где процедура отслеживания сообщений осуществляется следующим образом. Сообщения, поступившие на рабочую станцию, попадают на маршрутизатор, который работает с по- мощью нечетких множеств. Далее происходит разделение потоков: на сервер А поступают сообщения, которые в дальнейшем будут удалены, а IP адреса сохранены и при необходимости затребованы. Сообщения, поступившие на сервер В, будут просмотрены, а в дальнейшем посланы или потребителю С, или на сервер D. Также предусмотрено, что какой-то процент сообщений будет посылаться сразу потребителю или сразу же на сервер D.

Рис. 1. Архитектура сети распределения
Проанализировав модель на рис. 1, можно определить параметр, который будет играть в ней первостепенную роль. Выходным параметром будет процент сообщений, достигший потребителя.
Для лингвистической оценки входных и выходных переменных используем следующие терм множества:
-
- х1 – сообщения содержат большой процент слов, указывающих на порнографии (СP), средний процент (СРС), не содержит (НР);
-
- х2 – сообщения содержат большой процент слов, указывающих на экстремистское (extremism) содержание (ЕС), средний процент (СЕС), не содержит (НЕ);
-
- х3 – сообщения содержат большой процент слов, представляющих угрозу для безопасности страны (УС), средний процент (СУС), не содержит (НУ);
-
- у – сообщения посланы потребителю (РР); сообщения посланы соответствующим инстанциям (PD);сообщения удалены (РУ).
Для решения данной задачи создадим базу знаний, которую иллюстрирует таблица 1. Как мы видим из таблицы 1, даже минимальный перебор факторов передачи данных по сети приводит к большим расчетам. Чтобы избежать этих расчетов, применим систему типа Сугено. Предположим, если сообщение не содержит противозаконной информации – это 100% передачи информации потребителю. Исходя из этого, каждому терму присвоим процент возможности передачи информации. Чем больше сообщение имеет противозаконной информации, тем ниже терм, т.е тем меньше вероятность того, что такое сообщение дойдет до Интернета.
Таблица 1. База знаний
№ |
xl |
х2 |
хЗ |
У |
1 |
СП |
ЕС |
УС |
PD |
2 |
СП |
СЕС |
УС |
PD |
3 |
СП |
НЕ |
УС |
PD |
4 |
СП |
ЕС |
СУС |
PD |
5 |
СП |
НЕ |
НУ |
РУ |
6 |
СРС |
ЕС |
УС |
PD |
7 |
СРС |
СЕС |
УС |
PD |
8 |
СРС |
НЕ |
СУС |
РР |
9 |
СРС |
ЕС |
НУ |
PD |
10 |
СРС |
СЕС |
СУС |
РУ |
11 |
СРС |
НЕ |
НУ |
РР |
12 |
ПР |
ЕС |
УС |
PD |
13 |
ПР |
СЕС |
УС |
PD |
14 |
ПР |
СЕС |
СУС |
РР |
15 |
ПР |
НЕ |
НУ |
РР |
Предположим, что если сообщение имеет процент недозволенной тематики:
-
- большой (от 50 до 100), то терм будет составлять 10%,
-
- средний (от 30 до 50), то терм составит 20%,
-
- низкий (от 0 до 30), тогда терм составит 30%.
С выходным термом у поступим следующим образом:
-
- если выходной терм составляет от 10 до 30, то эта информация поступает на сервер В и, соответственно, передается на D,
-
- если у – от 35 до 50, то сообщение передается на А,
-
- если у – от 55 до 100, то сообщение передается потребителю.
Моделирование зависимости будем осуществлять с помощью следующей базы знаний:
Если xl = СП и х2 = ЕС и хЗ = УС, то у = 10;
Если xl = СП и х2 = СЕС и хЗ = УС, то у = 15;
Если xl = СП и х2 = НЕ и хЗ = УС, то у = 20;
Если xl = СП и х2 = ЕС и хЗ = СУС, то у = 20;
Если xl = СП и х2 = НЕ и хЗ = НУ, то у = 40;
Если xl = СРС и х2 = ЕС и хЗ = УС, то у = 15;
Если xl = СРС и х2 = СЕС и хЗ = УС, то у = 20;
Если xl = СРС и х2 = НЕ и хЗ = СУС, то у = 60;
Если xl = СРС и х2 = ЕС и хЗ = НУ, то у = 25;
Если xl = СРС и х2 = СЕС и хЗ = СУС, то у = 45;
Если xl = СРС и х2= НЕ и хЗ = НУ, то у = 80;
Если xl = HP и х2 = ЕС и хЗ = СУС, то у = 25;
Если х1=НР и х2 = ЕС и хЗ = УС, то у = 15;
Если х1=НР и х2 = СЕС и хЗ = СУС, то у = 70;
Если х1=НР и х2 = НЕ и хЗ = НУ, то у = 100.
Для работы с данной базой знаний выберем систему нечеткого логического вывода типа Суге-но. На основании нечеткого алгоритма для системы Сугено смоделируем гибридную нейронную сеть, отображающую механизм вывода данной системы (см. рис. 2).

Рис. 2. Структура гибридной нейронной сети (архитектура ANFIS)
В нечеткой нейронной сети любой слой нейронов становится специализированным. Существуют слои, выполняющие распознавание, и слои, вычисляющие логические формулы и импликации (правила ЕСЛИ … ТО).
Структура данной сети может быть описана следующим образом.
Слой 1 (inputmf) Выходы узлов этого слоя представляют собой значения функции принадлежности при конкретных значения входов (х1, х2, х3), терм множества (x1 →CP, CPC, HP; x2 →EC, CEC, HE; x3 →YC,CYC,HY)
Слой 2 (rule) Выходами нейронов этого слоя являются степени истинности предпосылок каждого правила базы знаний системы, вычисляемые по формулам:
^ = СРСхрл ЕСС^л УС^) t?2 = СР(х ) л СЕС (х) л УС (х ) «з = СРСх^л НЕ(х2 )л УС(.гз)
а = НР(х^ л НЕ^) л НУ (х ) .
Все нейроны этого слоя могут реализовывать произвольную Т-норму для моделирования операции «И». На этом этапе рассчитывается и нормированная сила правила (βi):



(х^ + б^2 + ^3 + ••♦ + ^|5
а-^ + «2 + аз + ••• + аХ5
Слой 3 (outputmf). Формирует значения выходной переменной у. Нейроны этого слоя выполняют следующие операции:
Р\У\ = pxPD "Чар
Р^У^ = P^PD ~\а2)
Р3у3 = P3PD "Ч^)
Р\5 -v15 = Л5 РР 1 (“15 )

Рис.3. Загрузка данных в сеть.
Слой 4 (output) Единственный нейрон этого слоя вычисляет выход сети:
У - РХУХ + P^l + ^3^3 + - + А 5J’l 5
После загрузки данных получаем следующую картинку (см. рис. 3).

Рис. 4. Результат тестирования необученной сети
Протестируем систему: как видно из рис.4, система работает несогласованно. Тестовые данные расходятся с данными при загрузке. Чтобы система работала согласно нашим данным, произведем обучение сети.
Как это видно из рис. 5, обучение сети произошло на первом этапе – поскольку было задано большое число правил, которые способствовали быстрому обучению сети. Можно проследить такую закономерность: чем точнее мы задаем правила работы сети, тем быстрее идет обучение и, как следствие, стабильная работа.

Рис. 5. Процесс обучения сети
После обучения сеть готова к работе. На рис. 6 виден результат обучения сети. Как ранее отмечалось, правила работы системы, которые были заложены в нечетком алгоритме, помогли быстрому обучению сети.

Рис. 6. Результат обучения гибридной сети
В ОКТИ MATLAB имеется встроенный пакет расширения fuzzy, в котором имеется компонент моделирования системы Сугено в виде поверхностей входов и выходов. На рис. 7 можно на- глядно просмотреть зависимость выходной переменной от входных параметров.
В данном случае мы применили метод перемещения по одному маршруту, из одного пункта в другой. Это позволило применить динамическое управление реализации передачи данных, а также учитывать изменение условия продвижения к заданному пункту назначения в зависимости от входных переменных. В нашем случае это был процент недопустимой информации.
Разработка гибридной системы имеет ряд преимуществ:
-
- гибридные сети являются потенциальными приложениями, где человеческий интеллект малоэффективен, а обычные вычисления трудоемки или неадекватны;
-
- разработка такой системы недорога, она не требует специальных знаний от пользователя;
-
- сеть допускает обучение и развитие;

Рис. 7. Поверхность «входы» и «выходы» для системы Сугенопослеобучениясети, определяющие передачу данных в зависимости от входных параметров
-
- можно преобразовывать и включать новые данные;
-
- применение гибридных систем позволяет создавать доступные широкому пользователю компьютерные системы мониторинга, принятие решений в области связи;
-
- практически полная автоматизация процесса создания нечеткой системы, возможность просмотра сформированных правил и придания им содержательной интерпретации, что позволяет рассматривать аппарат гибридных сетей как средство извлечения знаний из базы данных.
Проведенные исследования позволяют сформулировать основные идеи управления гибрид- ной сетью – это разработка нечеткого алгоритма для управления такой сетью, составление соответствующих правил и схем, получение структуры сети, переход от булевых переменных к действительным значениям.
Список литературы О модификации процесса передачи данных в вычислительных сетях с помощью гибридной сети
- Дьяконов В.П., Круглов В.В. MATLAB 6.5 SP 1/7/7 SP1/7 SP2 Simulink 5/6. Инструменты искусственного интеллекта и биоинформатики. М.: СОЛОН-ПРЕСС, 2006. -563 с.
- Ярушкина Н.Г. Основы теории нечетких и гибридных систем. М.: Финансы и статистика, 2004. -301 с.
- http://matlab.exponenta.ru/fuzzylogic/book1/1. php#1
- http://www.orc.ru/~stasson/neurox.html#articles
- http://mechanoid.narod.ru/nns/base