Модель трафика современных глобальных сетей для системы имитационного моделирования
Автор: Привалов Александр Юрьевич, Царв Александр Александрович
Журнал: Инфокоммуникационные технологии @ikt-psuti
Рубрика: Технологии компьютерных систем и сетей
Статья в выпуске: 1 т.13, 2015 года.
Бесплатный доступ
В статье представлен программный пакет с реализацией полезной модификации для хорошо известной модели самоподобного трафика на базе системы моделирования OMNeT.
Анализ телекоммуникационного трафика, моделирование телекоммуникационного трафика, самодобные модели трафика
Короткий адрес: https://sciup.org/140191739
IDR: 140191739
Текст научной статьи Модель трафика современных глобальных сетей для системы имитационного моделирования
В течение последних двух десятилетий начиная от известных статей, таких как [1], анализ и моделирование самоподобного трафика очень актуальная тема для теоретических и прикладных исследований. Представленные коллекции теоретических и практических достижений в этой области за последние двадцать лет можно найти в [2]. В настоящее время влияние самоподобного трафика на различные аспекты телекоммуникаций остается важной темой для исследований [3-6].
Важными проблемами в данной области являются разработка относительно простых в анализе моделей трафика и оценка их способности генерировать трафик, близкий к реальному. Первой целью данной статьи является представление собственной модификации известной модели самоподобного трафика «M/G/∞ Input», реализованной в системе моделирования OMNeT.
Модифицированная модель способна воспроизводить несколько характеристик реального трафика WAN сетей одновременно, включая параметр Херста, одномерное распределение вероятностей величин (ОРВВ) и нормированную автокорреляционную функцию (НАКФ) трафика. Потому вторая цель статьи – сделать параметры модифицированной модели «M/G/∞ Input» более интерпретируемыми с практической точки зрения.
Отличие данной работы от хорошо известной статьи [7] в том, что там информационная скорость (ИС) индивидуальных источников (ИИ) предполагалась одинаковой и равной единице. Поэтому ОРВВ трафика, сгенерированного моделью «M/G/∞ Input» (такую модель в данной работе назовем базовой), было пуассоновским, а для последующего приведения к требуемому распределению использовалась преобразовывающая функция. По нашему мнению, недостаток данного подхода в том, что он сталкивается с трудностями трактовки преобразовывающей функции с практической точки зрения. В статье используется другой подход: мы предполагаем, что каждый ИИ может иметь свою собственную ИС, а суперпозиция таких неоднородных ИИ создает соответствующее ОРВВ результирующего трафика. Основные результаты данной работы были представлены на конференции [8].
Статья структурирована следующим образом: во втором разделе произведен обзор базовой модели «M/G/∞ Input» и представлена модификация, которая реализована в программном пакете; в третьем разделе описан программный пакет и предоставлены результаты моделирования трафика, в четвертом разделе подведены итоги и сделаны выводы.
Модель «M/G/∞ Input»
Для простоты будем рассматривать процесс с дискретным временем. Пусть ось времени делится на одинаковые временные интервалы, и размер каждого такого окна будет единицей времени. Также пусть количество информации измеряется в ячейках, а размер одной ячейки в байтах. Таким образом, трафик и ИС источника измеряются в ячейках в одно временное окно. В модели «M/G/∞ Input» число новых ИИ, появляющихся в системе в каждом временном окне, является случайным. Все числа новых ИИ, во всех временных окнах, являются независимыми одинаково распределенными случайными величинами (НОРСВ) с пуассоновским законом распределения с параметром λ.
Известно, что самоподобие моделируемого трафика определяется распределением вероятностей времени жизни ИИ – оно должно быть с тяжелым хвостом. Если время жизни для всех ИИ являются НОРСВ с обозначенной общей случайной величиной T и ее распределение вероятностей удовлетворяет тогда параметр Херста смоделированного трафика по «M/G/∞ Input» равен H. Чтобы сделать АКФ моделируемого трафика похожей на АКФ реального трафика, мы будем использовать следующую функцию распределения вероятностей времени жизни:
рг{У = А-} =
' C(k + xYv™,
к = 1;
£ = 2;3..., ’ где x и y параметры для минимизации отклонения, C – нормирующая константа. Как показано в [9-10], в случае такой параметризации нормированная АКФ моделируемого трафика имеет вид:
(i-y)£5>+<™
^ =---------------------• (3)
£ bi + хУ^ + (1 - y)^ £ у + хУин'
/7=2 /=1 /7 = /‘+1
Имея несколько значений r k , k = 1; 2 … K , АКФ реального трафика, мы можем сделать АКФ (3) более близкой к реальной, производя минимизацию по x и y среднего квадратичного отклонения
О(х,у) = ^(г(к)-гкУ. (4)
k=l
В каждом временном окне в течение всей жизни каждый индивидуальный источник генерирует трафик (некоторое количество ячеек). Сумма потоков от всех активных источников и есть результирующий трафик модели. В базовой модели «M/G/∞ Input» считалось, что все источники имеют одинаковую скорость генерации трафика (информационную скорость). В стационарном состоянии системы величина результирующего трафика Y t в случайный момент времени t строго пропорциональна числу активных источников N t в системе в тот же момент и имеет пуассоновское распределение с параметром
L = XEyy (5)
(E – оператор математического ожидания). Поэтому обозначим pk = Pr{^ = k\ = exp(-Z)ZA !k\; k= 0;l... (6)
Предложенная модификация базовой модели – это предположение, что ИС являются НОРСВ с общим обозначением случайной величиной S . Если в какой-то момент t в системе имеется N t активных источников, то обозначим их скорости как S , k = 1; 2 … N . kt
Как показано в [9-10], зная распределения вероятностей {Pr{ Y = k }} k = 0; 1; 2 … величин трафика Y , мы можем найти распределение вероятностей случайной величины S , которое обеспечивает данное распределение трафика Y . Опишем эту процедуру с некоторыми пояснениями. Для начала допустим, что
Pr{5 = 0} = 0 . (7)
Это «условие отсутствия фиктивных источников» обеспечивает ситуацию, что Yt = 0 тогда и только тогда, когда Nt = 0, поэтому
Рг{У = 0} = A = e"L и (8)
L = -Pr{7 = 0}. (9)
Скорость индивидуального источника S (число ячеек в окно) целочисленная случайная величина, поэтому Y t = 1 тогда и только тогда, когда N t = 1 и S 1 = 1, поэтому
Рг{У = 1}=р, Pr{S = l}, (10)
откуда мы получаем P r { S = 1}. Затем Y t = 2 тогда и только тогда, когда N t = 1 и S 1 = 2 или N t = 2 и S 1 + S 2 = 2 (что значит S 1 = S 2 = 1), получаем
Pr{У = 2} =Л Pr{S = 2} + p, Pr{S, + S, = 2}; (11)
и, зная Pr{ S = 1}, получаем
Pr {^ = 2} = Pr ^ = 2Ь Л (pr {^ = U )2 (12)
P\
В общем случае имеем
W=kV^Lp„^^S=k^
Yr{S^k}^ m=2 "=1 , (13)
где
может быть найдена как
m-кратная свертка моментов конечной последовательности {Pr!$ = /)},.„где все эти вероятности известны из предыдущих итераций.
На практике расчет этих сверток является наибо- лее трудоемкой частью итерационной процедуры (7) и имеет экспоненциальную сложность, когда растет k. Из (5) мы можем найти
L = X/E(t\ (14)
В итоге в нашей модели получились интерпретируемые параметры: интенсивность появления новых ИИ ^ распределение вероятностей времени жизни ИИ и распределение вероятностей ИС ИИ.
НАКФ реального и смоделированного трафиков. Для сравнения также приведены ОРВВ и НАКФ трафика, смоделированного по базовой модели «M/G/∞ Input» (все ИС для ИИ равны единице).
Моделирование трафика WAN сети
Представленный программный пакет на базе OMNeT++ доступен по ссылке [12] и называется SelfSimMGI. Его первое назначение – анализ трафика, так как есть возможность сбора статистики о трафике для последующего расчета статистических характеристик и параметра Херста.

Рис. 1. Распределение вероятностей скорости источника для трассы 1
Определенный модуль читает трафик из файла с трассой, генерирует OMNeT пакеты согласно записям в файле и посылает их в исходящий порт. Другой модуль является сборщиком статистики, он собирает необходимую статистику, анализируя проходящие сквозь него OMNeT пакеты, вычисляет ОРВВ трафика, НАКФ и параметр Херста. Результаты записываются в XML файл.
Вторая цель – моделирование трафика. В пакете имеется модуль-вычислитель параметров, который читает статистику из вышеупомянутого файла, вычисляет параметры «M/G/∞ Input» модели и записывает их в другой XML файл. Генератор трафика читает эти параметры из файла в начале каждого запуска моделирования и генерирует трафик как поток OMNeT пакетов в соответствии с моделью «M/G/∞ Input». Статистические данные смоделированного трафика также собираются вышеупомянутым сборщиком статистики.

Рис. 2. Распределение вероятностей трафика для трассы 1
В данной работе приведены результаты экспериментов на основе трех трасс из коллекции CAIDA [11]. Трассы 1 и 2 – одноминутные, записанные монитором equinix-chicago в двух противоположных направлениях: A и B. Они записаны 19. 12. 2013 г. в 13:00. Трасса 3 той же длительности, но записана монитором equinix-sanjose 20. 11. 2008 г. в 13:00. Обработка этих трасс была сделана с использованием временного окна равного 15 мкс и размером ячейки равным 100 байтам. Размер ячейки определяется из требуемой точности представленного трафика, а размер временного окна – из соображений вычисления параметров модели за умеренное время. Наиболее трудоемкая операция — это вычисление сверток в (13).

Рис. 3. Нормированная АКФ для трассы 1
Результаты о способности модельного трафика аппроксимировать реальный трафик представлены в графическом виде – некоторые количественные данные о способности аппроксимации модели см. в [10]. Для всех трасс представлено распределение вероятностей ИС ИИ и интенсивность появления новых ИИ X, а также ОРВВ и
Интересно, что все распределения вероятностей ИС являются мультимодальными, и это обеспечивает очень хорошую аппроксимацию ОРВВ реального трафика, которое также мультимодальное. На рис. 5 отмечен интересный артефакт в ОРВВ реальной трассы вблизи значения 150-200 (ячеек на слот).
Принимая во внимание, что вблизи отметки 200 ячеек в окно на оси x (см. рис. 5) величина реального трафика составляет около 10 Гбит/с, то очевидно, что линия связи в этот момент была загружена почти на 100%, и система управления потоком начала ограничивать трафик (см. [6] для описания сетевого оборудования). Наша модель пока не обрабатывает такую ситуацию.

Рис. 4. Распределение вероятностей скорости источника для трассы 2

Рис. 7. Распределение вероятностей скорости источника для трассы 3

Рис. 5. Распределение вероятностей трафика для трассы 2

Рис. 8. Распределение вероятностей трафика для трассы 3

Рис. 6. Нормированная АКФ для трассы 2

Рис. 9. Нормированная АКФ для трассы 3
Как мы видим, мультимодальное поведение распределения вероятностей трафика часто происходит в трафике WAN сетей в течение последних двух десятилетий, однако интенсивность трафика выросла значительно за этот период времени. Значения параметров Херста для всех трасс представлены в таблице 1: видно, что самоподоб-ность и корреляция достаточно хорошо воспроизводятся предложенной моделью «M/G/∞ Input».
Таблица 1. Значения параметра Херста
Трасса |
Параметр Херста |
||
Реальная трасса |
Модификация M/G/cc |
Базовая M/GM |
|
Трасса 1 |
0,66 |
0,75 |
0,74 |
Трасса 2 |
0,71 |
0,73 |
0,70 |
Трасса 3 |
0,70 |
0,71 |
0,72 |
Заключение
Представлены совокупность экспериментальных результатов, полученных с помощью программного пакета SelfSimMGI на базе OMNeT, для анализа трафика WAN сетей и моделирования. В модели получились хорошо интерпретируемые параметры. Обработка реальных трасс этой программой показывает интересный феномен мультимодального «пилообразного» вида у распределения вероятностей современного трафика WAN сетей. Причина такого поведения требует более глубокого исследования и понимания.
Список литературы Модель трафика современных глобальных сетей для системы имитационного моделирования
- Leland W., Taqqu M., Willinger W., Wilson D. On the self-similar nature of Ethernet traffic (extended version)//IEEE/ACM Trans. on Networking. Vol. 2, No.1, February 1994. -P. 1-15.
- Park K., Willinger W., Wiley Ed. Self-similar Network Traffic and Performance Evaluation//John Wiley & Sons Inc. New-York, 2000. -556 p.
- Xiaolong Jin, Geyong Min. A heuristic flow-decomposition approach for generalized processor sharing under self-similar traffic//J. Comput. Syst. Sci. Vol. 74, No. 6, September 2008. -P. 1055-1066.
- Perez C.S., Dominguez L.R., Pacheco Ju-C. R. A simulation scenario for performance studies under self-similar traffic//In Proc. of the 8-th WSEAS Intern. Conf. on Data Networks, Communications, Computers (DNCOCO'09). USA, Wisconsin, Stevens Point, 2009. -P. 185-189.
- Galkin A.M., Simonina O.A., Yanovsky G.G. Multiservice IP Network QoS Parameters Estimation in Presence of Self-similar Traffic//In Proc. of the 6th International Conf. on Next Generation Teletraffic and Wired/Wireless Advanced Networking (NEW2AN'06). Berlin, Heidelberg Springer-Verlag, 2006. -P. 235-245.
- Horn G., Kvalbein A., Blomskold J., Nilsen E. An empirical comparison of generators for self similar simulated traffic//Perform. Eval. Vol. 64, No. 2, February 2007. -P. 162-190.
- Krunz M.M., Makowski A.M. Modeling video traffic using M/G/∞ input processes: a compromise between Markovian and LRD models//IEEE J.Sel. A. Commun. Vol. 16, No. 5, September 2006. -P. 733-748.
- Privalov A., Tsarev A. Analysis and simulation of WAN traffic by self-similar traffic model with OMNeT//In Proc. of the 10th Intern. Wireless Communications and Mobile Computing Conference (IWCMC'14). Cyprus, Nicosia, August 4-8, 2014. -P. 629-634.
- Privalov A., Blagov A. Some Models Parameters Calculation for Simulation of Network Traffic Marginal Distribution and Self-similarity//23rd European Conference of Modeling and Simulation (ECMS). Madrid, 2009. -P.51-60.
- Privalov A., Blagov A. Approximative models of data network self-similar traffic//Germany, Lambert Academic Publishing (LAP), 2013. -120 p.
- The Cooperative Association for Internet Data Analysis (CAIDA). URL: http://www.caida.org
- Model catalog on OMNET++-community cite URL: http://omnetpp.org/index.php/models/catalog