Статистический анализ IP и VOIP трафика

Бесплатный доступ

В работе рассматривается статистический анализ реального сетевого трафика IP и VoIP протоколов. Рассчитываются плотность распределения, автокорреляционная функция, энергетический спектр и коэффициент Хэрста данных реализаций. Анализируются полученные результаты.

Короткий адрес: https://sciup.org/140191296

IDR: 140191296   |   УДК: 621.327.8

Statistical analysis of IP and VOIP traffic

In this work statistical analysis of real network traffi c of IP and VoIP protocols is considered. Density of distribution, autocorrelation function, power spectrum and the Hurst parameter of these realizations are calculated. The received dates are analyzed.

Текст научной статьи Статистический анализ IP и VOIP трафика

Анализ статистических данных трафика в различных типах сетей с пакетной коммутацией выявил некоторую общность его свойств.Сходство заключается в том,что поток информации состоит из повторяющихся, «похожих» друг на друга фрагментов. Вероятность появления той или иной случайной величины в пределах одного фрагмента (базовой структуры) описывается некоторым законом распределения вероятностей, причем этот закон подходит для описания остальных базовых структур. Такое свойство было названо самоподобием [4].

Целью работы является исследование доступными методами структуры реального сетевого и голосового трафиков,направленное на выявление его самоподобных свойств.

Массивы данных, рассматриваемые далее, были собраны на сети компании ЗАО «Самара Телеком» в процессе мониторинга двух клиентских каналов в течение 7 дней, потребляющих в первом случае только Internet трафик, а во втором случае только VoIP. Массивы состоят из значений, полученных суммированием числа всех переданных пакетов за каждые 15 минут. Рис. 1 иллюстрирует колебания собранной нагрузки сети от времени суток.

а)                                                   б)

Рис. 1. Зависимость нагрузки сети от времени суток: а) для IPтрафика; б) для VoIPтрафика

Анализ IP и VoIP реализаций

Анализ полученных данных производится в следующем порядке:

  • -    оцениваются плотности распределения изучаемых временных рядов;

  • -    оцениваются и анализируются автокорреляционные функции изучаемых временных рядов;

  • -    анализируются энергетические спектры изучаемых временных рядов;

  • -    оценка коэффициента Хэрста производится двумя методами: методом R / S статистики и методом периодограмм.

Вычисление автокорреляционных функций производилось по формуле

R ( k ) =

2 ( x - x )( x   - x )

i          i + k

1 i ---:----------------------------

N - т        a 2 ( X )

где X – выборочное среднее ряда X , о 2 ( X ) - выборочная дисперсия ряда X , k g Z + = { 0;1;2... } [2]. Графики автокорреляционных функций для исследуемых временных рядов приведены на рис. 3.

б)

Рис. 2. Гистограммы изучаемых реализаций: а) IPтрафик; б) VoIPтрафик

а)

б)

Рис. 3. Графики автокорреляционных функций: а) для IPтрафика; б) для VoIPтрафика

Произведем оценку плотностей распределения для анализируемых реализаций (см. рис. 2). Визуальный анализ гистограмм изучаемых временных рядов позволяет сделать следующие выводы:

  • -    изучаемые трассы, скорее всего, подчиняются распределению с так называемым «тяжелым хвостом»;

  • -    для IPтрафика характерно более равномерное распределение пакетов больших размеров (вероятность появленияпакетов размеромот1000 кбайт и до 2000 кбайт практически одинакова);

  • -    для VoIPтрафикахарактерноплавноеумень-шение плотности распределения при увеличении размера пакета, причем основная нагрузка приходится на пакеты малого и среднего размера.

Из рис. 3 видно, что коэффициенты автокорреляции хоть и медленно, но все же стремятся к 0. Можно с уверенностью сказать, что процессы обладают большими последствиями, однако остается открытым вопрос об их самоподобии.

Процесс X называется асимптотически самоподобным, если для достаточно больших k автокорреляционная функция

R(k,X( m )) ^ R(k,X) при m ^да , (2) где процесс X ( m ) получен усреднением исходного процесса по неперекрывающимся блокам размера m [1].

Таким образом, автокорреляционная функция асимптотически самоподобного процесса не вы- рождается при m → ∞ . У стохастического процесса, напротив, при m → ∞ автокорреляционная функция вырождается. Если же процесс строго самоподобен, то при усреднении по блокам размера m автокорреляционная функция вообще не меняет своего значения [3].

Проследим тенденцию изменения автокорреляционной функции при увеличении числа m (см. рис. 4).

а)

б)

Рис. 4. Зависимость автокорреляционной функции от m : а) IP трафик; б) VoIPтрафик

Из рис. 4 видно, что увеличение размера блока m приводит к более быстрому затуханию автокорреляционной функции, то есть необходимое условие самоподобия выполняться не будет. Однако не следует забывать о двух условиях, при которых должно выполняться (2).

Во-первых, (2) справедливо при m → ∞ . На практике это означает, что в интервал m должно попадать такое количество базовых структур, чтобы в случае попадания начала интервала m на какой-либо определенный участок базовой структуры, это не вызывало статистически значимых изменений величин усредненного процесса. Если, например, все значения из блока m i попадут на возрастающий участок базовой структуры, то значения блока m i+1 могут попасть на убывающий участок, и значения автокорреляционной функции будут обратными [3]. Такого не случится, если блок m включает в себя достаточно большое количество базовых структур, по которым усредняется значение ряда. Таким образом, лучше исключить из анализа блоки, охватывающие лишь часть базовой структуры. Для рассмотренного примера максимальное число отсчетов, входящих в блок m = 20 , что составляет 0,2 базовой структуры. Поэтому наблюдаемая тенденция не отражает действительности.

Во-вторых, условие (2) выполняется для больших лагов автокорреляции k . Автокорреляционная функция исходного процесса (см. рис. 3) медленно приближается к 0. Автокорреляционная функция процесса, усредненного по блокам m большого размера, не вырождается. То есть, несмотря на небольшое значение автокорреляционной функции усредненного процесса в самом начале, она убывает значительно медленнее и, начиная с какого-то значения лага, ее значения будут совпадать со значениями автокорреляционной функции исходного процесса [4].

Энергетические спектры

Известно, что в частотной области медленно убывающая зависимость (МУЗ) отражается на степенном законе поведения спектральной плот-

а)

б)

Рис. 5. Энергетические спектры реализаций трафика: а) IPтрафик; б) VoIPтрафик

ности рассматриваемого процесса. Можно констатировать, что процесс X обладает МУЗ, если

log< M

RW

S (n)

> ~ H log(n) + log(c) при n ^^ . (7)

f (X) ~ Xе-1 L2 (X), X > 0, 0< в < 1,     (3)

Таким образом, параметр Н можно оценить,

где L 2 – медленно изменяющаяся в нуле функция, f ( X ) = V R ( k ) e ikX - спектральная плотность.

k

Таким образом, с точки зрения спектрального анализа, процесс с МУЗ обладает плотностью с особенностью в нуле (то есть f ( X ) процесса стремится к бесконечности, по мере того как частота λ стремится к нулю) [6].

Рассчитанные энергетические спектры реализаций представлены на рис. 5, где на оси абсцисс отложена частота λ (кГц), а по оси ординат – спектр в логарифмическом масштабе.

изобразив график log < M

R (n) S (n)

> от log(n), и, ис-

пользуя полученные точки, подобрать по методу

наименьших квадратов прямую линию с наклоном Н [1]. Для нашего случая получаем для IP трафика Н = 0,7655, для VoIPтрафика Н = 0,702. Графики представлены на рис. 6.

Коэффициент Хэрста

Коэффициент Хэрста Н является показателем степени самоподобия процесса, а также свидетельствует о наличии у него долговременной зависимости. В случае 0,5 <  H < 1 говорят о наличии свойства самоподобия у процесса; при 0 <  H < 0,5 самоподобным свойством процесс не обладает [2].

Оценим показатель Хэрста Н методом нормированного размаха ( R / S ).

а)

Для заданного

X = { х n , n e Z + }    с

набора наблюдений выборочным средним

1n

X = — у X j размах определяется как n j =1

R(n) = max A, - min A,,          (4)

1≤ j n j 1≤ j n j

k где д k = V Xi i=1

- kX, W = 1, n, есть разность меж-

ду максимальным и минимальным отклонением. Для описания изменчивости более удобна нормированная безразмерная характеристика:

R (n) S (n)

max A j - min A

1 <  j n J 1 <  j n

1 V [ X j n j = 1

-

Хэрст назвал это соотношение нормированным размахом и показал, что справедливо следующее эмпирическое соотношение

M

R(n) S (n)

~ cn H

при n → ∞ ,

где с – положительная конечная константа, не зависящая от n . Прологарифмировав обе части (6), получим

б)

Рис. 6. Графики R / S -статистики: а) IPтрафик; б) VoIP трафик

Оценка, основанная на графике спектральной плотности, составляет суть метода, который обеспечивает большую статистическую строгость, чем оценка методом нормированного размаха ( R / S ). Периодограмма (или «функция интенсивности») I N ( to ) оценивает спектральную плотность дискретного стохастического процесса Хt и может быть оценена рядом на интервале времени N :

IN И =

2n N

N 2

V X k e»m k = 1

to e [0; n]

где { X k } - временной ряд; N - длина временно-

го ряда.

Учитывая, что самоподобность влияет на характер спектра S( ю ) при ю >  0 , должен получиться график зависимости спектральной плотности вида

I N ( го ) ~ [ го ] 1 2 H при ю >  0           (9)

Построив зависимость log [ l N ( го ) ] от log( ro ), подбирают касательную прямую линию к кривой. Наклон линии будет приблизительно равен 1 – 2 Н [1]. В нашем случае для IPтрафика Н = 0,802, для VoIPтрафика Н = 0,758. Графики представлены

Рис.7. Графики периодограмм: а) IPтрафик; б) VoIP трафик

Выводы

Подводя итоги выполненного анализа сетевых реализаций IPи VoIPтрафиков, можно сделать следующие выводы:

  • -    трассы исследуемых протоколов,скорее всего, подчиняются некоторому распределению с так называемым «тяжелым хвостом»;

  • -    автокорреляционные функции исследуемых рядов имеют отчетливую периодическую структуру, а также можно сказать, что процесс обладает большим последствием;

  • -    на основании результатов,полученных при из-мерениикоэффициента Хэрста Н методами R / S -статис-тики и методом периодограмм,можно отметить,что изучаемые трассы обладают свойством самоподобия.

Таким образом,исследуемые реализации можно классифицировать как сложные,похожие на случай-ные,однако предсказуемые процессы.В связи с этим увеличение эффективности обработки трафика может основываться на алгоритмах прогнозирования. Использование техники прогнозирования позволит решить ряд задач в области обеспечения заданного уровня качества обслуживания QoS,чему будут посвящены дальнейшие исследования.

Список литературы Статистический анализ IP и VOIP трафика

  • Шелухин О.И., Тенякшев А.М., Осин А.В. Фрактальные процессы в телекоммуникациях. М.: Радиотехника, 2003. 480 с.
  • Петров В.В. Самоподобие в сетевом трафике//58-я Научная сессия РНТОРЭС им. А.С. Попова, 2003. С. 126-128.
  • Криштофович А.Ю. Проблемы и способы моделирования сетей ОКС № 7//IX РНТК ПГАТИ, 2002. С. 64-65.
  • Криштофович А.Ю. Построение прогнозов сети ОКС № 7//V МНТК -Цифровая обработка сигналов и ее применение-2003. С. 75-79.
  • Петров В.В., Платов В.В. Исследование самоподобной структуры телетрафика беспроводной сети//Радиотехнические тетради. 2004. № 30. С. 58-62.
  • Осин А.В. Имитационное моделирование сетей связи в условиях самоподобного трафика//Электротехнические комплексы и информационные системы. 2005. № 1. С. 71-78.