Статистический анализ IP и VOIP трафика
Автор: Фомин В.В.
Журнал: Инфокоммуникационные технологии @ikt-psuti
Рубрика: Технологии компьютерных систем и сетей
Статья в выпуске: 1 т.7, 2009 года.
Бесплатный доступ
В работе рассматривается статистический анализ реального сетевого трафика IP и VoIP протоколов. Рассчитываются плотность распределения, автокорреляционная функция, энергетический спектр и коэффициент Хэрста данных реализаций. Анализируются полученные результаты.
Короткий адрес: https://sciup.org/140191296
IDR: 140191296
Текст научной статьи Статистический анализ IP и VOIP трафика
Анализ статистических данных трафика в различных типах сетей с пакетной коммутацией выявил некоторую общность его свойств.Сходство заключается в том,что поток информации состоит из повторяющихся, «похожих» друг на друга фрагментов. Вероятность появления той или иной случайной величины в пределах одного фрагмента (базовой структуры) описывается некоторым законом распределения вероятностей, причем этот закон подходит для описания остальных базовых структур. Такое свойство было названо самоподобием [4].
Целью работы является исследование доступными методами структуры реального сетевого и голосового трафиков,направленное на выявление его самоподобных свойств.
Массивы данных, рассматриваемые далее, были собраны на сети компании ЗАО «Самара Телеком» в процессе мониторинга двух клиентских каналов в течение 7 дней, потребляющих в первом случае только Internet трафик, а во втором случае только VoIP. Массивы состоят из значений, полученных суммированием числа всех переданных пакетов за каждые 15 минут. Рис. 1 иллюстрирует колебания собранной нагрузки сети от времени суток.
а) б)
Рис. 1. Зависимость нагрузки сети от времени суток: а) для IPтрафика; б) для VoIPтрафика
Анализ IP и VoIP реализаций
Анализ полученных данных производится в следующем порядке:
-
- оцениваются плотности распределения изучаемых временных рядов;
-
- оцениваются и анализируются автокорреляционные функции изучаемых временных рядов;
-
- анализируются энергетические спектры изучаемых временных рядов;
-
- оценка коэффициента Хэрста производится двумя методами: методом R / S статистики и методом периодограмм.
Вычисление автокорреляционных функций производилось по формуле
R ( k ) =
2 ( x - x )( x - x )
i i + k
1 i ---:----------------------------
N - т a 2 ( X )
где X – выборочное среднее ряда X , о 2 ( X ) - выборочная дисперсия ряда X , k g Z + = { 0;1;2... } [2]. Графики автокорреляционных функций для исследуемых временных рядов приведены на рис. 3.

б)
Рис. 2. Гистограммы изучаемых реализаций: а) IPтрафик; б) VoIPтрафик

а)

б)
Рис. 3. Графики автокорреляционных функций: а) для IPтрафика; б) для VoIPтрафика
Произведем оценку плотностей распределения для анализируемых реализаций (см. рис. 2). Визуальный анализ гистограмм изучаемых временных рядов позволяет сделать следующие выводы:
-
- изучаемые трассы, скорее всего, подчиняются распределению с так называемым «тяжелым хвостом»;
-
- для IPтрафика характерно более равномерное распределение пакетов больших размеров (вероятность появленияпакетов размеромот1000 кбайт и до 2000 кбайт практически одинакова);
-
- для VoIPтрафикахарактерноплавноеумень-шение плотности распределения при увеличении размера пакета, причем основная нагрузка приходится на пакеты малого и среднего размера.
Из рис. 3 видно, что коэффициенты автокорреляции хоть и медленно, но все же стремятся к 0. Можно с уверенностью сказать, что процессы обладают большими последствиями, однако остается открытым вопрос об их самоподобии.
Процесс X называется асимптотически самоподобным, если для достаточно больших k автокорреляционная функция
R(k,X( m )) ^ R(k,X) при m ^да , (2) где процесс X ( m ) получен усреднением исходного процесса по неперекрывающимся блокам размера m [1].
Таким образом, автокорреляционная функция асимптотически самоподобного процесса не вы- рождается при m → ∞ . У стохастического процесса, напротив, при m → ∞ автокорреляционная функция вырождается. Если же процесс строго самоподобен, то при усреднении по блокам размера m автокорреляционная функция вообще не меняет своего значения [3].
Проследим тенденцию изменения автокорреляционной функции при увеличении числа m (см. рис. 4).

а)

б)
Рис. 4. Зависимость автокорреляционной функции от m : а) IP трафик; б) VoIPтрафик
Из рис. 4 видно, что увеличение размера блока m приводит к более быстрому затуханию автокорреляционной функции, то есть необходимое условие самоподобия выполняться не будет. Однако не следует забывать о двух условиях, при которых должно выполняться (2).
Во-первых, (2) справедливо при m → ∞ . На практике это означает, что в интервал m должно попадать такое количество базовых структур, чтобы в случае попадания начала интервала m на какой-либо определенный участок базовой структуры, это не вызывало статистически значимых изменений величин усредненного процесса. Если, например, все значения из блока m i попадут на возрастающий участок базовой структуры, то значения блока m i+1 могут попасть на убывающий участок, и значения автокорреляционной функции будут обратными [3]. Такого не случится, если блок m включает в себя достаточно большое количество базовых структур, по которым усредняется значение ряда. Таким образом, лучше исключить из анализа блоки, охватывающие лишь часть базовой структуры. Для рассмотренного примера максимальное число отсчетов, входящих в блок m = 20 , что составляет 0,2 базовой структуры. Поэтому наблюдаемая тенденция не отражает действительности.
Во-вторых, условие (2) выполняется для больших лагов автокорреляции k . Автокорреляционная функция исходного процесса (см. рис. 3) медленно приближается к 0. Автокорреляционная функция процесса, усредненного по блокам m большого размера, не вырождается. То есть, несмотря на небольшое значение автокорреляционной функции усредненного процесса в самом начале, она убывает значительно медленнее и, начиная с какого-то значения лага, ее значения будут совпадать со значениями автокорреляционной функции исходного процесса [4].
Энергетические спектры
Известно, что в частотной области медленно убывающая зависимость (МУЗ) отражается на степенном законе поведения спектральной плот-

а)
б)
Рис. 5. Энергетические спектры реализаций трафика: а) IPтрафик; б) VoIPтрафик
ности рассматриваемого процесса. Можно констатировать, что процесс X обладает МУЗ, если
log< M
RW
S (n)
> ~ H log(n) + log(c) при n ^^ . (7)
f (X) ~ Xе-1 L2 (X), X > 0, 0< в < 1, (3)
Таким образом, параметр Н можно оценить,
где L 2 – медленно изменяющаяся в нуле функция, f ( X ) = V R ( k ) e ikX - спектральная плотность.
k
Таким образом, с точки зрения спектрального анализа, процесс с МУЗ обладает плотностью с особенностью в нуле (то есть f ( X ) процесса стремится к бесконечности, по мере того как частота λ стремится к нулю) [6].
Рассчитанные энергетические спектры реализаций представлены на рис. 5, где на оси абсцисс отложена частота λ (кГц), а по оси ординат – спектр в логарифмическом масштабе.
изобразив график log < M
R (n) S (n)
> от log(n), и, ис-
пользуя полученные точки, подобрать по методу
наименьших квадратов прямую линию с наклоном Н [1]. Для нашего случая получаем для IP трафика Н = 0,7655, для VoIPтрафика Н = 0,702. Графики представлены на рис. 6.
Коэффициент Хэрста
Коэффициент Хэрста Н является показателем степени самоподобия процесса, а также свидетельствует о наличии у него долговременной зависимости. В случае 0,5 < H < 1 говорят о наличии свойства самоподобия у процесса; при 0 < H < 0,5 самоподобным свойством процесс не обладает [2].
Оценим показатель Хэрста Н методом нормированного размаха ( R / S ).

а)
Для заданного
X = { х n , n e Z + } с
набора наблюдений выборочным средним
1n
X = — у X j размах определяется как n j =1
R(n) = max A, - min A,, (4)
1≤ j ≤ n j 1≤ j ≤ n j
k где д k = V Xi i=1
- kX, W = 1, n, есть разность меж-
ду максимальным и минимальным отклонением. Для описания изменчивости более удобна нормированная безразмерная характеристика:
R (n) S (n)
max A j - min A
1 < j < n J 1 < j < n
1 V [ X j n j = 1
-
Хэрст назвал это соотношение нормированным размахом и показал, что справедливо следующее эмпирическое соотношение
M
R(n) S (n)
~ cn H
при n → ∞ ,
где с – положительная конечная константа, не зависящая от n . Прологарифмировав обе части (6), получим

б)
Рис. 6. Графики R / S -статистики: а) IPтрафик; б) VoIP трафик
Оценка, основанная на графике спектральной плотности, составляет суть метода, который обеспечивает большую статистическую строгость, чем оценка методом нормированного размаха ( R / S ). Периодограмма (или «функция интенсивности») I N ( to ) оценивает спектральную плотность дискретного стохастического процесса Хt и может быть оценена рядом на интервале времени N :
IN И =
2n N
N 2
V X k e»m k = 1
to e [0; n]
где { X k } - временной ряд; N - длина временно-
го ряда.
Учитывая, что самоподобность влияет на характер спектра S( ю ) при ю > 0 , должен получиться график зависимости спектральной плотности вида
I N ( го ) ~ [ го ] 1 2 H при ю > 0 (9)
Построив зависимость log [ l N ( го ) ] от log( ro ), подбирают касательную прямую линию к кривой. Наклон линии будет приблизительно равен 1 – 2 Н [1]. В нашем случае для IPтрафика Н = 0,802, для VoIPтрафика Н = 0,758. Графики представлены

Рис.7. Графики периодограмм: а) IPтрафик; б) VoIP трафик
Выводы
Подводя итоги выполненного анализа сетевых реализаций IPи VoIPтрафиков, можно сделать следующие выводы:
-
- трассы исследуемых протоколов,скорее всего, подчиняются некоторому распределению с так называемым «тяжелым хвостом»;
-
- автокорреляционные функции исследуемых рядов имеют отчетливую периодическую структуру, а также можно сказать, что процесс обладает большим последствием;
-
- на основании результатов,полученных при из-мерениикоэффициента Хэрста Н методами R / S -статис-тики и методом периодограмм,можно отметить,что изучаемые трассы обладают свойством самоподобия.
Таким образом,исследуемые реализации можно классифицировать как сложные,похожие на случай-ные,однако предсказуемые процессы.В связи с этим увеличение эффективности обработки трафика может основываться на алгоритмах прогнозирования. Использование техники прогнозирования позволит решить ряд задач в области обеспечения заданного уровня качества обслуживания QoS,чему будут посвящены дальнейшие исследования.
Список литературы Статистический анализ IP и VOIP трафика
- Шелухин О.И., Тенякшев А.М., Осин А.В. Фрактальные процессы в телекоммуникациях. М.: Радиотехника, 2003. 480 с.
- Петров В.В. Самоподобие в сетевом трафике//58-я Научная сессия РНТОРЭС им. А.С. Попова, 2003. С. 126-128.
- Криштофович А.Ю. Проблемы и способы моделирования сетей ОКС № 7//IX РНТК ПГАТИ, 2002. С. 64-65.
- Криштофович А.Ю. Построение прогнозов сети ОКС № 7//V МНТК -Цифровая обработка сигналов и ее применение-2003. С. 75-79.
- Петров В.В., Платов В.В. Исследование самоподобной структуры телетрафика беспроводной сети//Радиотехнические тетради. 2004. № 30. С. 58-62.
- Осин А.В. Имитационное моделирование сетей связи в условиях самоподобного трафика//Электротехнические комплексы и информационные системы. 2005. № 1. С. 71-78.