Оценка точности методов краткосрочного прогнозирования нагрузки компьютерной сети
Автор: Гомазкова Людмила Константиновна, Серженко Иван Дмитриевич, Трофимов Александр Игоревич
Журнал: НБИ технологии @nbi-technologies
Рубрика: Инновации в информатике, вычислительной технике и управлении
Статья в выпуске: 2 т.16, 2022 года.
Бесплатный доступ
В статье представлен обзор и краткое описание некоторых методов краткосрочного прогнозирования. Также проведена оценка точности полученных с помощью рассмотренных методов прогнозов количества пакетов в компьютерной сети.
Сетевой трафик, нагрузка сети, краткосрочное прогнозирование, экспоненциальное сглаживание, сглаживание по спенсеру
Короткий адрес: https://sciup.org/149139765
IDR: 149139765
Текст научной статьи Оценка точности методов краткосрочного прогнозирования нагрузки компьютерной сети
DOI:
В настоящее время наблюдается рост числа устройств с возможностью подключения к компьютерным сетям. В связи с этим также растет количество пользователей. Поэтому все более важным становится анализ сетевого трафика, а также его прогнозирование, так как благодаря результатам анализа и прогнозирования сетевого потока можно распределить нагрузку на сетевую инфраструктуру с целью более эффективного использования предоставляемых ею ресурсов и более рациональной передачи больших объемов дан-
ных по сети. Также результаты, полученные в процессе прогнозирования и анализа сетевого трафика, позволяют более рационально планировать нагрузку на сетевую инфраструктуру в целом, разрабатывать и устанавливать стратегии развития компьютерных сетей, а также реализовывать системы адаптивного управления трафиком.
Краткосрочное прогнозирование можно соотнести с одним из существующих подходов к управлению сетевым трафиком, который основан на использовании оперативных методов (online-методов [2]) управления сетью. Так, в ситуациях, где должна быть предусмотрена адаптация планов маршрутизации к изменяющимся условиям сети, методов краткосрочного прогнозирования будет вполне достаточно для получения необходимых результатов.
Краткосрочным прогнозом считается прогноз, для которого период упреждения (то есть временной интервал, для которого разрабатывается прогноз) составляет от нескольких секунд до десятков минут [3]. При этом для периода основания прогноза, то есть промежутка времени, на основе информации о котором строится прогноз, подобных ограничений нет.
В настоящее время характер пользовательской нагрузки на компьютерные сети является непредсказуемым, при этом степень непредсказуемости имеет тенденцию к возрастанию. Также существуют условия постоянного изменения архитектуры компьютерных сетей из-за увеличения числа беспроводных сетей по сравнению с кабельной инфраструктурой. Поэтому наиболее подходящими и перспективными методами для прогнозирования поведения сетевого трафика видится категория именно online-методов, так как данная группа позволяет с высокой скоростью реагировать на происходящие изменения в архитектуре сети и на рост или спад пользовательской нагрузки на компьютерную сеть.
Все множество online-методов, или методов краткосрочного прогнозирования, которые можно отнести к категории научно-исследовательских методов, можно разделить на две крупных подкатегории. Первой из них является подкатегория методов искусственного интеллекта. Применение таких методов имеет большие преимущества, но в то же время эти методы отличаются высокой сложностью ре- ализации. Вторая подкатегория включает в себя статистические методы. В отличие от методов искусственного интеллекта, статистические методы более просты и обладают преимуществом достаточно точного предсказания суточного графика нагрузки сети при условии анализа сети в обычный будний день. Таким образом, основным недостатком статистических методов является невозможность их применения для анализа нагрузки сети в праздничные или другие выходные дни в связи с отсутствием гибкости их структуры.
Метод экспоненциального сглаживания относится к группе статистических методов краткосрочного прогнозирования. При использовании данного метода прогнозируемое значение складывается из двух составляющих, первой из которых является взвешенные средние величины текущего периода, а второй – сглаженные значения предшествующего периода.
В случае математической записи метод экспоненциального сглаживания представляет собой простую экспоненциальную модель для временных рядов с устойчивым трендом и малыми (независимыми) периодическими колебаниями. Однако для многих временных рядов наблюдается очевидная картина периодичности и случайности, поэтому простая экспоненциальная модель может расширяться включением в нее двух последних компонент [1].
Таким образом, существует три модели метода экспоненциального сглаживания [3]:
-
1. Простое экспоненциальное сглаживание (модель N-N).
-
2. Экспоненциальное сглаживание с аддитивным трендом (модель A-N).
-
3. Экспоненциальное сглаживание с затухающим аддитивным трендом (модель DA-N).
Соответствующие выражения приведены в таблице 1.
Таблица 1
Модели экспоненциального сглаживания
Модель N-N |
Модель А-N |
Модель DA-N |
St = aXt + (1 — a)5t-1 ^(m) = St |
St = aXt + (1 — a)(5t-1 + Гс-1) Tt = y(5t-5t_1) + (l-Z)7't_1 ^(m) - 5t + ml. |
St = aXt + (1 — a) (5t-1 + <рГс-1) Tt = r(st - 5t-i) + U - г)<Р^-1
X^(m) = St + ^ t Ё=1 |
Широко известным методом выделения полиномиального тренда временного ряда является использование сглаживающих формул Спенсера [4].
Для задачи краткосрочного прогнозирования удобно использовать процедуры сглаживания с помощью кубического полинома по 5 и 7 точкам (элементам), относящиеся к классу взвешенного скользящего среднего. Оригинальные формулы Спенсера служат для выделения тренда в центральном элементе последовательности, то есть для третьего элемента (точки) при использовании формулы для пяти точек и для четвертого – для семи точек (элементов).
Формулы (1) и (2) представляют собой формулы Спенсера для пяти и семи элементов соответственно [2]:
xk 35 ( 28 x k — 5 + 77 x k — 4 28 x k — 3
— 98 xk — 2 + 112 xk — 1 ) ,
x k = — (— 12 x k — 7 + 1 8 x k — 6 + 12 x k — 5 — 9 x k — 4 —
21 , (2)
—
24 xk — 3 — 12 xk — 2 + 48 xk — 1 )
В качестве исходных данных использовался временной ряд (массив данных), элементы которого представляли собой количество пакетов в сети в секунду времени. Временной ряд был получен в результате обработки дампа сетевого трафика, собранного с помощью программы-анализатора компьютерных сетей «Wireshark» (рис. 1) [5].
Затем при помощи описанных выше методов краткосрочного прогнозирования на основе данного массива были получены еще три массива данных, содержащие уже сглаженные, или предсказанные, значения.
На основе полученных данных были построены следующие графики, где по оси ординат отображалось количество пакетов в секунду, а по оси абсцисс – секунды (рис. 2–4).
Также для более наглядного восприятия был построен сводный график полученных в ходе исследования данных (рис. 5).
На основании полученных графиков можно сделать предположение, что наиболее точным методом краткосрочного прогнозирования среди рассмотренных является метод простого экспоненциального сглаживания.
Для проверки была найдена средняя ошибка прогнозирования путем суммирования ошибки предсказания для каждого элемента исходного массива и последующего разделения на общее количество элементов.
где xk – прогнозируемый элемент временного ряда; xk -1 , xk -2 , xk -3 , xk -4 , xk -5 , xk -6 , xk -7 – элементы временного ряда, предшествующие прогнозируемому.

Рис. 1. Собранный дамп трафика

Рис. 2. Графики исходных данных и данных, полученных с помощью формулы Спенсера для 5 элементов

Рис. 3. Графики исходных данных и данных, полученных с помощью формулы Спенсера для 7 элементов

Рис. 4. Графики исходных данных и данных, полученных с помощью метода простого экспоненциального сглаживания
Полученные значения приведены в таблице 2.
Как видно из таблицы, сделанное предположение оказалось верным: наиболее высокая точность прогнозирования наблюдается у временного ряда, полученного с помощью метода простого экспоненциального сглаживания, средняя ошибка прогноза при использовании которого составляет всего 5,5 пакетов/с. При этом менее точным является метод сглаживания с помощью формулы Спенсера для 7 точек (154 пакета/с) и наименее точным – метод сглаживания с помощью формулы Спенсера для 5 точек (203,4 пакета/с).
Таким образом, среди рассмотренных методов краткосрочного прогнозирования была проведена оценка точности полученных с их помощью прогнозов, на основе полученных значений средней ошибки предсказания был выявлен наиболее точный метод краткосрочного прогнозирования сетевого трафика – метод простого экспоненциального сглаживания.
Список литературы Оценка точности методов краткосрочного прогнозирования нагрузки компьютерной сети
- Анализ временных рядов // StatSoft: Электронный учебник по статистике. - Режим доступа: http://statsoft.ru/home/textbook/modules/sttimser.html/ (дата обращения: 28.03.2022).
- Дорт-Гольц, А. А. Анализ эффективности методов краткосрочного прогнозирования сетевого трафика / А. А. Дорт-Гольц // Информационные технологии и телекоммуникации. - 2014. - № 2. - С. 12-19.
- EDN: SUCPFJ
- Дорт-Гольц, А. А. Экспериментальная оценка методов краткосрочного прогнозирования для задачи предсказания интенсивности сетевого трафика / А. А. Дорт-Гольц // Информационные технологии и телекоммуникации. - 2014. - № 3. - С. 97-110.
- Kendall, M. G. The advanced theory of statistics. Vols. II and III / M. G. Kendall, A. Stuart. - Charles Griffin Publishers, 1961.
- Wireshark. - 2022. - Mode of access: https://www.wireshark.org/ (date of access: 28.03.2022).