Влияние объёма данных на точность обнаружения аномалий в сетевом трафике: исследование эффекта больших данных
Автор: Ма А.А., Авксентьева Е.Ю.
Рубрика: Информатика и вычислительная техника
Статья в выпуске: 1, 2025 года.
Бесплатный доступ
В статье рассматривается использование алгоритмов машинного обучения для обнаружения аномалий на основе набора данных CICIDS2017, который был специально разработан для имитации реальных сценариев сетевых атак. Особое внимание уделено трем популярным алгоритмам: логистической регрессии, случайному лесу и нейронным сетям. Эти алгоритмы были выбраны благодаря своей способности эффективно обрабатывать большие объемы данных и выявлять сложные паттерны. В рамках статьи проведена серия экспериментов, в которых будут варьироваться объем обучающих данных и оцениваться производительность моделей как на чистых, так и на зашумленных данных. Результаты данного исследования помогут понять, как различные алгоритмы реагируют на изменения в объеме данных и качество входной информации, что является важным аспектом для разработки эффективных систем кибербезопасности.
Аномалии сетевого трафика, машинное обучение, эффект больших данных, нейронные сети, случайный лес, логистическая регрессия
Короткий адрес: https://sciup.org/148330794
IDR: 148330794 | DOI: 10.18137/RNU.V9187.25.01.P.112