Система фильтрации нежелательных приложений интернет-ресурсов
Автор: Бабенко Алексей Александрович, Бахрачева Юлия Сагидулловна, Алеева Арина Романовна
Журнал: НБИ технологии @nbi-technologies
Рубрика: Инновации в информатике, вычислительной технике и управлении
Статья в выпуске: 4 т.14, 2020 года.
Бесплатный доступ
Был разработан проект программного комплекса фильтрации интернет-трафика на языке программирования C# и описаны его функциональные возможности. В результате проведенных экспериментов системой фильтрации были: удачно проверена корректность работы фильтрации по DNS-записи, удачно проверена корректность работы фильтрации по URL-адресу, сформированы отчеты о выявленных заблокированных сайтах в журнале фильтрации. Таким образом успешное проведение экспериментов позволяет утверждать о выполнение программного комплекса контент-фильтрации интернет-трафика поставленных перед ним задач.
Интернет-трафик, фильтрация, конфиденциальная информация, информационная безопасность, программный комплекс
Короткий адрес: https://sciup.org/149129819
IDR: 149129819 | DOI: 10.15688/NBIT.jvolsu.2020.4.1
Текст научной статьи Система фильтрации нежелательных приложений интернет-ресурсов
DOI:
Необходимость фильтрации интернет-трафика возникает, как и дома, так и для корпоративных сетей. Неограниченный доступ к интернету повышает шанс заражения ПЭВМ вредоносным программным обеспечением, фишинговым атакам и т.п. Второй проблемой, возникающей как в следствии внешних атак, заражения вредоносным программным обеспечением, так и в следствии действий внутреннего злоумышленника (или нарушителя, в т. ч. и неосознанного) – утечка конфиденциальной информации в следствии доступа к Интернет [7].
Согласно исследованию, реальный трафик в Интернете за 10 минут от средней корпоративной сети содержал приблизительно 57 000 пакетов, 1 100 сеансов и 26 протоколов. Большая часть трафика приходится на TCP-протоколы. Причем порты соединений – 80 и 443, которые чаще всего ассоциированы с протокола HTTP или HTTPS/TLS. Причем именно эти 2 протоколы составляют большую часть трафика, относящуюся к web-трафику (то есть использование пользователями web-браузеров) [2].
Анализ результатов содержимого интер-нет-трафика по информации, содержащейся в нем, показал, что среди интернет-трафика наиболее часто встречающимся является протокол HTTP, причем если рассматривать передаваемое содержимое, то большая часть трафика приходится на видео-трафик и web-контент [1; 4].
В результате анализа назначения фильтрации интернет-трафика с целью выбора подходящего вида фильтрации интернет-тра-фика было выделено 3 вида фильтрации [3; 5; 6; 8]:
-
1) пакетная фильтрация;
-
2) фильтрация по протоколам прикладного уровня;
-
3) фильтрация по контенту.
Для дальнейшей работы был выбран метод фильтрации по контенту.
Были проанализированы системы и методы контент-фильтрации, а также определена их применимость для каждого из каналов утечки информации: блокирование по IP-адресу, блокировка по DNS-записи, блокирование по URL-адресу, фильтрация по текстовому содержимому, фильтрация по расширениям и типам файлов, фильтрация результатов поиска.
В результате были выбраны два метода: блокировка по DNS-записи и блокировка по URL-запросу.
Разработка формализованной модели программного комплекса фильтрации интернет-трафика
Процесс блокировки по URL-адресам представляет собой:
U e U D , ресурс подлежит блокировке u t t U D , ресурс не подлежит блокировке

Процесс блокировки по DNS-именам представляет собой:
-
d i e D D , ресурс подлежит блокировке
-
d i t D D , ресурс не подлежит блокировке
Множество URL-адресов U = { u 1 , . , u n } , где URL-адрес u i представляется двойкой:
u 1d,P^, где di – доменное имя в URL-адресе, pi – путь запроса в URL-адресе.
Множество доменных имен (DNS-записей) D = { d 1,..., d m } , где m < n ,
Множество запрещенных URL-адресов dD D
U ,u , , . , U n. } ,
Множество запрещенных DNS-имен Dd = { d , D d m' } .
Разработка архитектуры программного средства, реализующего программный комплекс фильтрации интернет-трафика
Архитектура программного комплекса, состоит из 6 основных модулей: модуль пользовательского интерфейса, модуль настройки, модуль отчета, модуль анализа трафика, модуль работы с трафиком, модуль базы данных запрещенных / разрешенных DNS, URL.
Архитектура программного комплекса представлена на рисунке 1 и в таблице.
Разработка алгоритмов работы программного комплекса фильтрации интернет-трафика
Программный комплекс фильтрации интернет – трафика предусматривает два метода фильтрации:
-
1) фильтрация по DNS-именам,
-
2) фильтрация по URL-адресу.
В первом случае сайт блокируется, если этот сайт находится в списке DNS-имен, которые следует блокировать.
Во втором случае страница сайта блокируется, если она находится в списке URL-адресов которые следует блокировать.
Описанные выше методы фильтрации легко формализовать в виде блок-схем, представленной на рисунке 2.
Блок-схема описывает обобщенный алгоритм фильтрации, включающий следующие шаги:
-
1) на втором шаге после ввода URL-адреса, загружается веб-страница;
-
2) на третьем шаге происходит фильтрация по DNS и URL;
-
3) на четвертом вывод результата: либо веб-страница заблокирована, либо страница загружается в первоначальном виде.
Далее был разработан проект программного комплекса фильтрации интернет-трафи-ка на языке программирования C# и описаны его функциональные возможности.
Было проведено 3 экспериментальных исследования. В результате проведенных экспериментов системой фильтрации были: удачно проверена корректность работы фильтрации по DNS-записи, удачно проверена корректность работы фильтрации по

Рис. 1. Архитектура программного средства контент-фильтрации
Составные части архитектуры программного комплекса
Настройка |
Состоит из создания и удаления списков доступа и по которым следует блокировать сайт |
Анализ трафика |
Выполняет анализ трафика на допуск к ним |
Работа с трафиком |
Выполняет задачу блокирования сайта |
Отчет |
Выводит список сайтов, к которым запрещен доступ |

Проведен ие фильтрации по URL, DNS

Рис. 2. Блок-схема алгоритма работы программного комплекса фильтрации интернет-трафика
URL-адресу, сформированы отчеты о выявленных заблокированных сайтах в журнале фильтрации.
Таким образом, успешное проведение экспериментов позволяет утверждать о выполнение программного комплекса контент-фильтрации интернет-трафика поставленных перед ним задач.
Список литературы Система фильтрации нежелательных приложений интернет-ресурсов
- Лапонина, О. Р. Межсетевое экранирование / О. Р. Лапонина. - М.: Бином. Лаборатория знаний, 2007. - 343 с.
- Медведовский, И. Д. Атака на Internet / И. Д. Медведовский, П. В. Семьянов, Д. Г. Леонов. - 2-е изд., перераб. и доп. - М.: ДМК, 2002. - 336 с.
- Политики доступа и фильтрация трафика. - Электрон. текстовые дан. - Режим доступа: http://help.smart-soft.ru/index.html?howworkfilter. htm (дата обращения: 20.09.2020). - Загл. с экрана.
- Федеральный закон "Об информации, информационных технологиях и о защите информации" от 27.07.2006 № 149-ФЗ (с изм. и доп. в ред. от 13.07.2015). - Доступ из справ.-правовой системы "КонсультантПлюс".
- Фильтрация DNS запросов. - Электрон. текстовые дан. - Режим доступа: https://ospf-ripe.livejournal.com/2194.html (дата обращения: 23.09.2020). - Загл. с экрана.
- Фильтрация HTTPS трафика. - Электрон. текстовые дан. - Режим доступа: https://www. carbonsoft.ru/фильтрация-https-трафика (дата обращения: 20.09.2020). - Загл. с экрана.
- Чемодуров, А. С. Обзор средств фильтрации трафика в корпоративной сети / А. С. Чемодуров, А. Ю. Карпутина // Научно-методический электронный журнал "Концепт". - 2015. - № 2. - Электрон. текстовые дан. - Режим доступа: http://e-koncept.ru/2015/15039.htm. - Загл. с экрана.
- URL-фильтрация или как пользователю ограничить доступ в интернет. - Электрон. текстовые дан. - Режим доступа: https://club.dns-shop.ru/forum/thread/46735 (дата обращения: 20.09.2020). - Загл. с экрана.