Комплексная автоматическая интеллектуальная обработка интернет-контента, выводимого на монитор в ходе пользовательской сессии
Автор: Иванов Олег Сергеевич, Лохвицкий Владимир Александрович, Дудкин А.С., Титов Сергей Сергеевич
Рубрика: Управление сложными системами
Статья в выпуске: 1, 2021 года.
Бесплатный доступ
Рассмотрены вопросы комплексной автоматической интеллектуальной обработки интернет-контента, выводимого на монитор в ходе пользовательской сессии. Представлены основные критерии оценки информации и ее классификации в интернете. Описаны механизмы работы алгоритмов автоматического анализа различных видов интернет-контента. Приведен пример работы программных алгоритмов в режиме ручного, или экспертного, анализа выведенного на монитор пользователя интернет-контента. Предложен подход к разработке макета программно-аппаратного комплекса, используемого для выявления и интеллектуальной обработки деструктивного мультимедийного интернет-контента.
Психическое здоровье, интернет-контент, алгоритмы автоматического анализа, программное средство
Короткий адрес: https://sciup.org/148321619
IDR: 148321619 | DOI: 10.25586/RNU.V9187.21.01.P.103
Текст научной статьи Комплексная автоматическая интеллектуальная обработка интернет-контента, выводимого на монитор в ходе пользовательской сессии
Вводные замечания
Мультимедийная информация, выводимая на монитор пользователя, может быть разнообразной. В общем виде практически невозможно спрогнозировать, какой именно ин-тернет-контент в данную сессию пользователь будет просматривать.
Пользователь – акцептор интернет-контента – может целенаправленно искать какую-то нужную ему информацию или сталкиваться с некоторым инфотрафиком случайным образом. Для таких случаев представляется целесообразным предоставить в распоряжение пользователей инструмент защиты их психического (в том числе психологического) здоровья [5] от действия деструктивного интернет-контента и приемов вредоносного социального инж иниринга [18].
* Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 18-29-22064 «Модели и методы выявления и интеллектуальной обработки деструктивного мультимедийного интернет-контента».
104 и нформационная безопасность
Например, существует мнение, что телевизионная или интернет-реклама преимущественно негативно воспринимаются зрителями [1, 20]. Прерывающая просмотр фильма или передачи реклама вносит диссонанс в мыслительный процесс и переживания зрителя основного контента. Когнитивно-аффективный диссонанс проявляется в раздражении, которое, в свою очередь, резко изменяет эмоционально-когнитивный настрой зрителя и его поведенческие реакции.
Кроме того, реклама в самом широком смысле – это совокупность рекламных технологий, применяемых для продвижения какой-либо информации. Реклама навязывает акцептору нужные транслятору (рекламодателю) мысли и эмоции, а значит, и поведение [15].
По ряду формальных признаков рекламу как сложный комплексный контент можно отнести к негативному, деструктивному, классу информационных сообщений и запретить законодательно для трансляции по публичным инфоканалам. Но поскольку в рекламной и ассоциированной с ней индустриях сходятся интересы самых разных хозяйствующих субъектов и потребителей, то для обоснования подобного заключения требуются веские аргументы и воля [22]. Аналогичным образом влияет на пользователя рекламный интернет-контент за счет встроенных или всплывающих рекламных баннеров-блоков и/или квазислучайных переходов пользователя на сторонние, не запрашиваемые им интернет-ресурсы, содержащие контент с неполезным содержимым. Таким образом, поскольку рекламные сообщения содержат (1) провоцирующий к определенному поведению контент, (2) в котором применяются специальные технологии социального инжиниринга (3) и восприятие которого нежелательно для акцептора, то рекламу (ее большую часть) вполне корректно отнести к вирусному, то есть деструктивному, контенту.
В этой связи программное средство (ПС), осуществляющее автоматический интеллектуальный анализ медиаконтента, может стать инструментом защиты пользователя от нежелательных ему сообщений [13], в частности таких как интернет-реклама.
Критерии оценки и классификации информации
С помощью приемов и технологий социальной инженерии [19], на которых построено распространение вирусного контента [21], могут распространяться (и нередко распространяются) информационные материалы запрещенного и/или ограниченного доступа [11]. Соответственно, наличие в распоряжении пользователя инструмента, предотвращающего его контакт с нежелательной информацией в сети Интернет, будет способствовать сохранению его психического здоровья [7].
Вопрос о критериях оценки информации и ее классификации на категории многогранен. Какой бы ни была информация, по одной из классификационных систем ее условно можно разделить на следующие классы:
-
1) тексты (с учетом языковой группы текста, стилистики, объема и др. [4, 13]);
-
2) звуковая (аудиальная), классифицируемая на подклассы: устная речь (монолог, диалог, полилог, какофония и др.), естественные звуки, искусственные звуки, которые, в свою очередь, можно разделить на гармоничные, агармоничные и др. [17];
-
3) графический контент , представленный статической (изображения, фотографии, картины или символы) и квазистатической визуальной информацией (специальный тип изображений, представленных неподвижными пикселями, но расположенными так, что за
Комплексная автоматическая интеллектуальная обработка...
счет особенностей психофизиологии восприятия изображений человеком у субъекта возникает иллюзия подвижности неподвижного изображения) [16], а также динамическими изображениями (короткие, зацикленные изображения в формате .gif или видеоролики разной продолжительности).
В зависимости от того, какой тип (класс) контента выводится на монитор пользователя, он (контент) может быть обработан разными алгоритмами [3].
Если это тексты, то обработка выполняется на предмет оценки, например, языка, читабельности букв (размер, шрифт, контраст «символ – фон» и др.), орфографии (правописания), наличия/отсутствия в тексте ключевых слов и фраз, определения стиля текста (проза, стихотворение, технический текст, рекламный и др.). Для автоматического анализа звуков используются алгоритмы, реализованные программными продуктами или средствами распознавания речи и оценки ее языковой принадлежности, а также алгоритмы определения гармоничных и агармоничных звуков [12].
На рисунке 1 представлена когнитивная карта, визиализирующая вышеизложенное.

Рис. 1. Когнитивная карта архитектуры программного средства
Для автоматического анализа статичных изображений используются алгоритмы: 1) оценки представленности пиксельных полей определенных диапазонов цветовых тонов; 2) определения на изображении графических примитивов; 3) оценки пропорциональности объектов и другие итерационно подключаемые/отключаемые программные модули, реализующие соответствующие целевые алгоритмы.
Информационная безопасность
Для автоматического анализа видеороликов в дополнение к алгоритмам выявления наличия и структурного анализа текстов, анализа динамики акустического поля [12], наличия графических примитивов, пиксельных полей, объектов используются алгоритмы оценки переходов от кадра к кадру по значениям всех перечисленных выше параметров.
Таким образом, для осуществления автоматического программного интеллектуального анализа мультимедийного интернет-контента с исходно неизвестным с точки зрения влияния на психическое здоровье потребителя содержимым целесообразно использовать различные алгоритмы обработки контента, взаимодополняющие свою информативность за счет объединения их в комплекс [10], тем более что такое объединение не исключает автономной работы каждого такого программного модуля.
На рисунке 2 представлен частный вариант результата работы комплекса описанных выше программных алгоритмов в режиме ручного, или экспертного, анализа выведенного на монитор пользователя интернет-контента.

Рис. 2. Результаты комплексного автоматического интеллектуального анализа интернет-контента, выведенного на монитор пользователя
Программное средство по обработке интернет-контента
Функциональность разрабатываемого ПС по обработке мультимедийного контента аналогична описанному.
На первом шаге программным средством анализируются физические характеристики контента: яркостно-контрастные характеристики, параметры мелькания (изменения светового потока во времени), параметры акустического сопровождения изображений [12].
Комплексная автоматическая интеллектуальная обработка...
По результатам анализа физических характеристик формируется заключение о вероятном характере влияния этих (физических) характеристик контента на сенсорные системы человека: «допустимое», «настороженное», «недопустимое», «неопределенное» [7].
На втором шаге ПС выделяет на изображении блоки (области) с качественно разным содержимым: тексты, графика – символы, изображения, «гифки», видеоролики. Далее каждый тип блоков обрабатывается специализированными релевантными программными модулями (алгоритмами). В частности, области, содержащие текст, анализируются программными модулями, анализирующими параметры текстов [9]. В ходе такого анализа в тексте выделяются слова и (или) фразы, которые, в свою очередь, анализируются на предмет наличия в них негативного смысла; определяется стиль изложения, язык текста и др.
Области, содержащие статичные изображения, обрабатываются программными модулями, называемыми нейросетями. Результатом работы подобных нейросетей является текстовый перечень выявленных объектов. Этот список становится доступным для анализа другими программными модулями на предмет обнаружения/необнаружения в нем объектов, относимых, в том числе, к негативной (деструктивной) группе [2].
Области с динамической графикой обрабатываются соответствующим данному типу контента образом [14].
В приведенном описании функциональности создаваемого ПС указано, что результатами интеллектуального анализа, выведенного на монитор пользователя мультимедийного интернет-контента, являются списки с названиями объектов, а также, где это возможно, характеристики объектов с точки зрения их влияния на психическое здоровье акцептора информации.
В работе [7] авторы подробно рассмотрели, что разделение мультимедийного интер-нет-контента на «нейтральный», «позитивный» и «деструктивный» является сложной задачей, не имеющей общего решения. Любое решение будет частным, контекстно зависимым, то есть отнесение контента к деструктивному зависит от того, кто и для каких целей воспринимает анализируемый контент.
В разрабатываемом ПС предусмотрен блок пользовательских опциональных настроек, в базу шаблонов которого пользователь может заранее внести итерационный перечень слов-названий и прочих характеристик – числовых значений, символов и др., являющихся образцами-идентификаторами, с которыми автоматически выполняется сравнение названий объектов. Соответственно, если сличение и идентификация произошли, то ПС сигнализирует пользователю опционально указанным способом о наличии в просматриваемом контенте признаков деструктивной (обозначенной пользователем как таковая) информации, а также указывает, на какой именно «объект» или «группу объектов» произошло срабатывание. С этого момента пользователь имеет возможность задать «поведение» ПС при обнаружении им подобных признаков в другой «порции» контента.
Ввиду огромного разнообразия (скорее всего, принципиально неисчислимого) вариантов подаваемой на монитор пользователя информации архитектура ПС реализуется на основе принципа открытости – принятого в WWW-сообществе соглашения, суть которого формулируется следующим образом: кто угодно может сказать что угодно и о чем угодно. Применение данного принципа в архитектуре ПС дает возможность обеспечить принципиальную итерационность программных модулей (мультиагентный подход [24])
108 информационная безопасность без потери достигнутой функциональности; также обеспечивается возможность произвольно менять количество самих модулей в составе ПС без потери его работоспособности. Данный принцип реализован в технологиях Semantic Web [25]; варианты его практической реализации представлены программными средствами онтологического инжиниринга [8, 23].
Выводы
Таким образом, в данной работе описан и сформулирован реализуемый авторами подход к разработке макета программно-аппаратного комплекса, используемого для выявления и интеллектуальной обработки деструктивного мультимедийного интернет-контента.
Список литературы Комплексная автоматическая интеллектуальная обработка интернет-контента, выводимого на монитор в ходе пользовательской сессии
- Ахметшина А.А. Современная коммерческая реклама как идеологический аппарат государства. Социологический ракурс // Вестник Чувашского университета. 2009. № 4. С. 198–203.
- Белим С.В., Ларионов С.Б. Алгоритм сегментации изображения с помощью искусственной нейронной сети без использования других изображений // Радиостроение. 2017. № 3. С. 43–53.
- Бождай А.С., Тимонин А.Ю. Исследование процесса анализа текстовых и мультимедиа данных социального профиля из открытых источников информации // Известия высших учебных заведений. Поволжский регион. Технические науки. 2017. № 2. С. 19–28.
- Брицов Р.А. Ранжирование информации на основе оценок и поведения пользовате-
- лей // T-Comm – Телекоммуникации и Транспорт. 2016. Т. 10, № 1. С. 62–66.
- Воронина А.В. Проблема психического здоровья и благополучия человека: обзор концепций и опыт структурно-уровневого анализа // Сибирский психологический журнал. 2005. № 21. С. 142–147.
- Губанова А.Ю. Классификация электронного контента сайтов для детей: социологический анализ // Вестник РГГУ. Серия «Философия. Социология. Искусствоведение». 2015. № 7. С. 139–143.
- Иванов О.С., Пилькевич С.В., Гнидко К.О., Лохвицкий В.А. и др. Обоснование критериев оценки влияния интернет-контента на психологическое здоровье потребителя информации // Социология. 2020. № 5. С. 275–282.
- Итинсон К.С. Web 1.0, Web 2.0, Web 3.0: этапы развития веб-технологий и их влияние на образование // Карельский научный журнал. 2020. Т. 9, № 1 (30). С. 19–21.
- Кулабухов Р.О. Оценка фоносемантического программного обеспечения для психолингвистического анализа текста с целью выявления эмоционального окраса текста // Евразийский научный журнал. 2017. № 3. С. 206–208.
- Курако Е.А., Орлов В.Л. Методы динамического обновления программных комплексов для систем с каскадной структурой // Проблемы управления. 2017. № 5. С. 52–60.
- Ловцов Д.А., Федичев А.В. Архитектура национального классификатора правовых режимов информации ограниченного доступа // Правовая информатика. 2017. № 2. С. 35–54.
- Миргородская Ю.В, Бернавская М.В., Стаценко Л.Г., Чусов А.А. и др. Объектный анализ акустического поля, создаваемого различными источниками звука в произвольном помещении // Известия Южного федерального университета. Технические науки. 2018. № 6. С. 85–94.
- Новиков А.А., Стрекалов И.Э., Лопатин Д.В. Динамическая фильтрация web-контента // Гаудеамус. 2013. № 2. С. 159–163.
- Петров А.А. Новейшие инструменты четвертой промышленной революции и цифровые механизмы контроля и управления обществом // Кронос. 2020. № 8. С. 24–34.
- Простотина Ю.В. Институт рекламы в формировании моделей потребительского поведения: гендерный аспект // Гуманитарные, социально-экономические и общественные науки. 2019. № 1. С. 45–50.
- Рабичев И.Э., Котов А.В., Амирханян А.А. Иллюзия «сцинтилляции»: вероятные механизмы ее формирования // Теоретическая и экспериментальная психология. 2018. Т. 11, № 1. С. 28–34.
- Сиднева Т.Б. Шум и музыка: логика взаимопревращений // Известия Российского государственного педагогического университета им. А.И. Герцена. 2012. № 146. С. 25–33.
- Сырецкий Г.А. Сквозные цифровые технологии и прорывные технологии кибер-безопасности в контексте системного инжиниринга // Интерэкспо Гео-Сибирь. 2018. № 7. С. 254–260.
- Тепляков С.П., Тимохович А.С. Социальная инженерия. Анализ и методы защиты // Academy. 2018. № 7. С. 26–27.
- Терских М.В. Отношение аудитории к провокационной рекламе: критерии оценки коммуникативной эффективности // Неофилология. 2020. Т. 6, № 21. С. 201–212.
- Тетерина Е.А., Бородина Е.С. Эффективность вирусной рекламы в социальных медиа // Наука. Общество. Государство. 2019. Т. 7, № 3 (27). С. 173–179.
- Тимчак К.Н., Осипов Е.М. Эффективность российской социальной рекламы: критерии и проблемы оценки // Социология. 2019. № 6. С. 126–131.
- Elezaj O., Yayilgan S.Y., Ahmed J., (...), Brichfeld B., Haubold C. Crime Intelligence from Social Media Using CISMO // Advances in Intelligent Systems and Computing. 2021. No. 1183. Pp. 441–460.
- Masloboev A.V., Langhans M. A Multi-Agent System for Management Information Support of Regional Innovations // Научно-технический вестник информационных технологий, механики и оптики. 2018. Т. 18, № 4. С. 630–638.
- Reformat M.Z. Semantic Web: Graphs, Imprecision and Knowledge Generation // Studies in Fuzziness and Soft Computing. 2021. No. 394. Pp. 271–283.