Научные статьи \ Общество \ Социология \ Социальные процессы. Социальная динамика

Комплексная автоматическая интеллектуальная обработка интернет-контента, выводимого на монитор в ходе пользовательской сессии

Автор: Иванов Олег Сергеевич, Лохвицкий Владимир Александрович, Дудкин А.С., Титов Сергей Сергеевич

Журнал: Вестник Российского нового университета. Серия: Сложные системы: модели, анализ и управление @vestnik-rosnou-complex-systems-models-analysis-management

Рубрика: Управление сложными системами

Статья в выпуске: 1, 2021 года.

Бесплатный доступ

Рассмотрены вопросы комплексной автоматической интеллектуальной обработки интернет-контента, выводимого на монитор в ходе пользовательской сессии. Представлены основные критерии оценки информации и ее классификации в интернете. Описаны механизмы работы алгоритмов автоматического анализа различных видов интернет-контента. Приведен пример работы программных алгоритмов в режиме ручного, или экспертного, анализа выведенного на монитор пользователя интернет-контента. Предложен подход к разработке макета программно-аппаратного комплекса, используемого для выявления и интеллектуальной обработки деструктивного мультимедийного интернет-контента.

Еще

Психическое здоровье, интернет-контент, алгоритмы автоматического анализа, программное средство

Короткий адрес: https://sciup.org/148321619

IDR: 148321619 | УДК: 316.472.4+519.85 | DOI: 10.25586/RNU.V9187.21.01.P.103

Текст научной статьи Комплексная автоматическая интеллектуальная обработка интернет-контента, выводимого на монитор в ходе пользовательской сессии

Вводные замечания

Мультимедийная информация, выводимая на монитор пользователя, может быть разнообразной. В общем виде практически невозможно спрогнозировать, какой именно ин-тернет-контент в данную сессию пользователь будет просматривать.

Пользователь – акцептор интернет-контента – может целенаправленно искать какую-то нужную ему информацию или сталкиваться с некоторым инфотрафиком случайным образом. Для таких случаев представляется целесообразным предоставить в распоряжение пользователей инструмент защиты их психического (в том числе психологического) здоровья [5] от действия деструктивного интернет-контента и приемов вредоносного социального инж иниринга [18].

* Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 18-29-22064 «Модели и методы выявления и интеллектуальной обработки деструктивного мультимедийного интернет-контента».

104 и нформационная безопасность

Например, существует мнение, что телевизионная или интернет-реклама преимущественно негативно воспринимаются зрителями [1, 20]. Прерывающая просмотр фильма или передачи реклама вносит диссонанс в мыслительный процесс и переживания зрителя основного контента. Когнитивно-аффективный диссонанс проявляется в раздражении, которое, в свою очередь, резко изменяет эмоционально-когнитивный настрой зрителя и его поведенческие реакции.

Кроме того, реклама в самом широком смысле – это совокупность рекламных технологий, применяемых для продвижения какой-либо информации. Реклама навязывает акцептору нужные транслятору (рекламодателю) мысли и эмоции, а значит, и поведение [15].

По ряду формальных признаков рекламу как сложный комплексный контент можно отнести к негативному, деструктивному, классу информационных сообщений и запретить законодательно для трансляции по публичным инфоканалам. Но поскольку в рекламной и ассоциированной с ней индустриях сходятся интересы самых разных хозяйствующих субъектов и потребителей, то для обоснования подобного заключения требуются веские аргументы и воля [22]. Аналогичным образом влияет на пользователя рекламный интернет-контент за счет встроенных или всплывающих рекламных баннеров-блоков и/или квазислучайных переходов пользователя на сторонние, не запрашиваемые им интернет-ресурсы, содержащие контент с неполезным содержимым. Таким образом, поскольку рекламные сообщения содержат (1) провоцирующий к определенному поведению контент, (2) в котором применяются специальные технологии социального инжиниринга (3) и восприятие которого нежелательно для акцептора, то рекламу (ее большую часть) вполне корректно отнести к вирусному, то есть деструктивному, контенту.

В этой связи программное средство (ПС), осуществляющее автоматический интеллектуальный анализ медиаконтента, может стать инструментом защиты пользователя от нежелательных ему сообщений [13], в частности таких как интернет-реклама.

Критерии оценки и классификации информации

С помощью приемов и технологий социальной инженерии [19], на которых построено распространение вирусного контента [21], могут распространяться (и нередко распространяются) информационные материалы запрещенного и/или ограниченного доступа [11]. Соответственно, наличие в распоряжении пользователя инструмента, предотвращающего его контакт с нежелательной информацией в сети Интернет, будет способствовать сохранению его психического здоровья [7].

Вопрос о критериях оценки информации и ее классификации на категории многогранен. Какой бы ни была информация, по одной из классификационных систем ее условно можно разделить на следующие классы:

1) тексты (с учетом языковой группы текста, стилистики, объема и др. [4, 13]);
2) звуковая (аудиальная), классифицируемая на подклассы: устная речь (монолог, диалог, полилог, какофония и др.), естественные звуки, искусственные звуки, которые, в свою очередь, можно разделить на гармоничные, агармоничные и др. [17];
3) графический контент , представленный статической (изображения, фотографии, картины или символы) и квазистатической визуальной информацией (специальный тип изображений, представленных неподвижными пикселями, но расположенными так, что за

Комплексная автоматическая интеллектуальная обработка...

счет особенностей психофизиологии восприятия изображений человеком у субъекта возникает иллюзия подвижности неподвижного изображения) [16], а также динамическими изображениями (короткие, зацикленные изображения в формате .gif или видеоролики разной продолжительности).

В зависимости от того, какой тип (класс) контента выводится на монитор пользователя, он (контент) может быть обработан разными алгоритмами [3].

Если это тексты, то обработка выполняется на предмет оценки, например, языка, читабельности букв (размер, шрифт, контраст «символ – фон» и др.), орфографии (правописания), наличия/отсутствия в тексте ключевых слов и фраз, определения стиля текста (проза, стихотворение, технический текст, рекламный и др.). Для автоматического анализа звуков используются алгоритмы, реализованные программными продуктами или средствами распознавания речи и оценки ее языковой принадлежности, а также алгоритмы определения гармоничных и агармоничных звуков [12].

На рисунке 1 представлена когнитивная карта, визиализирующая вышеизложенное.

Рис. 1. Когнитивная карта архитектуры программного средства

Для автоматического анализа статичных изображений используются алгоритмы: 1) оценки представленности пиксельных полей определенных диапазонов цветовых тонов; 2) определения на изображении графических примитивов; 3) оценки пропорциональности объектов и другие итерационно подключаемые/отключаемые программные модули, реализующие соответствующие целевые алгоритмы.

Информационная безопасность

Для автоматического анализа видеороликов в дополнение к алгоритмам выявления наличия и структурного анализа текстов, анализа динамики акустического поля [12], наличия графических примитивов, пиксельных полей, объектов используются алгоритмы оценки переходов от кадра к кадру по значениям всех перечисленных выше параметров.

Таким образом, для осуществления автоматического программного интеллектуального анализа мультимедийного интернет-контента с исходно неизвестным с точки зрения влияния на психическое здоровье потребителя содержимым целесообразно использовать различные алгоритмы обработки контента, взаимодополняющие свою информативность за счет объединения их в комплекс [10], тем более что такое объединение не исключает автономной работы каждого такого программного модуля.

На рисунке 2 представлен частный вариант результата работы комплекса описанных выше программных алгоритмов в режиме ручного, или экспертного, анализа выведенного на монитор пользователя интернет-контента.

Рис. 2. Результаты комплексного автоматического интеллектуального анализа интернет-контента, выведенного на монитор пользователя

Программное средство по обработке интернет-контента

Функциональность разрабатываемого ПС по обработке мультимедийного контента аналогична описанному.

На первом шаге программным средством анализируются физические характеристики контента: яркостно-контрастные характеристики, параметры мелькания (изменения светового потока во времени), параметры акустического сопровождения изображений [12].

Комплексная автоматическая интеллектуальная обработка...

По результатам анализа физических характеристик формируется заключение о вероятном характере влияния этих (физических) характеристик контента на сенсорные системы человека: «допустимое», «настороженное», «недопустимое», «неопределенное» [7].

На втором шаге ПС выделяет на изображении блоки (области) с качественно разным содержимым: тексты, графика – символы, изображения, «гифки», видеоролики. Далее каждый тип блоков обрабатывается специализированными релевантными программными модулями (алгоритмами). В частности, области, содержащие текст, анализируются программными модулями, анализирующими параметры текстов [9]. В ходе такого анализа в тексте выделяются слова и (или) фразы, которые, в свою очередь, анализируются на предмет наличия в них негативного смысла; определяется стиль изложения, язык текста и др.

Области, содержащие статичные изображения, обрабатываются программными модулями, называемыми нейросетями. Результатом работы подобных нейросетей является текстовый перечень выявленных объектов. Этот список становится доступным для анализа другими программными модулями на предмет обнаружения/необнаружения в нем объектов, относимых, в том числе, к негативной (деструктивной) группе [2].

Области с динамической графикой обрабатываются соответствующим данному типу контента образом [14].

В приведенном описании функциональности создаваемого ПС указано, что результатами интеллектуального анализа, выведенного на монитор пользователя мультимедийного интернет-контента, являются списки с названиями объектов, а также, где это возможно, характеристики объектов с точки зрения их влияния на психическое здоровье акцептора информации.

В работе [7] авторы подробно рассмотрели, что разделение мультимедийного интер-нет-контента на «нейтральный», «позитивный» и «деструктивный» является сложной задачей, не имеющей общего решения. Любое решение будет частным, контекстно зависимым, то есть отнесение контента к деструктивному зависит от того, кто и для каких целей воспринимает анализируемый контент.

В разрабатываемом ПС предусмотрен блок пользовательских опциональных настроек, в базу шаблонов которого пользователь может заранее внести итерационный перечень слов-названий и прочих характеристик – числовых значений, символов и др., являющихся образцами-идентификаторами, с которыми автоматически выполняется сравнение названий объектов. Соответственно, если сличение и идентификация произошли, то ПС сигнализирует пользователю опционально указанным способом о наличии в просматриваемом контенте признаков деструктивной (обозначенной пользователем как таковая) информации, а также указывает, на какой именно «объект» или «группу объектов» произошло срабатывание. С этого момента пользователь имеет возможность задать «поведение» ПС при обнаружении им подобных признаков в другой «порции» контента.

Ввиду огромного разнообразия (скорее всего, принципиально неисчислимого) вариантов подаваемой на монитор пользователя информации архитектура ПС реализуется на основе принципа открытости – принятого в WWW-сообществе соглашения, суть которого формулируется следующим образом: кто угодно может сказать что угодно и о чем угодно. Применение данного принципа в архитектуре ПС дает возможность обеспечить принципиальную итерационность программных модулей (мультиагентный подход [24])

108 информационная безопасность без потери достигнутой функциональности; также обеспечивается возможность произвольно менять количество самих модулей в составе ПС без потери его работоспособности. Данный принцип реализован в технологиях Semantic Web [25]; варианты его практической реализации представлены программными средствами онтологического инжиниринга [8, 23].

Выводы

Таким образом, в данной работе описан и сформулирован реализуемый авторами подход к разработке макета программно-аппаратного комплекса, используемого для выявления и интеллектуальной обработки деструктивного мультимедийного интернет-контента.

Список литературы Комплексная автоматическая интеллектуальная обработка интернет-контента, выводимого на монитор в ходе пользовательской сессии

Ахметшина А.А. Современная коммерческая реклама как идеологический аппарат государства. Социологический ракурс // Вестник Чувашского университета. 2009. № 4. С. 198–203.
Белим С.В., Ларионов С.Б. Алгоритм сегментации изображения с помощью искусственной нейронной сети без использования других изображений // Радиостроение. 2017. № 3. С. 43–53.
Бождай А.С., Тимонин А.Ю. Исследование процесса анализа текстовых и мультимедиа данных социального профиля из открытых источников информации // Известия высших учебных заведений. Поволжский регион. Технические науки. 2017. № 2. С. 19–28.
Брицов Р.А. Ранжирование информации на основе оценок и поведения пользовате-
лей // T-Comm – Телекоммуникации и Транспорт. 2016. Т. 10, № 1. С. 62–66.
Воронина А.В. Проблема психического здоровья и благополучия человека: обзор концепций и опыт структурно-уровневого анализа // Сибирский психологический журнал. 2005. № 21. С. 142–147.
Губанова А.Ю. Классификация электронного контента сайтов для детей: социологический анализ // Вестник РГГУ. Серия «Философия. Социология. Искусствоведение». 2015. № 7. С. 139–143.
Иванов О.С., Пилькевич С.В., Гнидко К.О., Лохвицкий В.А. и др. Обоснование критериев оценки влияния интернет-контента на психологическое здоровье потребителя информации // Социология. 2020. № 5. С. 275–282.
Итинсон К.С. Web 1.0, Web 2.0, Web 3.0: этапы развития веб-технологий и их влияние на образование // Карельский научный журнал. 2020. Т. 9, № 1 (30). С. 19–21.
Кулабухов Р.О. Оценка фоносемантического программного обеспечения для психолингвистического анализа текста с целью выявления эмоционального окраса текста // Евразийский научный журнал. 2017. № 3. С. 206–208.
Курако Е.А., Орлов В.Л. Методы динамического обновления программных комплексов для систем с каскадной структурой // Проблемы управления. 2017. № 5. С. 52–60.
Ловцов Д.А., Федичев А.В. Архитектура национального классификатора правовых режимов информации ограниченного доступа // Правовая информатика. 2017. № 2. С. 35–54.
Миргородская Ю.В, Бернавская М.В., Стаценко Л.Г., Чусов А.А. и др. Объектный анализ акустического поля, создаваемого различными источниками звука в произвольном помещении // Известия Южного федерального университета. Технические науки. 2018. № 6. С. 85–94.
Новиков А.А., Стрекалов И.Э., Лопатин Д.В. Динамическая фильтрация web-контента // Гаудеамус. 2013. № 2. С. 159–163.
Петров А.А. Новейшие инструменты четвертой промышленной революции и цифровые механизмы контроля и управления обществом // Кронос. 2020. № 8. С. 24–34.
Простотина Ю.В. Институт рекламы в формировании моделей потребительского поведения: гендерный аспект // Гуманитарные, социально-экономические и общественные науки. 2019. № 1. С. 45–50.
Рабичев И.Э., Котов А.В., Амирханян А.А. Иллюзия «сцинтилляции»: вероятные механизмы ее формирования // Теоретическая и экспериментальная психология. 2018. Т. 11, № 1. С. 28–34.
Сиднева Т.Б. Шум и музыка: логика взаимопревращений // Известия Российского государственного педагогического университета им. А.И. Герцена. 2012. № 146. С. 25–33.
Сырецкий Г.А. Сквозные цифровые технологии и прорывные технологии кибер-безопасности в контексте системного инжиниринга // Интерэкспо Гео-Сибирь. 2018. № 7. С. 254–260.
Тепляков С.П., Тимохович А.С. Социальная инженерия. Анализ и методы защиты // Academy. 2018. № 7. С. 26–27.
Терских М.В. Отношение аудитории к провокационной рекламе: критерии оценки коммуникативной эффективности // Неофилология. 2020. Т. 6, № 21. С. 201–212.
Тетерина Е.А., Бородина Е.С. Эффективность вирусной рекламы в социальных медиа // Наука. Общество. Государство. 2019. Т. 7, № 3 (27). С. 173–179.
Тимчак К.Н., Осипов Е.М. Эффективность российской социальной рекламы: критерии и проблемы оценки // Социология. 2019. № 6. С. 126–131.
Elezaj O., Yayilgan S.Y., Ahmed J., (...), Brichfeld B., Haubold C. Crime Intelligence from Social Media Using CISMO // Advances in Intelligent Systems and Computing. 2021. No. 1183. Pp. 441–460.
Masloboev A.V., Langhans M. A Multi-Agent System for Management Information Support of Regional Innovations // Научно-технический вестник информационных технологий, механики и оптики. 2018. Т. 18, № 4. С. 630–638.
Reformat M.Z. Semantic Web: Graphs, Imprecision and Knowledge Generation // Studies in Fuzziness and Soft Computing. 2021. No. 394. Pp. 271–283.

Еще