Формализация базовых процессов и математическая модель системы мониторинга и анализа публикаций электронных СМИ

Бесплатный доступ

В статье описан подход формализации базовых процессов и построения математической модели для системы сбора и анализа данных из электронных СМИ. Авторы, в рамках проведения научного исследования, занимаются созданием системы, в том числе ведется разработка новых алгоритмов, методов и подходов сбора и анализа текстовой информации из новостных интернет-источников. Основным направлением в исследовании рассматривается применение методов интеллектуального анализа текстовых данных на основе технологии искусственных нейронных сетей, методов обработки естественного языка, text mining, машинного обучения и обработки больших данных. Цель исследования. Разработать формализованное описание модели системы мониторинга и анализа текстовой информации электронных новостных СМИ методами математического моделирования. Методы и инструментарий исследования. Предложено использование инструментария методологии математического моделирования с методами системного анализа. Для исследования системы применены такие методы системного анализа, как абстрагирование, формализация, композиция и декомпозиция, структурирование и реструктурирование, моделирование, распознавание и идентификация. Система рассматривается как формализованная модель автоматического классификатора и кластеризатора набора текстовых документов на естественном языке в виде алгебраической системы. Для решения задач классификации и кластеризации текстов предложено применять методы машинного обучения на основе нейросетевых подходов. Структура системы и составляющие её процессы, а также процессы взаимодействующие с системой извне, представлены в виде формализованного математического описания. Результаты. Разработанное формализованное математическое описание модели системы наглядно показывает взаимосвязь компонентов системы между собой, а также внутренние процессы. Применяемый подход позволяет детализировать представление системы на основе ее декомпозиции на подсистемы и модули. Все это дает возможность упорядочить последовательности этапов создания системы и декомпозировать их на отдельные этапы работ. Заключение. Результаты, полученные в ходе проведенного исследования, позволяют перейти к следующему этапу жизненного цикла разрабатываемой информационной системы - ее программной разработке.

Еще

Мониторинг информации сми, анализ данных, система мониторинга и анализа данных, анализ текста, математическая модель системы, интеллектуальный анализ данных, нейросетевые методы, системный анализ, классификация текстов, кластеризация текстов

Еще

Короткий адрес: https://sciup.org/147236499

IDR: 147236499   |   DOI: 10.14529/ctcr210403

Список литературы Формализация базовых процессов и математическая модель системы мониторинга и анализа публикаций электронных СМИ

  • Комаров, В.Н. Мониторинг и системный анализ информации электронных СМИ для промышленных предприятий / В.Н. Комаров, С.М. Рощин // Наукоемкие технологии и интеллектуальные системы: сб. ст. по итогам Междунар. науч.-практ. конф. - Самара: ООО «Агентство международных исследований», 2018. - С. 36-40.
  • Комаров, В.Н. Разработка архитектуры системы мониторинга и анализа публикаций в сети интернет / В.Н. Комаров, С.М. Рощин // Передовые инновационные разработки. Перспективы и опыт использования, проблемы внедрения в производство: сб. науч. ст. по итогам девятой междунар. науч. конф. (31 октября 2019 г.). Ч. 2. - Казань: ООО «Конверт», 2019. -С. 27-29.
  • Комаров, В.Н. Моделирование системы мониторинга и анализа информации электронных СМИ методами модельно-ориентированного системного инжиниринга / В.Н. Комаров, С.М. Рощин // Вестник ЮУрГУ. Серия «Компьютерные технологии, управление, радиоэлектроника». -2021 - Т. 21, № 1 - С. 12-22. DOI: 10.14529/ctcr210102
  • Зайцева, Н.А. Математическое моделирование: учеб. пособие / Н.А. Зайцева. - М.: РУТ (МИИТ), 2017. - 110 с.
  • Аверченков, В.И. Мониторинг и системный анализ информации в сети Интернет / B.И. Аверченков, С.М. Рощин. - Брянск: БГТУ, 2012. - 160 с.
  • Анализ данных и процессов / А.А. Барсегян, М.С. Куприянов, И.И. Холод и др. - 3-е изд., перераб. и доп. - СПб.: БХВ-Петербург, 2009. - 512 с.
  • Борисов, Е.С. Классификатор текстов на естественном языке / Е.С. Борисов. -http://mechanoid.kiev.ua/neural-net-classifier-text.html (дата обращения: 5.08.2021).
  • Дюк, В.А. Применение технологий интеллектуального анализа данных в естественнонаучных, технических и гуманитарных областях / В.А. Дюк, А.В. Флегонтов, И.К. Фомина // Известия российского государственного педагогического университета им. А.И. Герцена. - 2011. -№ 138. - С. 77-87.
  • Акимов, Д.А. Подход к классификации интернет-страниц по степени их информативности / Д.А. Акимов, О.К. Редькин, И.В. Садыков // Вестник МГТУ МИРЭА. - 2015, № 4-1 (9). - C. 206-217.
  • Созыкин, А.В. Анализ текстов с помощью рекуррентных нейронных сетей / А.В. Созыкин. - https://www.youtube.com/watch?v=7Tx_cewjhGQ (дата обращения: 05.08.2021).
  • Архипенко, К. Рекуррентные нейронные сети в задачах анализа текстов / К. Архипенко. -https://docplayer.ru/42578505-Rekurrentnye-neyronnye-seti-v-zadachah-analiza-tekstov.html (дата обращения: 10.08.2021).
  • Трусов, П.В. Введение в математическое моделирование / П.В. Трусов. - М. : Университетская книга; Логос, 2007. - 440 с.
  • Русаков, А.М. Исследование и моделирование сложных систем / А.М. Русаков. - М. : Мос-ков. гос. ун-т приборостроения и информатики, 2014. - 90 с.
  • Комаров, В.Н. Структура и обобщенный алгоритм работы системы мониторинга и анализа публикаций электронных СМИ / В.Н. Комаров, С.М. Рощин //XXI век: итоги прошлого и проблемы настоящего плюс. - 2019. - Т. 8, № 4 (48). - С. 61-66.
  • Комаров, В.Н. Мониторинг и системный анализ информации электронных СМИ для предприятий оборонно-промышленного комплекса России / В.Н. Комаров, С.М. Рощин //XXI век: итоги прошлого и проблемы настоящего плюс. - 2019. - Т. 8, № 2 (46). - С. 22-25.
  • Борисов, Е.С. Автоматизированная обработка текстов на естественном языке, с использованием инструментов языка Python / Е.С. Борисов. - http://mechanoid.kiev.ua/ml-text-proc.html (дата обращения: 10.08.2021).
  • Васильев, Ю. Обработка естественного языка. Python и spaCy на практике /Ю. Васильев. - СПб.: Питер, 2021. - 256 с.
  • Система формирования знаний в среде интернет: моногр. / В.И. Аверченков, А.В. Заболеева-Зотова, Ю.М. Казаков и др. - 3-е изд., стереотип. -М.: ФЛИНТА, 2016. - 181 с.
  • Вершинин, В.Е. Решение задач обработки естественного языка на основе нейросетевых моделей / В.Е. Вершинин, Е.В. Вершинин // Международная научно-практическая конференция НИЦ Аэтерна, 2018. - С. 54-59.
  • Витковский, А.В. Применение рекурсивных нейронных сетей для анализа тональности текста /А.В. Витковский, А.В. Жвакина // 54-я научная конференция аспирантов, магистрантов и студентов БГУИР, 2018. - С. 152-153.
Еще
Статья научная