Использование инструментов data science в цифровой экономике

Бесплатный доступ

В статье рассматриваются вопросы использования инструментов Data Science в экономической сфере деятельности в ходе цифровой трансформации. При проведения исследования установлено, что технологии Data Science находят свое применение в различных сферах экономической деятельности государственных и коммерческих организаций. Установлено, что основными составляющими Data Science выступают ис кус ственный ин телл ект, ма шин ное обу че ние и ана лиз дан ных. На основе анализа результатов исследований российских специалистов приведены примеры прикладного применения Data Science для оценки и прогнозирования экономической деятельности и деловой практики. Сделан вывод, что технологии Data Science постоянно развиваются и включают все новые инструменты, а теоретикометодологический аппарат Data Science имеет комплексный характер, основываясь на методах и теориях из многих областей научных знаний. Научные исследования по теме Data Science в основном проводятся авторами из США, Китая, Индии, Великобритании и Германии в таких отраслях знаний, как компьютерные науки, инжиниринг, социальные науки, медицина, науки о принятии решений и математика. В экономической деятельности применение технологий Data Science с практической точки зрения направлено на анализ Big Data и планирование деятельности на основе полученных результатов деятельности организации или бизнесструктуры, поддержку принятия управленческих решений, прогнозирование событий и моделирование процессов. Но следует полагать, что в современных условиях потенциал применения технологий Data Science в области экономики значительно шире, а роль инструментов Data Science в цифровой экономике будет только расти.

Еще

Big data, data science, экономическая деятельность, анализ, прогнозирование, моделирование, перспектива

Короткий адрес: https://sciup.org/14128786

IDR: 14128786   |   DOI: 10.47629/2074-9201_2023_3_167_171

Текст научной статьи Использование инструментов data science в цифровой экономике

Автор выражает благодарность научному руководителю кандидату экономических наук, доценту Зубовой Ольге Геннадьевне.

С овременное развитие экономики непосредственным образом связано с использованием достижений информационных технологий, формированием нового экономического уклада в условиях промышленной революции 4.0, сопровождающихся активным развитием и применением различных цифровых инструментов, что неразрывно связано со сбором и обработкой больших массивов данных (англ., Big Data). На сегодняшний день анализ данных представляет собой исследование многомерных информационных массивов разнообразного типа и структуры со множеством параметров. В этой ситуации в различных областях человеческой деятельности все больше находят свое применение инструменты Data Science – междисциплинарной научной области знаний и практических решений, находящейся на стыке статистики, математики, системного анализа, машинного обучения и охватывающей все этапы работы с данными.

В основе Data Science лежит наделение смыслом Big Data (чаще всего представляющих неструктурированную информацию), их визуализация, сбор идей и принятие решений на основе этих данных. Несмотря на все многообразие существующих инструментов Data Science, их можно систематизировать в виде нескольких научных областей, которые и формируют Data Science как науку и практический инструментарий различных исследований(см. Рисунок).

Искусственный интеллект (англ., Artificial Intelligence) представляет собой такую научную область, которая включает разнообразные методики, технологии, приемы и инструменты, позволяющие создавать интеллектуальные системы, функционирующие и действующие как человек. На сегодняшний день инстру- менты Artificial Intelligence приблизились к замене человеческого интеллекта в ряде прикладных областей и позволяют создавать даже творческие работы [2].

Машинное обучение (англ., Machine Learning) направлено на создание автоматического инструмента для извлечения знаний из данных. В этом случае компьютеры обучаются действовать самостоятельно, человеку больше нет необходимости писать им подробные инструкции (то есть создавать программы и алгоритмы) для выполнения определенных задач [3].

Еще одной важной составляющей Data Science выступает анализ данных (англ., Data Mining) и их визуализация. Data Mining выступает исследовательским процессом, включающий анализ скрытых моделей данных в соответствии с различными вариантами перевода в полезную информацию, которая собирается и формируется в хранилищах данных для облегчения принятия деловых решений, призванных сократить расходы иувеличить доход [4].

Рабочий процесс Data Science включает такие общие составляющие, как:

  • 1)    сбор, проверка и подготовка данных;

  • 2)    проведение анализа данных;

  • 3)    визуализация полученных результатов;

  • 4)    коммуникация или представление результатов исследования лицам, принимающим решение, с последующей их реакцией [5].

Применение методик и инструментов Data Science подразумевает использование программных алгоритмов, продвинутых аналитических инструментов, искусственного интеллекта и других современных технологий. Необходимо признать, что от каче-

Рисунок. Основные составляющие Data Science [1]

ства сбора данных, точности проведенного анализа, объективной полезности полученных значений и их корректной визуализации во многом зависит судьба как отдельных проектов, так и целых компаний.

В современных условиях автоматизации управленческих процессов и широкого использования цифровых технологий практически в любой сфере деятельности находят применения инструменты Data Science. Приведем ряд примеров использования Data Science.

Международные коммерческие банки используют приложения, которые позволяют при помощи облачных вычислений автоматически выяснить риски кредитования для отдельных клиентов.

Data Science задействуется технологическими компаниями по разработке автономных средств передвижения. Инструменты Data Science позволяют обрабатывать информацию на ходу, помогая автомобилям, оснащенным искусственным интеллектом, передвигаться самостоятельно.

В бизнесе в отдельных отраслях производства часто задействуются инструменты, разработанные в тесной интеграции с Data Science-продуктами. В частности, это играет важную роль при роботизации биз-нес-процессов и автоматизации производства.

Медиакорпорации используют инструменты Data Science, чтобы анализировать интересы потребителей, проводить маркетинговые мероприятия целевой направленности, разрабатывать новые продукты для привлечения широкой аудитории.

В правоохранительных органах создаются системы на базе искусственного интеллекта, которые анализируют обстоятельства преступлений и генерируют статистические отчеты. Также создаются системы, позволяющие предугадать, как правильно распределить ресурсы правоохранительных органов, чтобы сократить количество преступлений.

В современной системе здравоохранения разрабатываются инструменты на базе аналитических показателей, позволяющие наблюдать за больными дистанционно.

На сегодняшний день бизнес активно использует Data Science в маркетинговых целях – для прогнозирования успешности рекламных кампаний, сбора данных и сегментации целевой аудитории, изучения спроса на те или иные продукты/услуги. Например, технологии Data Science применяется в следующих ситуациях:

•    для об на ру^же ния ано ма лий, на при мер, ненормального поведения клиента, мошенничества;

•    для проведения перс о на ли зи ро ван ного маркетинга в виде электронных рассылок, ретаргетинга, системы рекомендаций и др.; •    осуществления ко ли че ствен ных про гно зов – определения показателей эффективности, качества проведения рекламных кампаний и других мероприятий;

  • •    в ско рин го вых си сте мах для об ра бот ки Big Data, помощи в принятии прикладных управленческих решений, например, о предоставлении кредита и т. п.;

  • •    для ба зо вого вза и мо дей ствия с кли ен том с ис пользованием обработки стандартных ответов в чатах, применении голосовых помощников, для сортировка сообщений по папкам и др.

Несомненно, что современные алгоритмы работы с Big Data все больше привлекают внимание исследователей. При этом внимание уделяется и области экономики, где применение инструментов Data Science способствует повешению доходности бизнеса и росту его рентабельности и прибыльности.

В экономической деятельности применение технологий Data Science позволяет решать ряд актуальных задач, таких как:

•    анализ действующей организационной структуры предприятия и построение новой бизнес-моде-ли с применением цифровых технологий; •    снижение уровня производственных издержек, маркетинговых затрат и затрат на логистику; •    прогнозирование изменений и формирование новой модели получения дохода; •    оптимизация взаимоотношений с клиентами и партнерами за счет определения их удовлетворенности качеством маркетинговой/сбытовой/логисти-ческой деятельности; •    снижение бизнес-рисков и повышение рентабельности инвестиций в инновационные продукты и услуги.

С практической точки зрения, прежде всего, использование инструментов Data Science направлено на анализ Big Data и планирование на основе полученных результатов деятельности организации или бизнес-структуры. Приведем несколько подобных примеров:

  • 1)    проведение предиктивной аналитики на железнодорожном транспорте (исследование А.В. Озерова, А.М. Ольшанского и А.П. Куроптевой [6]);

  • 2)    использование инструментов Data Science в кредитном риск-менеджменте (исследование А.А. Масютина [7]);

  • 3)    анализа Big Data в сфере агропромышленного производства (исследование А.В. Тихоновой, Е.А. Воронина и А.И. Сидорова [8]).

Другой важной областью применения Data Science в экономической сфере деятельности выступает поддержка принятия управленческих решений. Примером подобного прикладного использования инструментов Data Science в рассматриваемой области выступает совершенствование методов поддержки принятия решений в системах обеспечения энер- гетическими ресурсами на машиностроительных предприятиях с использованием технологий Data Science (исследование А.А. Соколова [9]).

Третьей крупной областью экономических исследований с помощью технологий Data Science выступает прогнозирование событий и моделирование процессов. Примерами подобного выступают:

  • 1)    прогнозирование динамики ключевой процентной ставки Банка России и вероятности отзыва лицензии у кредитной организации (исследование А.Д. Стерликовой [10]);

  • 2)    моделирование процессов на предприятиях нефтегазовой отрасли с использованием нейросетей (исследование И.Е. Аккуратова [11]).

Вместе с тем, с позиции применимости Data Science для различных областей знаний крайне интересными выглядят результаты исследования, проведенного В.С. Артеевой и В.В. Бразовской. Авторами было установлено, что в международных научных базах содержаться публикации по Data Science со следующим распределением (приводим Топ-5 научных областей):

•    компьютерные науки – 31 % всех исследований; •    инжиниринг, социальные науки и медицина – по 11 %;

•    науки о принятии решений – 10 %; •    математика – 8 % [12].

Как следует из результатов проведенного исследования, экономические науки не были выделены в качестве приоритетных. Это косвенным образом указывает на ограниченное использование инструментов Data Science в экономике – как с позиций теории и методологии, так и практики. Полагаем, что потенциал применения технологий Data Science значительно шире, чем выделенные нами ранее области исследований.

Еще одним важным аспектом использования Data Science выступает распределение научных публикаций в страновом отношении. Как было установлено В.С. Артеевой и В.В. Бразовской, большинство публикаций принадлежат исследователям из западных стран:

  • -    31 % всех публикаций принадлежит авторам из США;

  • -    11 % – из Китая;

  • -    7 % – из Индии;

  • -    6 % – из Великобритании;

  • -    5 % – из Германии.

Исследование В.С. Артеевой и В.В. Бразовской показало, что авторы из остальных стран мира, в том числе из Российской Федерации, в гораздо меньшей степени проводят и публикуют научные работы по тематике Data Science.

В современных условиях технологии Data Science постоянно развиваются и включают все новые инструменты, а теоретико-методологический аппарат Data Science имеет комплексный характер, основываясь на методах и теориях из многих областей научных знаний, прежде всего, математике, статистике, теории обработки сигналов, построении вероятностных моделей, машинном обучении, программировании, технологии анализа данных, распознавании образов и визуализации, теорию обучении, моделировании неопределенности, организации баз данных, а также высокоэффективных вычислениях с целью получения прикладных решений из анализа данных, создания продуктов обработки данных и принятия управленческих решений на основе анализа данных.

Таким образом, технологии Data Science постоянно развиваются и включают все новые инструменты, а теоретико-методологический аппарат Data Science имеет комплексный характер, основываясь на методах и теориях из многих областей научных знаний. Вместе с тем, научные исследования по теме Data Science в основном проводятся авторами из США, Китая, Индии, Великобритании и Германии в таких отраслях знаний, как компьютерные науки, инжиниринг, социальные науки, медицина, науки о принятии решений и математика. В экономической деятельности применение технологий Data Science с практической точки зрения направлено на анализ Big Data и планирование деятельности на основе полученных результатов деятельности организации или бизнес-структуры, поддержку принятия управленческих решений, прогнозирование событий и моделирование процессов. Но следует полагать, что в современных условиях потенциал применения технологий Data Science в области экономики значительно шире и роль инструментов Data Science будет только расти.

450 с.

Список литературы Использование инструментов data science в цифровой экономике

  • Шпигельхалтер Д. Искусство статистики. Как находить ответы в данных. М.: Манн, Иванов и Фербер, 2019. 450 с.
  • Симчера В.М. Методы многомерного анализа статистических данных. М.: Финансы и статистика, 2018. 400 c.
  • Мхитарян В.С. Теория планирования эксперимента и анализ статистических данных. М.: Юрайт. 2020. 491 с.
  • Рафалович В. Data mining, или интеллектуальный анализ данных для занятых. Практический курс. М.: SmartBook, 2018. 352 c.
  • Миркин Б.Г. Введение в анализ данных. М.: Юрайт, 2020. 175 с.
  • Озеров А.В., Ольшанский А.М., Куроптева А.П. Предиктивная аналитика с использованием Data Science на железнодорожном транспорте // Наука и технологии железных дорог. 2020. Т. 4. № 4 (16). С. 63-76.
  • Масютин А.А. Рандомизированные алгоритмы на основе интервальных узорных структур для задач классификации и регрессии в задачах кредитного риск-менеджмента: дисс. …канд. матем. наук. М., 2018. 170 с.
  • Тихонова А.В., Воронин Е.А., Сидоров А.И. Системный подход к анализу больших данных АПК с использованием методов Data Science // История, современное состояние и перспективы инновационного развития общества. Сборник статей Национальной (Всероссийской) научно-практической конференции. Уфа, 2020. С. 24-34.
  • Соколов А.А. Методы поддержки принятия решений в системах обеспечения энергетическими ресурсами на машиностроительных предприятиях: дисс. …канд. техн. наук. Волгоград, 2019. 162 с.
  • Стерликова А.Д. Совершенствование регулирования и надзора Банка России за кредитными организациями и цифровизация: дисс. …канд. эконом. наук. Самара, 2022. 170 с.
  • Аккуратов И.Е. Моделирование в нефтегазовой отрасли с использованием нейросетей и Data Science // Энигма. 2019. № 12-1. С. 151-154.
  • Артеева В.С., Бразовская В.В. Развитие цифровой экономики: анализ исследований о Data Science // в сборнике: Цифровая трансформация экономических систем: проблемы и перспективы (ЭКОПРОМ-2022). Сборник трудов VI Всероссийской научно-практической конференции с зарубежным участием. Санкт-Петербург, 2022. С. 73-77.
Еще
Статья научная