Сравнительный анализ современных технологий больших данных и их инновационного применения в сфере услуг

Бесплатный доступ

Статья посвящена изучению современных технологий больших данных и их инновационного использования в сфере услуг с акцентом на выявление их возможностей и преимуществ для различных отраслей. Цель работы - анализ потенциала технологий больших данных для повышения эффективности деятельности, улучшения персонализации и качества услуг, оценка их влияния на развитие цифровой трансформации. Исследование базируется на анализе научной литературы, сравнительном изучении существующих технологий и изучении практических кейсов успешного применения больших данных в ключевых секторах услуг. В статье представлены ключевые теоретические и практические результаты, включающие выявленные взаимосвязи и закономерности в использовании технологий больших данных в сфере услуг. Особое внимание уделено новым данным и долгосрочным выводам, имеющим практическую значимость. Обнаружено, что применение алгоритмов машинного обучения, облачных платформ и инструментов визуализации способствует оптимизации процессов, повышению качества персонализации и улучшению клиентского опыта. Полученные результаты опровергают ряд устаревших подходов и подтверждают необходимость внедрения инновационных решений для цифровой трансформации отрасли. Результаты исследования могут быть интегрированы в практику таких сфер, как маркетинг, логистика, здравоохранение, финансовый сектор и туризм, где требуется глубокая аналитика и обработка больших массивов данных. Технологии больших данных становятся стратегически важным инструментом для компаний, способствуя цифровой трансформации, повышению конкурентных преимуществ и созданию условий для внедрения инновационных подходов в управлении и предоставлении услуг. Перспективы дальнейших научных исследований в сфере услуг связаны с разработкой технологий, которые обеспечат более глубокую персонализацию клиентского опыта, совершенствование аналитических инструментов для прогнозирования спроса и оптимизации бизнес-процессов, а также интеграцию искусственного интеллекта и больших данных для повышения эффективности управления.

Еще

Персонализация, предиктивная аналитика, оптимизация, инновации, машинное обучение, цифровая трансформация, визуализация

Короткий адрес: https://sciup.org/14132905

IDR: 14132905   |   DOI: 10.47629/2074-9201_2025_1_145_154

Текст научной статьи Сравнительный анализ современных технологий больших данных и их инновационного применения в сфере услуг

С овременные технологии больших данных становятся неотъемлемой частью трансформации сферы услуг, предоставляя возможности для глубокой аналитики, точного прогнозирования и персонализированного подхода к клиентам. Их внедрение позволяет предприятиям улучшать качество обслуживания, оптимизировать внутренние процессы и повышать конкурентоспособность в условиях стремительно развивающейся цифровой экономики.

N. Cavlak и R. Cop провели исследование, посвященное возможностям применения аналитики больших данных для повышения эффективности бизнес-процессов, уделив особое внимание способам улучшения персонализации услуг и созданию положительного клиентского опыта [1]. В свою очередь, ZhangC. и TanT. сосредоточились на изучении влияния технологий обработки больших данных на потребительское поведение. Их работа акцентирует внимание на повышении точности маркетинговых стратегий и усовершенствовании взаимодействия с клиентами [2]. В работе AdesinaA.A., IyeloluT.V., PaulP.O. исследует роль предиктивной аналитики в маркетинге. Ученые демонстрируют, каким образом обработка больших массивов информации предоставляет компаниям конкурентные преимущества, позволяя прогнозировать ключевые рыночные тенденции и изменения в поведении аудитории [3]. H. Paruchuri в своей работе рассматривает возможности использования методов машинного обучения в сочетании с большими данными для повышения эффективности сегментации рынка. Исследование демонстрирует, как такие технологии позволяют обеспечить более точное целевое позиционирование продуктов и усовершенствовать персонализированный подход к взаимодействию с клиентами [4]. Ying L.J., Lasi M.A. анализируют трансформацию стратегий коммуникации и вовлечения в контексте онлайн-брендинга. В их исследовании акцент сделан на изменении принципов управления брендами под влиянием инновационных подходов, основанных на данных [5]. I.M. Comfort, J.I. Oluwaseun, D.A. Adejoke с соавторами анализируют

использование различных инструментов и методик для принятия решений на основе данных. В их исследовании акцентирует внимание на совершенствовании стратегического планирования и оптимизации операционной деятельности компаний [6]. Zhan Y., TanK.H., LiY., TseM. рассматривают потенциал применения больших данных в разработке новых продуктов; ученые описывают процесс, охватывающий все стадии, – от создания концепции до вывода продукта на рынок, подчеркивая значимость повышения эффективности на каждом этапе [7]. В работе Wassouf W.N. и коллег предлагается кейс-стадия, демонстрирующая, как аналитика больших данных способствует укреплению клиентской лояльности. Основное внимание уделено созданию и реализации персонализированных маркетинговых подходов, направленных на повышение удовлетворенности клиентов [8]. Среди других значимых исследований зарубежных авторов по проблеме исследования стоит выделить исследования R. Dubey с соавторами [9], R. Esmeli, M. Bader-El-Den, H. Abdullahi [10], N. Hicham, S. Karim [11], S. Kaggwa с соавторами [12] и др.

Среди отечественных исследований также наблюдается повышенный интерес к проблематике больших данных в бизнесе. Так, М.Л. Алиева и Р.Р. Ми-сирли изучают ключевые направления, задачи и результаты углубленного анализа больших данных, подчеркивая его практическую ценность для разработки современных компьютерных технологий, используемых в бизнес-планировании и управлении. Авторы акцентируют внимание на значении аналитики больших данных как важнейшего инструмента в создании инновационных подходов к управлению [13]. Ш. Яз-гельдиев, Т. Абаев и Б. Гурбанмырадов анализируют успешные примеры внедрения передовых технологий, включая машинное обучение и предиктивную аналитику, демонстрируя их способность существенно повышать эффективность бизнеса [14]. В.А. Махнев провел исследование применения технологий Big Data в различных секторах экономики, как в России, так и за рубежом. Автор рассматривает банковскую

сферу, ритейл и социальный сектор и делает вывод, что в условиях постиндустриального общества, где информация и интеллектуальные ресурсы приобретают стратегическое значение, ведение бизнеса без использования цифровых данных и информационных технологий невозможно [15].

Термин «большие данные» был впервые введен в 2008 году редактором журнала Nature К. Линчем в тематическом выпуске, посвященном стремительному росту объемов информации в глобальном масштабе. Однако сама концепция Big Data зародилась значительно раньше. Под этим понятием понимаются потоки информации, ежедневный объем которых превышает 100 гигабайт [16]. Как отмечает Д.А. Самойленко, большие данные представляют собой объемные информационные массивы, обработка которых требует применения инновационных подходов. Такие технологии обеспечивают возможность извлечения ценных знаний для обоснованного принятия управленческих решений [17]. М.Д. Акгаев с соавторами определяют Big Data как комплекс методов, инструментов и технологий, предназначенных для анализа как структурированной, так и неструктурированной информации. При этом обработка охватывает данные из множества независимых источников, что позволяет преобразовывать их в удобные для восприятия человеком формы [18]. Основные характеристики больших данных описываются через концепцию пяти V (см. Рисунок 1).

При работе с большими объемами данных широко используются алгоритмы машинного обучения, которые обеспечивают эффективное извлечение полезной информации и высокую точность прогнозов. Машинное обучение, являясь важным направлением в области искусственного интеллекта, разрабатывает алгоритмы и модели, которые предоставляют ком-

пьютерным системам возможность самостоятельно анализировать данные, обучаться на их основе и применять полученные знания для прогнозирования или принятия решений. Основополагающая идея этого подхода заключается в способности систем к самообучению, что исключает необходимость в жестком программировании всех выполняемых операций. Вместо создания специализированного программного обеспечения для решения конкретных задач машинное обучение использует обучающие наборы данных. В ходе анализа модель распознает закономерности и выявляет скрытые взаимосвязи, которые в дальнейшем применяются для интерпретации новых данных, а также для решения сложных аналитических и управленческих задач [20].

Большие объемы данных предоставляют глубоким нейронным сетям разнообразие примеров, необходимое для их продуктивного обучения. Это, в свою очередь, способствует выявлению фундаментальных закономерностей и позволяет моделям адаптироваться к различным условиям и задачам. Напротив, ограниченность данных может привести к переобучению, снижению способности к обобщению и уменьшению точности при анализе сложных зависимостей [21].

Среди ключевых методов, применяемых для анализа больших данных, можно выделить несколько типов алгоритмов (см. Таблицу 1).

Основные типы алгоритмов и их применение в анализе больших данных представлены в Таблице 2.

Технологии, предназначенные для извлечения, преобразования и загрузки данных (ETL – Extract, Transform, Load), включают в себя популярные решения, такие как MS Power BI, Qlik, Tableau, а также функциональные модули Power Query, Power Pivot и Power View. Для эффективного хранения крупных массивов

Большие данные характеризуются огромным объемом, который может составлять терабайты, петабайты или даже эксабайты ч/

  • •    Объем

Большие данные генерируются и обрабатываются с высокой скоростью, что требует технологий потоковой передачи данных к/

  • •    Скорость

Большие данные могут иметь различные форматы, такие как структурированные, неструктурированные и полуструктурированные данные

><

•Разнообразие —

Большие данные имеют потенциальную ценность, но требуют обработки и анализа для извлечения ценной информации

• Ценность

Большие данные могут содержать неполные или неточные данные, требуя тщательного управления

качеством данных

• Истинность

Рисунок 1. Свойства больших данных Источник: [19]

[ 147□

Таблица 1

Тип алгоритма

Описание

Примеры применения

Кластеризация

Группировка данных по схожим характеристикам для выявления закономерностей и структур

Сегментация клиентов

Выявление мошеннических действий

Генетические исследования

Классификация

Предсказание категорий или классов на основе обучающей выборки

Распознавание изображений Классификация текстов Анализ медицинских данных

Регрессия

Прогнозирование числовых значений на основании зависимостей в обучающем наборе данных

Оценка продаж

Прогноз цен на рынке

Анализ экономических трендов

Обработка естественного языка (NLP)

Анализ и интерпретация текстовой информации, извлечение смысловых связей

Анализ отзывов клиентов

Мониторинг социальных медиа

Разработка чат-ботов и голосовых ассистентов

Алгоритмы машинного обучения

Методы автоматического обучения моделей для извлечения информации и выполнения прогнозов

Предиктивная аналитика Рекомендательные системы Оптимизация бизнес-процессов

Ключевые алгоритмы анализа больших данных

Источник: составлено автором

Алгоритмы машинного обучения и анализа больших данных

Таблица 2

Категория

Подкатегория/метод

Описание

Нейронные сети

Сверточные нейронные сети (CNN)

Анализируют пространственные данные, включая изображения и видео

Рекуррентные нейронные сети (RNN)

Работают с последовательными данными, такими как текст, аудио и временные ряды

Двухнаправленные RNN (BiRNN)

Учитывают зависимость как в прямом, так и в обратном порядке в последовательных данных

Глубокие нейронные сети (DNN)

Моделируют сложные зависимости между переменными, подходят для различных задач

Трансформеры (Transformers)

Современные модели для обработки последовательностей, эффективные в задачах NLP и других областях

Деревья решений и ансамбли

Случайный лес

Комбинирует несколько деревьев решений для повышения точности и уменьшения переобучения

Градиентный бустинг

Улучшает модель за счет последовательного добавления слабых моделей и исправления ошибок

Extra Trees

Усиленный метод случайных лесов с улучшенной обработкой признаков

AdaBoost

Алгоритм бустинга, оптимизирующий веса данных для улучшения точности классификации

Кластеризация

K-means

Группирует данные в кластеры на основе сходства

Mini Batch K-means

Быстрая версия K-means для работы с большими данными

DBSCAN

Обнаруживает кластеры произвольной формы и выделяет аномалии

HDBSCAN

Расширяет DBSCAN, автоматически определяя оптимальное количество кластеров

Spectral Clustering

Основан на графовых теориях для кластеризации сложных структур данных

Продолжение таблицы 2

Регрессия и классификация

Линейная регрессия

Прогнозирует числовые значения, используя линейные зависимости

Множественная регрессия

Учитывает несколько независимых переменных для прогноза одной целевой переменной

Логистическая регрессия

Оценивает вероятность отнесения объекта к определённой категории

Ridge Regression

Линейная регрессия с регуляризацией для предотвращения переобучения

Lasso Regression

Метод линейной регрессии, который использует L1-регуляризацию для отбора признаков

Обработка

естественного языка (NLP)

Word2Vec

Преобразует слова в числовые векторы для упрощения их анализа и обработки

Fast Text

Быстрая и улучшенная версия Word2Vec, учитывающая морфологические свойства слов

BERT

Модель для анализа контекста и смысла текста, эффективная в задачах NLP

GPT (Generative Pre-trained Transformer)

Модель для генерации текста и работы с естественным языком

ELMo

Учитывает контекстное представление слов, подходящее для задач семантического анализа

Источник: [22]

Модель, разработанная компанией Google, позволяет организовывать распределённые вычисления на кластерах, что обеспечивает обработку больших объёмов данных

•MapReduce

Хранилища данного типа не требуют предварительного задания схемы, что позволяет легко сохранять и извлекать данные любого формата

•NoSQL (Not Structured Query Language)

Платформа для распределённой обработки больших наборов данных, отличающаяся надёжностью, масштабируемостью и использованием простых программных моделей

•Hadoop

Среди наиболее распространённых языков, применяемых в данной сфере, выделяются R, Python, Scala и Java

•Языки программирования для работы с Big Data

Рисунок 2. Технологии и инструменты для работы с большими даннымиИсточник: [25]

вают З.Р. Исраилова и её коллеги, технологиибольших данных внедряются практически во всех областях человеческой деятельности, включая IT-индустрию, энергетику, сельское хозяйство, медицину, финансовый сектор, телекоммуникации, образование и научные исследования. Масштабные информационные массивы создают основу для более точного анализа, прогнозирования и принятия решений в каждой из указанных отраслей [27]. По мнению А.В. Яншина, использование Big Data особенно заметно в индустрии туризма, где данные применяются для оптимизации процессов в авиации,гостиничном бизнесе и работе туристических агентств [28]. Исследования Б.К. Оразова и А.М. Нобатова показывают, что каждое направление адаптирует технологии Big Data под свои задачи, включая повышение точности управления внутренними процессами, персонализацию услуг и выбор оптимальных инвестиционных стратегий [29].

Интеграция искусственного интеллекта и технологий больших данных активно развивается в таких отраслях, как маркетинг, финансы, логистика и транспорт. Н.Э. Тарусина и А.С. Ртище отмечают, что использование ИИ в маркетинге способствует глубокому анализу потребительских предпочтений, разработке персонализированных рекламных кампаний и повышению конверсии [30]. В финансовой сфере искусственный интеллект анализирует инвестиционные возможности, прогнозирует рыночные изменения и улучшает управление портфелями активов. В логистике применение интеллектуальных систем позволяет оптимизировать маршруты доставки, сокращать время выполнения заказов и минимизировать ошибки. Анализ больших данных также выводит маркетинговые стратегии на новый уровень, предоставляя компаниям доступ к информации о поведении клиентов, рыночных тенденциях и потенциальных рисках [3134]. Н.А. Худайбедиева подчеркивает, что данные применяются практически во всех подразделениях орга-

низаций – от HR до продаж, способствуя ускорению выхода продуктов на рынок, снижению затрат и повышению удовлетворенности потребителей [35].

В логистике технологии Big Data обеспечивают создание адаптивных систем управления цепями поставок. Они позволяют прогнозировать клиентские потребности, оптимизировать маршруты и снижать затраты. Как отмечает А. Дурдыгылыджова, ключевым преимуществом их применения является повышение эффективности на всех этапах, включая управление запасами и транспортировку [36]. Так, Amazon и DHL демонстрируют успешные примеры внедрения аналитических решений. Amazon использует алгоритмы машинного обучения для оптимизации логистических процессов, DHL сокращает затраты и ускоряет доставку с помощью аналитики.

В розничной торговле технологии больших данных помогают разрабатывать персонализированные предложения. Так, сеть «Лента» внедрила системы для создания индивидуальных скидок, а Kroger добилась увеличения доли продаж по купонам с 3,7 до 70 % благодаря персонализированным рассылкам.

Подбор персонала также становится эффективнее благодаря Big Data. Роботизированные рекрутеры, разработанные Stafory, автоматизируют отбор резюме, предварительные звонки и оценку кандидатов. Примером успешной интеграции является PepsiCo, где подобные системы покрывают до 10 % потребностей в кадрах. Успешная реализация стратегий на базе Big Data требует трансформации корпоративной культуры и подходов к управлению. Компании, освоившие методы работы с большими данными, получают существенное конкурентное преимущество и открывают возможности для внедрения инноваций [37-39]. Применение передовых платформ, таких как Apache Hadoop, Apache Spark и TensorFlow, позволяет значительно повысить качество обработки данных, а

решения HDFS и Cassandra обеспечивают надежное хранение и доступность информации [40].

Как отмечает М.И. Чажаев с соавторами, внедрение технологий больших данных открывает перед предприятиями широкий спектр возможностей, сопровождаемых серьезными вызовами. Одной из ключевых задач становится осознание руководителями роли финансового управления как основы для устойчивого развития компании [41]. Применение Big Data требует улучшения координации между структурными подразделениями и внедрения инновационных подходов к финансовому менеджменту. По мнению Д.А. Кривоносова и Н.В. Польшаковой, отказ от традиционных методов анализа в пользу предиктивных инструментов дает бизнесу возможность не только

повысить точность прогнозов, но и вывести управленческий учет на качественно новый уровень. Сбор и обработка данных о поведении клиентов, действиях конкурентов и рыночной динамике позволяют сформировать всестороннее представление об эффективности функционирования бизнес-процессов [42]. Тем не менее, успешная интеграция технологий Big Data требует масштабной модернизации инфраструктуры компании – установки современных аналитических систем, а также подготовки специалистов, обладающих компетенциями в области работы с большими массивами данных. Важным условием для реализации таких преобразований является готовность управленческой команды принимать стратегические решения, основанные на результатах углубленного анализа.

Статья научная