Сравнительный анализ современных технологий больших данных и их инновационного применения в сфере услуг
Автор: Солодин А.Ю.
Журнал: Вестник Академии права и управления @vestnik-apu
Рубрика: Вопросы экономики и управления
Статья в выпуске: 1 (82), 2025 года.
Бесплатный доступ
Статья посвящена изучению современных технологий больших данных и их инновационного использования в сфере услуг с акцентом на выявление их возможностей и преимуществ для различных отраслей. Цель работы - анализ потенциала технологий больших данных для повышения эффективности деятельности, улучшения персонализации и качества услуг, оценка их влияния на развитие цифровой трансформации. Исследование базируется на анализе научной литературы, сравнительном изучении существующих технологий и изучении практических кейсов успешного применения больших данных в ключевых секторах услуг. В статье представлены ключевые теоретические и практические результаты, включающие выявленные взаимосвязи и закономерности в использовании технологий больших данных в сфере услуг. Особое внимание уделено новым данным и долгосрочным выводам, имеющим практическую значимость. Обнаружено, что применение алгоритмов машинного обучения, облачных платформ и инструментов визуализации способствует оптимизации процессов, повышению качества персонализации и улучшению клиентского опыта. Полученные результаты опровергают ряд устаревших подходов и подтверждают необходимость внедрения инновационных решений для цифровой трансформации отрасли. Результаты исследования могут быть интегрированы в практику таких сфер, как маркетинг, логистика, здравоохранение, финансовый сектор и туризм, где требуется глубокая аналитика и обработка больших массивов данных. Технологии больших данных становятся стратегически важным инструментом для компаний, способствуя цифровой трансформации, повышению конкурентных преимуществ и созданию условий для внедрения инновационных подходов в управлении и предоставлении услуг. Перспективы дальнейших научных исследований в сфере услуг связаны с разработкой технологий, которые обеспечат более глубокую персонализацию клиентского опыта, совершенствование аналитических инструментов для прогнозирования спроса и оптимизации бизнес-процессов, а также интеграцию искусственного интеллекта и больших данных для повышения эффективности управления.
Персонализация, предиктивная аналитика, оптимизация, инновации, машинное обучение, цифровая трансформация, визуализация
Короткий адрес: https://sciup.org/14132905
IDR: 14132905 | DOI: 10.47629/2074-9201_2025_1_145_154
Текст научной статьи Сравнительный анализ современных технологий больших данных и их инновационного применения в сфере услуг
С овременные технологии больших данных становятся неотъемлемой частью трансформации сферы услуг, предоставляя возможности для глубокой аналитики, точного прогнозирования и персонализированного подхода к клиентам. Их внедрение позволяет предприятиям улучшать качество обслуживания, оптимизировать внутренние процессы и повышать конкурентоспособность в условиях стремительно развивающейся цифровой экономики.
N. Cavlak и R. Cop провели исследование, посвященное возможностям применения аналитики больших данных для повышения эффективности бизнес-процессов, уделив особое внимание способам улучшения персонализации услуг и созданию положительного клиентского опыта [1]. В свою очередь, ZhangC. и TanT. сосредоточились на изучении влияния технологий обработки больших данных на потребительское поведение. Их работа акцентирует внимание на повышении точности маркетинговых стратегий и усовершенствовании взаимодействия с клиентами [2]. В работе AdesinaA.A., IyeloluT.V., PaulP.O. исследует роль предиктивной аналитики в маркетинге. Ученые демонстрируют, каким образом обработка больших массивов информации предоставляет компаниям конкурентные преимущества, позволяя прогнозировать ключевые рыночные тенденции и изменения в поведении аудитории [3]. H. Paruchuri в своей работе рассматривает возможности использования методов машинного обучения в сочетании с большими данными для повышения эффективности сегментации рынка. Исследование демонстрирует, как такие технологии позволяют обеспечить более точное целевое позиционирование продуктов и усовершенствовать персонализированный подход к взаимодействию с клиентами [4]. Ying L.J., Lasi M.A. анализируют трансформацию стратегий коммуникации и вовлечения в контексте онлайн-брендинга. В их исследовании акцент сделан на изменении принципов управления брендами под влиянием инновационных подходов, основанных на данных [5]. I.M. Comfort, J.I. Oluwaseun, D.A. Adejoke с соавторами анализируют
использование различных инструментов и методик для принятия решений на основе данных. В их исследовании акцентирует внимание на совершенствовании стратегического планирования и оптимизации операционной деятельности компаний [6]. Zhan Y., TanK.H., LiY., TseM. рассматривают потенциал применения больших данных в разработке новых продуктов; ученые описывают процесс, охватывающий все стадии, – от создания концепции до вывода продукта на рынок, подчеркивая значимость повышения эффективности на каждом этапе [7]. В работе Wassouf W.N. и коллег предлагается кейс-стадия, демонстрирующая, как аналитика больших данных способствует укреплению клиентской лояльности. Основное внимание уделено созданию и реализации персонализированных маркетинговых подходов, направленных на повышение удовлетворенности клиентов [8]. Среди других значимых исследований зарубежных авторов по проблеме исследования стоит выделить исследования R. Dubey с соавторами [9], R. Esmeli, M. Bader-El-Den, H. Abdullahi [10], N. Hicham, S. Karim [11], S. Kaggwa с соавторами [12] и др.
Среди отечественных исследований также наблюдается повышенный интерес к проблематике больших данных в бизнесе. Так, М.Л. Алиева и Р.Р. Ми-сирли изучают ключевые направления, задачи и результаты углубленного анализа больших данных, подчеркивая его практическую ценность для разработки современных компьютерных технологий, используемых в бизнес-планировании и управлении. Авторы акцентируют внимание на значении аналитики больших данных как важнейшего инструмента в создании инновационных подходов к управлению [13]. Ш. Яз-гельдиев, Т. Абаев и Б. Гурбанмырадов анализируют успешные примеры внедрения передовых технологий, включая машинное обучение и предиктивную аналитику, демонстрируя их способность существенно повышать эффективность бизнеса [14]. В.А. Махнев провел исследование применения технологий Big Data в различных секторах экономики, как в России, так и за рубежом. Автор рассматривает банковскую
сферу, ритейл и социальный сектор и делает вывод, что в условиях постиндустриального общества, где информация и интеллектуальные ресурсы приобретают стратегическое значение, ведение бизнеса без использования цифровых данных и информационных технологий невозможно [15].
Термин «большие данные» был впервые введен в 2008 году редактором журнала Nature К. Линчем в тематическом выпуске, посвященном стремительному росту объемов информации в глобальном масштабе. Однако сама концепция Big Data зародилась значительно раньше. Под этим понятием понимаются потоки информации, ежедневный объем которых превышает 100 гигабайт [16]. Как отмечает Д.А. Самойленко, большие данные представляют собой объемные информационные массивы, обработка которых требует применения инновационных подходов. Такие технологии обеспечивают возможность извлечения ценных знаний для обоснованного принятия управленческих решений [17]. М.Д. Акгаев с соавторами определяют Big Data как комплекс методов, инструментов и технологий, предназначенных для анализа как структурированной, так и неструктурированной информации. При этом обработка охватывает данные из множества независимых источников, что позволяет преобразовывать их в удобные для восприятия человеком формы [18]. Основные характеристики больших данных описываются через концепцию пяти V (см. Рисунок 1).
При работе с большими объемами данных широко используются алгоритмы машинного обучения, которые обеспечивают эффективное извлечение полезной информации и высокую точность прогнозов. Машинное обучение, являясь важным направлением в области искусственного интеллекта, разрабатывает алгоритмы и модели, которые предоставляют ком-
пьютерным системам возможность самостоятельно анализировать данные, обучаться на их основе и применять полученные знания для прогнозирования или принятия решений. Основополагающая идея этого подхода заключается в способности систем к самообучению, что исключает необходимость в жестком программировании всех выполняемых операций. Вместо создания специализированного программного обеспечения для решения конкретных задач машинное обучение использует обучающие наборы данных. В ходе анализа модель распознает закономерности и выявляет скрытые взаимосвязи, которые в дальнейшем применяются для интерпретации новых данных, а также для решения сложных аналитических и управленческих задач [20].
Большие объемы данных предоставляют глубоким нейронным сетям разнообразие примеров, необходимое для их продуктивного обучения. Это, в свою очередь, способствует выявлению фундаментальных закономерностей и позволяет моделям адаптироваться к различным условиям и задачам. Напротив, ограниченность данных может привести к переобучению, снижению способности к обобщению и уменьшению точности при анализе сложных зависимостей [21].
Среди ключевых методов, применяемых для анализа больших данных, можно выделить несколько типов алгоритмов (см. Таблицу 1).
Основные типы алгоритмов и их применение в анализе больших данных представлены в Таблице 2.
Технологии, предназначенные для извлечения, преобразования и загрузки данных (ETL – Extract, Transform, Load), включают в себя популярные решения, такие как MS Power BI, Qlik, Tableau, а также функциональные модули Power Query, Power Pivot и Power View. Для эффективного хранения крупных массивов
Большие данные характеризуются огромным объемом, который может составлять терабайты, петабайты или даже эксабайты ч/
-
• Объем
Большие данные генерируются и обрабатываются с высокой скоростью, что требует технологий потоковой передачи данных к/
-
• Скорость
Большие данные могут иметь различные форматы, такие как структурированные, неструктурированные и полуструктурированные данные
><
•Разнообразие —
Большие данные имеют потенциальную ценность, но требуют обработки и анализа для извлечения ценной информации
• Ценность
Большие данные могут содержать неполные или неточные данные, требуя тщательного управления |
качеством данных |
• Истинность
Рисунок 1. Свойства больших данных Источник: [19]
[ 147□
Таблица 1
Тип алгоритма |
Описание |
Примеры применения |
Кластеризация |
Группировка данных по схожим характеристикам для выявления закономерностей и структур |
Сегментация клиентов Выявление мошеннических действий Генетические исследования |
Классификация |
Предсказание категорий или классов на основе обучающей выборки |
Распознавание изображений Классификация текстов Анализ медицинских данных |
Регрессия |
Прогнозирование числовых значений на основании зависимостей в обучающем наборе данных |
Оценка продаж Прогноз цен на рынке Анализ экономических трендов |
Обработка естественного языка (NLP) |
Анализ и интерпретация текстовой информации, извлечение смысловых связей |
Анализ отзывов клиентов Мониторинг социальных медиа Разработка чат-ботов и голосовых ассистентов |
Алгоритмы машинного обучения |
Методы автоматического обучения моделей для извлечения информации и выполнения прогнозов |
Предиктивная аналитика Рекомендательные системы Оптимизация бизнес-процессов |
Ключевые алгоритмы анализа больших данных
Источник: составлено автором
Алгоритмы машинного обучения и анализа больших данных
Таблица 2
Категория |
Подкатегория/метод |
Описание |
Нейронные сети |
Сверточные нейронные сети (CNN) |
Анализируют пространственные данные, включая изображения и видео |
Рекуррентные нейронные сети (RNN) |
Работают с последовательными данными, такими как текст, аудио и временные ряды |
|
Двухнаправленные RNN (BiRNN) |
Учитывают зависимость как в прямом, так и в обратном порядке в последовательных данных |
|
Глубокие нейронные сети (DNN) |
Моделируют сложные зависимости между переменными, подходят для различных задач |
|
Трансформеры (Transformers) |
Современные модели для обработки последовательностей, эффективные в задачах NLP и других областях |
|
Деревья решений и ансамбли |
Случайный лес |
Комбинирует несколько деревьев решений для повышения точности и уменьшения переобучения |
Градиентный бустинг |
Улучшает модель за счет последовательного добавления слабых моделей и исправления ошибок |
|
Extra Trees |
Усиленный метод случайных лесов с улучшенной обработкой признаков |
|
AdaBoost |
Алгоритм бустинга, оптимизирующий веса данных для улучшения точности классификации |
|
Кластеризация |
K-means |
Группирует данные в кластеры на основе сходства |
Mini Batch K-means |
Быстрая версия K-means для работы с большими данными |
|
DBSCAN |
Обнаруживает кластеры произвольной формы и выделяет аномалии |
|
HDBSCAN |
Расширяет DBSCAN, автоматически определяя оптимальное количество кластеров |
|
Spectral Clustering |
Основан на графовых теориях для кластеризации сложных структур данных |
Продолжение таблицы 2
Регрессия и классификация |
Линейная регрессия |
Прогнозирует числовые значения, используя линейные зависимости |
Множественная регрессия |
Учитывает несколько независимых переменных для прогноза одной целевой переменной |
|
Логистическая регрессия |
Оценивает вероятность отнесения объекта к определённой категории |
|
Ridge Regression |
Линейная регрессия с регуляризацией для предотвращения переобучения |
|
Lasso Regression |
Метод линейной регрессии, который использует L1-регуляризацию для отбора признаков |
|
Обработка естественного языка (NLP) |
Word2Vec |
Преобразует слова в числовые векторы для упрощения их анализа и обработки |
Fast Text |
Быстрая и улучшенная версия Word2Vec, учитывающая морфологические свойства слов |
|
BERT |
Модель для анализа контекста и смысла текста, эффективная в задачах NLP |
|
GPT (Generative Pre-trained Transformer) |
Модель для генерации текста и работы с естественным языком |
|
ELMo |
Учитывает контекстное представление слов, подходящее для задач семантического анализа |
Источник: [22]
Модель, разработанная компанией Google, позволяет организовывать распределённые вычисления на кластерах, что обеспечивает обработку больших объёмов данных
•MapReduce
Хранилища данного типа не требуют предварительного задания схемы, что позволяет легко сохранять и извлекать данные любого формата
•NoSQL (Not Structured Query Language)
Платформа для распределённой обработки больших наборов данных, отличающаяся надёжностью, масштабируемостью и использованием простых программных моделей
•Hadoop
Среди наиболее распространённых языков, применяемых в данной сфере, выделяются R, Python, Scala и Java
•Языки программирования для работы с Big Data
Рисунок 2. Технологии и инструменты для работы с большими даннымиИсточник: [25]
вают З.Р. Исраилова и её коллеги, технологиибольших данных внедряются практически во всех областях человеческой деятельности, включая IT-индустрию, энергетику, сельское хозяйство, медицину, финансовый сектор, телекоммуникации, образование и научные исследования. Масштабные информационные массивы создают основу для более точного анализа, прогнозирования и принятия решений в каждой из указанных отраслей [27]. По мнению А.В. Яншина, использование Big Data особенно заметно в индустрии туризма, где данные применяются для оптимизации процессов в авиации,гостиничном бизнесе и работе туристических агентств [28]. Исследования Б.К. Оразова и А.М. Нобатова показывают, что каждое направление адаптирует технологии Big Data под свои задачи, включая повышение точности управления внутренними процессами, персонализацию услуг и выбор оптимальных инвестиционных стратегий [29].
Интеграция искусственного интеллекта и технологий больших данных активно развивается в таких отраслях, как маркетинг, финансы, логистика и транспорт. Н.Э. Тарусина и А.С. Ртище отмечают, что использование ИИ в маркетинге способствует глубокому анализу потребительских предпочтений, разработке персонализированных рекламных кампаний и повышению конверсии [30]. В финансовой сфере искусственный интеллект анализирует инвестиционные возможности, прогнозирует рыночные изменения и улучшает управление портфелями активов. В логистике применение интеллектуальных систем позволяет оптимизировать маршруты доставки, сокращать время выполнения заказов и минимизировать ошибки. Анализ больших данных также выводит маркетинговые стратегии на новый уровень, предоставляя компаниям доступ к информации о поведении клиентов, рыночных тенденциях и потенциальных рисках [3134]. Н.А. Худайбедиева подчеркивает, что данные применяются практически во всех подразделениях орга-
низаций – от HR до продаж, способствуя ускорению выхода продуктов на рынок, снижению затрат и повышению удовлетворенности потребителей [35].
В логистике технологии Big Data обеспечивают создание адаптивных систем управления цепями поставок. Они позволяют прогнозировать клиентские потребности, оптимизировать маршруты и снижать затраты. Как отмечает А. Дурдыгылыджова, ключевым преимуществом их применения является повышение эффективности на всех этапах, включая управление запасами и транспортировку [36]. Так, Amazon и DHL демонстрируют успешные примеры внедрения аналитических решений. Amazon использует алгоритмы машинного обучения для оптимизации логистических процессов, DHL сокращает затраты и ускоряет доставку с помощью аналитики.
В розничной торговле технологии больших данных помогают разрабатывать персонализированные предложения. Так, сеть «Лента» внедрила системы для создания индивидуальных скидок, а Kroger добилась увеличения доли продаж по купонам с 3,7 до 70 % благодаря персонализированным рассылкам.
Подбор персонала также становится эффективнее благодаря Big Data. Роботизированные рекрутеры, разработанные Stafory, автоматизируют отбор резюме, предварительные звонки и оценку кандидатов. Примером успешной интеграции является PepsiCo, где подобные системы покрывают до 10 % потребностей в кадрах. Успешная реализация стратегий на базе Big Data требует трансформации корпоративной культуры и подходов к управлению. Компании, освоившие методы работы с большими данными, получают существенное конкурентное преимущество и открывают возможности для внедрения инноваций [37-39]. Применение передовых платформ, таких как Apache Hadoop, Apache Spark и TensorFlow, позволяет значительно повысить качество обработки данных, а
решения HDFS и Cassandra обеспечивают надежное хранение и доступность информации [40].
Как отмечает М.И. Чажаев с соавторами, внедрение технологий больших данных открывает перед предприятиями широкий спектр возможностей, сопровождаемых серьезными вызовами. Одной из ключевых задач становится осознание руководителями роли финансового управления как основы для устойчивого развития компании [41]. Применение Big Data требует улучшения координации между структурными подразделениями и внедрения инновационных подходов к финансовому менеджменту. По мнению Д.А. Кривоносова и Н.В. Польшаковой, отказ от традиционных методов анализа в пользу предиктивных инструментов дает бизнесу возможность не только
повысить точность прогнозов, но и вывести управленческий учет на качественно новый уровень. Сбор и обработка данных о поведении клиентов, действиях конкурентов и рыночной динамике позволяют сформировать всестороннее представление об эффективности функционирования бизнес-процессов [42]. Тем не менее, успешная интеграция технологий Big Data требует масштабной модернизации инфраструктуры компании – установки современных аналитических систем, а также подготовки специалистов, обладающих компетенциями в области работы с большими массивами данных. Важным условием для реализации таких преобразований является готовность управленческой команды принимать стратегические решения, основанные на результатах углубленного анализа.