Использование машинного обучения как инструмент цифровизации экономической деятельности компаний-ритейлеров
Автор: Прейс В.Е.
Журнал: Петербургский экономический журнал @gukit-journal
Рубрика: Инновационное развитие экономики и социально-культурной сферы
Статья в выпуске: 2 (40), 2023 года.
Бесплатный доступ
В статье описывается использование машинного обучения, как инструмент цифровизации экономической деятельности компаний - игроков рынка розничной торговли Российской Федерации. В настоящее время машинное обучение является одним из основных инструментов цифровизации современной российской экономики, но в связи со спецификой рынка розничной торговли и отсутствием подобного опыта, очень малое количество организаций внедряют этот инструмент в свою деятельность. В статье предлагается комплекс показателей, помогающий оценить эффективность и результативность бизнес - процессов, до и после внедрения моделей машинного обучения, расчет которых является для каждого ритейлера уникальным. Особое внимание уделено алгоритмам машинного обучения, применяемым к деятельности компаний ритейлеров для улучшения двух основных процессов их деятельности, а именно процессу ценообразования и процессу выбора поставщика. Автором предлагается алгоритм внедрения моделей машинного обучения, который уже прошёл апробацию в двух крупных организациях и находится в постоянном использовании. Данный алгоритм является базовым алгоритмом перехода ритейлера к использованию машинного обучения, при этом компания должна сама определять обучающие признаки в соответствии со спецификой своей экономической деятельности.
Ритейл, управление качеством, розничная торговля, удовлетворенность потребителя, экономическая эффективность, результативность, машинное обучение, линейная регрессия, логистическая регрессия, канал дистрибуции
Короткий адрес: https://sciup.org/140300858
IDR: 140300858
Текст научной статьи Использование машинного обучения как инструмент цифровизации экономической деятельности компаний-ритейлеров
Розничная торговля является одним из наиболее распространенных видов бизнеса в Российской Федерации. В текущих экономических условиях ритейлеры вынуждены адаптироваться под любые изменения. Двумя основными рычагами влияния на розничный бизнес являются наличие параллельного импорта и цифровизация российской экономики. В связи с уходом ряда производителей из нашей страны ритейлеры для поддержания высокого уровня наполнения ассортиментной матрицы сотрудничают со всеми поставщиками, предлагающими дефицитный товар. Это приводит к снижению качества продукции и повышению уровня цен, что негативно сказывается на экономических показателях компании. Именно эта проблема и является своего рода платформой для перехода к цифровизации деятельности ритейлера. В статье описан алгоритм, применяемый организациями, который помогает выбирать оптимального поставщика, а также поддерживать конкурентный уровень цен. Актуальность данной статьи обусловлена тем, что в условиях современного рынка розничной торговли, которому присуща высокая конкуренция и постоянная борьба за потребителя, лидерами остаются те организации, чьи потребители уверены в том, что приобретают качественную продукцию по доступной цене, но при этом поддерживают стабильные экономические показатели компании на рынке. В условиях развития цифровизации экономики в нашей стране одним из наиболее перспективных направлений для ритейлера является автоматизация процессов его деятельности. Практиче ская значимость статьи заключается в том, что результаты данного исследования могут применяться на практике компаний-ритейлеров в любой сфере экономики с целью повышения удовлетворенности потребителя качеством продукции при понижении уровня затрат.
Методы исследования
Автор изучил научную литературу , а также ознакомился с результатами исследований , затрагивающих подобную проблему в других отраслях экономики , в результате чего допол нил существующую практику использования моделей машинного обучения и предложил авторское видение данного вопроса в виде ал горитма автоматизации основных бизнес - про - цессов компаний розничных сетей . В результа те проведенных экспериментов с различными моделями машинного обучения был выполнен системный анализ деятельно сти крупного ритейлера , а также разработан программный продукт , который лег в основу изменения про цессов ценообразования и выбора поставщика .
Результаты и дискуссия
Розничные магазины играют решающую роль в повседневной жизни современных лю дей . Ритейлеры предоставляют потребителям доступ к широкому спектру товаров и услуг по всему миру . Розничный бизнес помогает поддерживать экономику страны и создавать дополнительные рабочие места .
Розничный бизнес, или ритейл, – это часть более крупной системы, называемой цепочкой поставок, которая основывается на продаже товаров конечным потребителям. Розничная торговля является важнейшей частью этой цепочки, поскольку она связывает производителя с потребителем. Ритейлеры связываются с поставщиками и покупают товары в больших количествах. После этого они продают эти товары в небольших количествах покупателям, чтобы получить прибыль. Заключив сделку с производителем, розничные сети могут предложить потребителям широкий ассортимент продукции.
Розничная торговля – это торговля товара ми и оказание услуг покупателям для лично го , семейного , домашнего использования , не связанного с предпринимательской деятель ностью [1]. Двумя основными субъектами розничной торговли являются покупатель и продавец , а отношения , которые возникают в системе ритейла , регулируются специальными законами , к числу которых относится закон « О защите прав потребителей » [2, 9].
Немаловажными процессами в деятель ности любого ритейлера являются процессы ценообразования и выбора поставщика .
Современное ценообразование розничных сетей происходит по результатам парсинга сайтов конкурентов . Парсинг – это автомати зированный сбор и структурирование инфор мации с сайтов при помощи программы или сервиса . Задачей этой программы , называе мой « парсер », является сбор информации в соответствии с заданными параметрами [3]. Такой подход к ценообразованию является самым распространенным и используется в российском ритейле уже очень давно . Цель крупной розничной сети в области ценообра зования – предоставить конкурентоспособную стоимость товаров , сохранив при этом высокий уровень заработка для ритейлера . Именно по этому сейчас активно вводится интеграция мо делей машинного обучения в данный процесс .
Согласно ГОСТ Р 59895–2021 машинное обучение определено как процесс автомати ческого обучения и совершенствования пове дения системы искусственного интеллекта на основе обработки массива обучающих данных без явного программирования [4].
Модель машинного обучения – это файл , ко торый обучен распознавать определенные типы закономерностей . Вы обучаете модель на осно ве набора данных , предоставляя ей алгоритм , который она может использовать для анализа и обучения на основе этих данных [5, 10].
Согласно модели потребительского выбора «цена – ожидание» потребители оценивают товары, сравнивая фактическую цену с эталонной или ожидаемой ценой, определяемой исходя из качества продукта и соотношения цены и качества категории товара.
Выбор правильных поставщиков имеет огромное значение для розничного бизнеса . Это довольно сложная задача для любой ком пании , особенно в случае непрямых закупок , т . е . связанных с рыночным продуктом или услугой .
Поэтому , прежде чем принимать какое - ли бо решение , ритейлер должен учитывать все риски и брать ответственность во время пере говоров , чтобы в будущем быть уверенным при выборе новых поставщиков .
Несмотря на то что цена является очень важным фактором в выстраивании бизнес - от - ношений с поставщиками , она является лишь одним из требований , которое необходимо учитывать при выборе поставщиков .
Чтобы избежать проблем , ритейлер должен отдавать предпочтение партнерам , которые соответствуют целям компании , ответственно подходят к качеству поставляемой продукции и срокам выполнения .
В этом контексте компаниям , которые хотят сохранить хорошую репутацию и повысить свои конкурентные преимущества , следует внимательно относиться к приверженности поставщиков к использованию надежных ло гистических компаний , а также к наличию у них системы менеджмента качества .
Самыми распространенными алгоритмами машинного обучения в розничной торговле являются логистическая регрессия , дерево принятия решений и линейная регрессия .
Дерево принятия решений – это метод под держки принятия решений , основанный на использовании древовидного графа : модели принятия решений , которая учитывает их по тенциальные последствия ( с расчётом вероят ности наступления того или иного события ), эффективность , ресурсозатратность .
Для бизнес-процессов это дерево складывается из минимального числа вопросов, предполагающих однозначный ответ – «да» или «нет». Последовательно дав ответы на все эти вопросы, мы приходим к правильному выбору. Методологические преимущества дерева принятия решений состоят в том, что оно структурирует и систематизирует проблему, а итоговое решение принимается на основе логических выводов [6, 11].
Логистическая регрессия – это способ определения зависимости между переменны ми , одна из которых категориально зависима , а другие независимы . Для этого применяется логистическая функция ( аккумулятивное ло гистическое распределение ). Практическое значение логистической регрессии заключа ется в том , что она является мощным стати стическим методом предсказания событий , который включает в себя одну или несколько независимых переменных [7, 12].
Логистическую регрессию , выполняющую задачу бинарной классификации , а также де рево принятия решений принято оценивать по средствам показателя accuracy и построением кривой ошибок .
Кривая ошибок – график , позволяющий оценить качество бинарной классификации , отображает соотношение между долей объектов от общего количества носителей признака , вер но классифицированных как несущие признак .
Подвидом логистической регрессии явля ется линейная регрессия . Линейная регрес сия – это метод анализа данных , который предсказывает ценность неизвестных данных с помощью другого связанного и известного значения данных . Он математически модели рует неизвестную или зависимую переменную и известную или независимую переменную в виде линейного уравнения . Например , предпо ложим , что у вас есть данные о ваших расходах и доходах за прошлый год . Методы линейной регрессии анализируют эти данные и опреде ляют , что ваши расходы составляют половину вашего дохода . Затем они рассчитывают не известные будущие расходы , сокращая вдвое будущий известный доход [8, 14].
Линейная регрессия оценивается при по мощи диаграммы рассеивания .
Диаграмма рассеивания – это график , кото рый изображает значения двух переменных в виде точек на декартовой плоскости . Чем ближе количество точек к линии линейной регрессии , тем точнее модель линейной регрессии [13].
Суть использования моделей машинного обучения в ценообразовании сводится к поиску, анализу, предобработке и загрузке характеристик, влияющих на цену, на основе которых обученная модель выдаст решение о конечной цене.
В розничной сети также принято использо вать модели машинного обучения при выборе поставщика . Сам процесс закупа в каждой розничной сети состоит по - разному , но любая розничная сеть оценивает результативность своей закупки по средствам воронки закупа .
Воронка закупа – это закупочная модель , которая описывает предполагаемый путь по ставщика , начиная с формирования заявки и заканчивая покупкой товара у поставщика . Количество этапов в воронке закупа опреде ляется в каждой организации по - разному , это зависит от объема закупаемого товара и раз меров розничной сети . Показателем , который оценивает этапы воронки закупа , является конверсия . Конверсия – это процентное отно шение каждого последующего этапа к преды дущему . Она позволяет оценить результатив ность каждого этапа и определить проблемные участки . Также на основе воронки продаж принято рассчитывать общую конверсию .
Для определения и оценки причин , влия ющих на низкую конверсию на этапах закупа , используют методы мозгового штурма , а также диаграмму Парето .
Метод мозгового штурма – это метод , осно ванный на коллективной оценке сложившейся ситуации со стороны экспертной группы . Создавая экспертную группу для мозгового штурма низкой конверсии воронки закупа , в неё стараются включить участников всех эта пов воронки закупа . В такую группу входят как менеджеры и аналитики , так и технические эксперты и коммерческие специалисты .
Также неотъемлемой практикой в рознич ной торговле является подсчет неликвида . Под неликвидом принято понимать товары , которые не продавались минимум 3 месяца с даты покупки . Зачастую они не продаются из - за плохого качества и неоптимального выбора цены . Борьба с неликвидом является очень важным процессом в деятельности любой современной компании , функциони рующей в отрасли розничной торговли , ведь высокая оборачиваемость товаров – залог успешной торговли .
Основной идеей анализа неликвида , при менительно к качеству продукции , является то , что при увеличении объема неликвида снижа ется и качество продукции , а следовательно , существует проблема в логистических пере возках или же проблема , связанная напрямую с поставщиком [15].
В ходе своей научной и профессиональной деятельности автор разработал и внедрил про граммное обеспечение , основанное на моделях машинного обучения в двух крупных компа ниях , одна из которых является крупнейшим ритейлером бытовой техники и электроники , а другая дистрибьютором автозапчастей . В осно ву данного программного обеспечения лег ал горитм , включающий в себя следующие шаги :
-
1) определить рассматриваемую товарную группу , на основе которой будет обучена мо дель и будет предсказываться закупочная цена ;
-
2) вместе с категорийным менеджером и группой экспертов выделить характеристики , которые будут положены в основу обучения модели ;
-
3) провести предобработку и разделение признаков товарной группы на числовые и категориальные ;
-
4) выбрать модель машинного обучения ( рекомендуется использование линейной ре грессии для предсказания закупочной цены );
-
5) обучить модель на имеющихся при знаках и получить результаты предсказания закупочной цены ;
-
6) проверить точно сть модели , а также стандартное отклонение предсказываемой переменной ;
-
7) вместе с представителями отделов логи стики и снабжения определить характеристики поставщиков ;
-
8) провести предобработку и разделение признаков поставщиков на числовые и кате гориальные ;
-
9) выбрать модель машинного обучения ( рекомендуется использование логистической регрессии для принятия решения о дальней шем сотрудничестве с поставщиком );
-
10) обучить модель на имеющихся призна ках и получить результаты предсказания сотруд ничества с поставщиком , закладывая в основу предсказанную закупочную цену ( см . шаг 5);
-
11) провести внедрение результатов опи санных мероприятий в деятельность компании ;
-
12) спустя три месяца оценить изменения показателей входного контроля , конверсию воронки закупа , динамику доли неликвида в товарной группе , динамику продаж , провести оценку удовлетворенности потребителя ;
-
13) при повышении всех показателей , ука занных в шаге 12, использовать данный алго ритм на других товарных группах . В случае понижения показателей провести повторное исследование .
Для подробной детализации описанного алгоритма далее приведена его реализация в крупной розничной торговой сети ООО « ДНС Ритейл ». В качестве рассматриваемой товарной группы была выделена категория « Ноутбуки ».
На основе экспертного мнения категорий ных менеджеров , занимающихся продвижени ем товарной группы « Ноутбуки », были пред ложены признаки , влияющие на закупочную цену ноутбука ( табл . 1).
В основу обучения модели линейной ре грессии были отобраны наиболее продающи еся ноутбуки , а сама характеристика обучаю щей выборки представлена на рис . 1.
Проанализировав полученные данные , от метим следующее : минимальное значение по лученной выборки – 18 999 р ., максимальное значение полученной выборки – 109 836 р ., среднее значение полученной выборки – 58 034 р ., стандартное отклонение составило 23 614 р ., коэффициент асимметрии составил 0,29, коэффициент эксцесса составил –0,90. Получилась отобранная выборка с плоско вершинным левосторонним распределением . Островершинность не подтвердилась , следо вательно , можно использовать полученные данные как вход на обучение модели линейной регрессии . Безусловно оптимальным рас пределением для обучения выборки является нормальное распределение , но в силу того , что средняя цена ноутбука составляет 58 000 р ., данная выборка является достоверной . Стоит отметить , что такое распределение получи лось из - за специфики товарной группы , ведь самый распространенный среди покупателей сегмент – это ноутбуки среднего класса .
Табл. 1. Обучающие признаки модели линейной регрессии
Tab. 1. Learning features of the linear regression model
Признак |
Тип признака |
Вес |
Числовой |
Диагональ экрана |
|
Объем ОЗУ |
|
Объем памяти HDD |
|
Объем видеопамяти |
|
Емкость аккумулятора |
|
Объем памяти SSD |
|
Частота обновления экрана |
|
Яркость экрана |
|
Количество ядер процессора |
|
Частота процессора |
|
Частота оперативной памяти |
|
Максимальное число потоков процессора |
|
Толщина |
|
Ширина |
|
Брэнд |
Категориальный |
Тип экрана |
|
Линейка процессора |
|
Разрешение экрана |
|
Модель видеокарты |
|
Модель процессора |
|
Конструктивное исполнение |
|
Наличие операционной системы |

Рис. 1. График распределения обучающей выборки
Fig. 1. Graph of the distribution of the training sample
Следующим этапом предложенного ал горитма стало обучение модели ядерной линейной регрессии , диаграмма рассеивания которой представлена на рис . 2.
На рисунке по оси y указана закупочная цена , а на оси x указано количество ноутбуков . Стандартное отклонение составило 8993,22 р ., а коэффициент детерминации достиг 0,853.

Рис. 2. Диаграмма рассеивания модели ядерной регрессии
Fig. 2. Scatterplot of the kernel regression model
Табл. 2. Обучающие признаки модели логистической регрессии
Tab. 2. Learning features of the logistic regression model
Признак |
Тип признака |
Цена закупочная (результат работы модели ядерной регрессии) |
Числовой |
Количество рекламаций |
|
Количество нарушений маркировки |
|
Надежность в баллах |
|
Количество заказов |
|
Наличие СМК |
Категориальный |
Наличие уникальных позиций |
Значения этих показателей являются отлич ным результатом работы модели линейной регрессии .
Следующим шагом в алгоритме стал отбор признаков для предсказания сотрудничества с поставщиками . Основные признаки поставщи ка представлены в табл . 2.
На основе приведенных признаков было проведено обучение модели логистической регрессии , кривая ошибок которой представ лена на рис . 3.
Вероятность правильного предсказания по ставщика , с которым планируется сотруд ничество , данной моделью составила 0,89. Из тестовой выборки в 1000 поставщиков она определила лишь 441 поставщика для даль нейшего сотрудничества .
Введение программного обеспечения , основанного на алгоритме автора , помогло компании ООО « ДНС Ритейл » увеличить обо рачиваемость товарной группы « Ноутбуки »,

Рис. 3. Кривая ошибок модели логистической регрессии
Fig. 3. Logistic regression model error curvel снизить долю неликвидных товаров , улучшить качество продукции , представленной на полках магазинов , и укрепить свои лидерские позиции на рынке бытовой техники и электроники .
Заключение
Востребованность среди клиентов является одним из ценнейших факторов в любой организации, именно поэтому их мнение обладает наивысшей ценностью. При рассмотрении рынка розничной торговли, или же ритейла, мнения потребителя создают своего рода требования, при соблюдении которых клиент готов продолжать взаимодействие с ритейлером. Именно эти требования и ложатся в о снову взаимоотношений между розничной сетью и её поставщиком. Приведенный в данной статье алгоритм представляет собой лишь общее описание шагов, следование которым помогает ритейлеру перейти к цифровизации своей деятельности. Подводя итог всему вышеизложенному, хочу отметить, что на практике внедрение моделей машинного обучения в розничный бизнес помогает повысить эффективность и результативность основных бизнес-процессов и удовлетворенность потребителя.
Список литературы Использование машинного обучения как инструмент цифровизации экономической деятельности компаний-ритейлеров
- ГОСТ Р 51303–99. Торговля. Термины и определения. М.: Изд-во стандартов, 1999. 1 с.
- Закон РФ №2300–1 «О защите прав потребителей» от 07.02.1992. URL: https://www.consultant.ru/document/cons_doc_LAW_305/ (дата обращения: 05.06.2023).
- Для чего нужен парсинг данных. URL: https://roistat.com/rublog/parsing/ (дата обращения: 05.06.2023).
- ГОСТР 59895–2021. Технологии искусственного интеллекта в образовании. Общие положения и терминология. М.: Изд-во стандартов, 2021. 2 с.
- What is machine-learning model? URL: https://learn.microsoft.com/ru-ru/windows/ai/windows-ml/what-is-a-machine-learning-model/ (дата обращения: 05.06.2023).
- Алексеев Г. Введение в машинное обучение. URL: https://habr.com/ru/articles/448892/ (дата обращения: 05.06.2023).
- Как легко понять логистическую регрессию? URL: https://habr.com/ru/companies/io/articles/265007/ (дата обращения: 05.06.2023).
- What is linear regression? URL: https://aws.amazon.com/ru/what-is/linear-regression/ (дата обращения: 05.06.2023).
- Сендеров Д. В. Мастер больших продаж, искусство заключать крупные контракты. М: Альпина-Паблишер, 2019. 328 с.
- Бринк Х., Ричардс Д. Машинное обучение. СПб.: Питер, 2017. 336 с.
- Вьюгин В. В. Математические основы машинного обучения и прогнозирования. М.: МЦНМО, 2014. 305 с.
- Флах П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных. М.: ДМК Пресс, 2017. 402 с.
- Бурков А. Машинное обучение без лишних слов. СПб.: Питер, 2020. 192 с.
- Шпигельхалтер Д. Искусство статистики. Как находить ответы в данных. М.: Манн, Иванов и Фебер, 2020. 450 с.
- Шурыгин А. В. Виртуализация цен в условиях конкуренции. М.: Синергия, 2013. 15 с.