Интерпретируемые методы машинного обучения в анализе факторов продаж на маркетплейсах

Бесплатный доступ

Введение. Цифровые торговые площадки представляют собой сложные и стремительно развивающиеся экосистемы, в которых на результаты продаж влияет комплексное взаимодействие поведения потребителей, стратегий продавцов и алгоритмических механизмов самих платформ. Понимание того, какие ключевые факторы и каким образом воздействуют на продажи в условиях высокой размерности данных, частых управленческих вмешательств и значительной взаимозависимости переменных, остается актуальной и методологически сложной задачей. Цель. Разработка и апробация основанного на данных (data-driven) модульного подхода к выявлению и анализу факторов, влияющих на объем продаж, с учетом специфики функционирования маркетплейсов. Материалы и методы. Предлагаемый подход основан на применении методов машинного обучения XGBoost и Random Forest. Для обеспечения адаптивности применяется обучение моделей по принципу скользящего окна с триггерами, реагирующими на изменения в распределении данных. Оценка вклада признаков осуществляется с использованием метода SHapley Additive exPlanations. Апробация подхода проведена на данных, собранных на маркетплейсе Wildberries и охватывающих 36 недель, которые содержат 56 448 наблюдений по 1568 товарным позициям. Результаты. Анализ показал, что наибольшее влияние на объем продаж оказывают факторы, связанные с поисковой видимостью и пользовательской вовлеченностью, в частности количество запросов в топ-100 и количество отзывов. Ценовые и рекламные характеристики также способствуют росту продаж, но их влияние оказалось менее выраженным. Результаты исследования демонстрируют, что наибольшее влияние на прогнозируемый объем продаж оказывают стратегии, направленные на повышение позиций в поисковой выдаче и активизацию интереса со стороны пользователей. Выводы. Предложенный подход представляет собой надежную аналитическую основу для изучения цифровых каналов сбыта и может служить эффективным инструментом поддержки управленческих решений в условиях динамичной и высококонкурентной среды маркетплейсов.

Еще

Маркетплейсы, факторы продаж, методы машинного обучения, ценообразование, сценарное моделирование, рыночная динамика

Короткий адрес: https://sciup.org/147252615

IDR: 147252615   |   УДК: 33:004   |   DOI: 10.17072/1994-9960-2025-4-430-448

Interpretable machine learning methods in the analysis of sales drivers on marketplaces

Introduction. Digital marketplaces are complex and rapidly evolving ecosystems where sales outcomes are shaped by the intricate interplay of consumer behavior, sellers’ strategies, and the algorithmic mechanisms of the platforms themselves. To understand which key factors and how their behavior influence sales – amid high-dimensional data, frequent managerial interventions, and significant interdependence among variables – remains a relevant and methodologically challenging task. Purpose. The paper aims at developing and validating a modular, data-driven approach to identifying and analyzing the factors influencing sales volume, taking into account the specific operational characteristics of marketplaces. Materials and Methods. The proposed approach is based on machine learning methods, specifically XGBoost and Random Forest. To ensure adaptability, the models are trained by a rolling window strategy with distribution-sensitive triggers that respond to changes in data distributions. Feature contributions are evaluated with the SHAP (SHapley Additive exPlanations) method. The approach was tested on data collected from the Wildberries marketplace, covering a 36-week period and comprising 56,448 observations across 1,568 product items. Results. The analysis revealed that the most influential factors are related to search visibility and user engagement – particularly the number of queries in the top-100 and the number of product reviews. Price and advertising features also contribute to sales growth, but their impact is less pronounced. The findings further demonstrate that strategies aimed at improving search rankings and increasing user interest have the greatest effect on projected sales volumes. Conclusions. The proposed approach provides a robust analytical foundation for studying digital sales channels and can serve as an effective decision-support tool in the dynamic and highly competitive environment of online marketplaces.

Еще