Детерминанты доходности биржевых инвестиционных фондов: модели машинного обучения

Автор: Королева Е.В., Полубатонова А.С., Сереженкова А.Р.

Журнал: Вестник Алтайской академии экономики и права @vestnik-aael

Рубрика: Экономические науки

Статья в выпуске: 1, 2026 года.

Бесплатный доступ

Статья посвящена выявлению детерминант доходности биржевых инвестиционных фондов на основе моделей машинного обучения. Цель исследования – определить ключевые факторы доходности ETF и сопоставить эффективность современных нелинейных и ансамблевых алгоритмов. Эмпирическая база включает данные за 2024 год по 34 странам (105 наблюдений). В работе построены и сравнены семь моделей: SVR, регрессия на решающих деревьях, Random Forest, Gradient Boosting, XGBoost, Bagging и CatBoost. Для интерпретации результатов и оценки вклада признаков применялся SHAP-анализ. Наилучшее качество продемонстрировали модели Random Forest и регрессия на решающих деревьях, объяснившие около 65% вариации целевой переменной. SHAP-анализ показал, что спред bid-ask является наиболее значимым фактором и оказывает устойчивое положительное влияние на доходность. Процентная ставка характеризуется нелинейным воздействием: при экстремальных значениях выявляется отрицательный эффект, тогда как умеренные уровни связаны с ростом доходности. Коэффициент расходов демонстрирует стабильную отрицательную зависимость с доходностью. Гипотезы о значимом влиянии оборачиваемости портфеля и типа управления (активное/пассивное) эмпирического подтверждения не получили. Полученные результаты подтверждают целесообразность применения моделей машинного обучения, прежде всего ансамблевых моделей, для анализа и прогнозирования доходности ETF, обеспечивающих сочетание точности и интерпретируемости, и могут быть использованы при разработке инвестиционных стратегий с акцентом на спред bid-ask и контроль издержек.

Еще

Доходность ETF, модели машинного обучения, ключевые признаки, прогнозирование

Короткий адрес: https://sciup.org/142247303

IDR: 142247303   |   УДК: 336.76

Determinants of exchange-traded funds’ returns: machine learning models

This paper explores the determinants of exchange-traded fund returns using machine learning models. The objective of the study is to identify key drivers of ETF returns and compare the performance of modern nonlinear and ensemble algorithms. The empirical base includes data for 2024 for 34 countries (105 observations). Seven models are constructed and compared: SVR, decision tree regression, Random Forest, Gradient Boosting, XGBoost, Bagging, and CatBoost. SHAP analysis was used to interpret the results and assess the contribution of features. The Random Forest and decision tree regression models demonstrated the best performance, explaining approximately 65% ​​of the target variable variation. SHAP analysis revealed that spread bid-ask is the most significant factor and has a consistent positive impact on returns. The interest rate is characterized by a nonlinear impact: at extreme values, a negative effect is observed, while moderate levels are associated with increased returns. The expense ratio demonstrates a consistent negative relationship with returns. The hypotheses regarding the significant impact of portfolio turnover and management type (active/passive) were not empirically supported. The obtained results confirm the feasibility of using machine learning models, particularly ensemble methods, to analyze and forecast ETF returns, providing a combination of accuracy and interpretability, and can be used in developing investment strategies with a focus on spread bid-ask and cost control.

Еще