Прогнозирование цены криптовалют с использованием технологий машинного обучения: LSTM против KAN
Автор: Караев А.К.
Журнал: Вестник Алтайской академии экономики и права @vestnik-aael
Рубрика: Экономические науки
Статья в выпуске: 7-2, 2025 года.
Бесплатный доступ
Технологии машинного обучения (ML), с высокой точностью прогнозируют сложное нелинейное поведение волатильного рынка криптовалют. Однако, существует острая необходимость в разработке моделей, которые не только обеспечивают высокую точность прогнозирования, но и демонстрируют надежную интерпретируемость полученных результатов. Как одна из самых передовых технологий искусственного интеллекта (ИИ), сеть Колмогорова-Арнольда (KAN) выступает в качестве многообещающей альтернативы традиционным технологиям ML, открывая новые возможности для повышения интерпретируемости моделей ИИ. Цель исследования – провести сравнительный анализ точности моделей прогнозирования цены криптовалют Биткойн (BTC), Эфириум (ETH), Лайткойн (LTC): 1) на основе рекуррентной нейронной сети (LSTM); 2) на основе нейронной сети Колмогорова-Арнольда (KAN), c учетом различных показателей адекватности (метрики точности) моделей. Результаты свидетельствуют о том, что для криптовалют BTC и ETH, модель прогнозирования KAN превосходит по всем рассмотренным показателям адекватности, модель прогнозирования LSTM, что говорит о высоком прогнозном потенциале модели KAN. С практической точки зрения, полученные результаты представляют несомненный интерес в вопросах разработки эффективной инвестиционной политики на рынке криптовалют, основанной на точных прогнозах цены криптовалют. Точное прогнозирование цены криптовалют важно для участников рынка по ряду причин, таких как построение торговых стратегий, управление рисками, определение цен, анализ настроений рынка и бизнес-приложения. Понимание динамики основных криптовалют имеет решающее значение также для политиков, учитывая их влияние на инвестиционные стратегии, эффективность рынка и нормативный надзор.
Прогнозирование, криптовалюты, машинное обучение, рекуррентные нейронные сети, LSTM, сеть Колмогорова-Арнольда
Короткий адрес: https://sciup.org/142245383
IDR: 142245383
Текст научной статьи Прогнозирование цены криптовалют с использованием технологий машинного обучения: LSTM против KAN
Появление криптовалют и технологии блокчейн вызвало огромные изменения в финансовом секторе [1]. Криптовалюты функционируют как децентрализованная цифровая валюта, облегчая одноранговые транзакции, выполняемые с высокой степенью безопасности [2]. Внедрение надежных мер безопасности способствовало широкому принятию и признанию криптовалют как важной и широко используемой торговой платформы среди инвесторов [3]. Рост криптовалют стал свидетелем значительного всплеска, что привело к повышению известности и рыночной стоимости. Рынок криптовалют, начиная с начала 2020 года, показывает аномальный всплеск доходности, с значительно более высокими колебаниями, указывающими на повышенную волатильность. Для противодействия большим колебаниям нестационарных криптовалют требуется разработка точных моделей прогнозирования их цены [4]. Прогнозирование цены криптовалют важно для участников рынка по ряду причин, таких как построение торговых стратегий, управление рисками, определение цен, анализ настроений рынка и бизнес-приложения. Понимание динамики основных криптовалют имеет решающее значение также для политиков, учитывая их влияние на инвестиционные стратегии, эффективность рынка и нормативный надзор [5].
Ранние работы в области прогнозирования цены криптовалют в основном были сосредоточены на использовании традиционных статистических методов, таких как ARIMA [6] и GARCH [7]. Однако эти методы способны выявлять только линейные закономерности во временных рядах криптовалют, а также, предполагают наличие нормального распределения переменных, что совершенно нереалистично в случае криптовалют [8].
Подходы, с использованием технологий машинного обучения могут выявлять нелинейные закономерности, а также ценную информацию из больших наборов данных, не предполагая какого-либо предварительного понимания о распределении. Однако традиционные методы машинного обучения, такие как многослойные персептроны (MLP) или машины опорных векторов (SVM) [9], страдают от некоторых проблем, таких как восприимчивость к переобучению, и не в полной мере используют потен- циал извлечения скрытых закономерностей высокого уровня из последовательных данных криптовалюты. Чтобы преодолеть эти проблемы, были использованы модели прогнозирования на основе глубокого обучения, имеющие возможность превосходить традиционные методы машинного обучения. В частности, в недавней работе [10] представили доказательства того, что нейронные сети с долговременной краткосрочной памятью (LSTM) и рекуррентными блоками (GRU) превосходят различные статистические и другие машинные методы обучения, с точки зрения ошибки прогнозирования, не только такие как ARIMA и SVM, но и более современный временной трансформер слияния (TFT – temporal fusion transformer).
Тем не менее, модели прогнозирования на основе технологий искусственного интеллекта, которые имеют наиболее высокую точность прогнозирования цены криптовалют, подвергаются критике из-за их «природы черного ящика» [11], поскольку используемые в них предположения и расчеты не всегда могут быть полностью понятны, и в этом плане, они представляют собой как шаг вперед в точности, так и шаг назад в интерпретируемости полученных результатов. Результаты прогнозов, на основе методов ML часто не поддаются интерпретации из-за их очень сложных сетевых структур. Кроме того, нет явного символического представления (например, правил, формул или древовидных структур) процесса принятия решений, что затрудняет отслеживание процесса обоснования решения модели. Отсутствие интерпретируемости затрудняет для возможных потенциальных заинтересованных лиц понимание основных особенностей и обоснования модельных прогнозов, что создает огромные риски для их использования в критически важных приложениях, таких как бюджетное планирование и бюджетный анализ, где последствия неверных решений могут вызвать серьезные экономические последствия. Поэтому существует острая необходимость в разработке моделей, которые не только обеспечивают высокую эффективность прогнозирования, но и демонстрируют надежную интерпретируемость .
Как одна из самых передовых технологий искусственного интеллекта, сеть Колмогорова-Арнольда (KAN) [12] выступает в качестве многообещающей альтернативы технологиям машинного обучения, откры- вая новые возможности для повышения интерпретируемости моделей ИИ. Ее интерпретируемость получила широкое применение, обеспечивая четкий путь понимания для таких сложных задач, как динамические системы.
Цель исследования – провести сравнительный анализ точности моделей прогнозирования временных рядов, составленных из ежедневных значений цены Бикойна (BTC), Эфириума (ETH), Лайткойна (LTC), за период (01.01.2024÷31.12.2024): 1) на основе рекуррентной нейронной сети LSTM; 2) на основе нейронной сети Колмогорова-Арнольда, учетом информационных критериев (AIC и BIC), коэффициента детерминации (R2 и Adj-R2) и показателей меры точности RMSE, MAPE в качестве меры близости между фактическими и прогнозируемыми значениями временных рядов.
Материалы и методы исследования
На рисунке представлена динамика временных рядов (BTC), (ETH), (LTC) с 01.01.2020 по 01.05.2025гг. Как видно из рисунка, наиболее драматичное изменение цены криптовалют произошло за период, с начала 2024 года до начала 2025 года: (BTC), с 40 000 до более 100 000 USD; (ETH), с 2000 до 4000 USD; (LTC), c 70 до 140 USD.
Основная цель исследования – провести сравнительный анализ точности результатов прогнозирования цены криптовалют: (BTC); (ETH); (LTC), за период (01.01.2024÷ 01.01.2025), моделей: на основе сети Колмогорова-Арнольда (KAN) и на основе рекуррентной нейронной сети LSTM.

Динамика изменения цены основных криптовалют Биткойн (BTC), Эфириум (ETH), Лайткойн (LTC) в USD, (01.01.2020÷01.05.2025)
Модель прогнозирования (KAN)
Для построения модели прогнозирования на основе сети Колмогорова-Арнольда используются основные следствия теоремы Колмогорова-Арнольда о суперпозиции, которая утверждает, что любую непрерывную функцию многих переменных можно представить в виде конечной суммы непрерывных функций одной переменной [14].
Эта теорема дает теоретическую основу способности нейронных сетей аппроксимировать сложные функции [15].
В данной работе, для практической реализации и конструирования модели прогнозирования, на основе сети Колмогорова-Арнольда (KAN), использован подход [16], в компьютерной системе Wolfram Mathematica .
Прогноз временного ряда, составленного из ежедневных значений цены (BTC),
(ETH), (LTC) с 1 января по 31 декабря 2024 года, на основе сети Колмогорова-Арнольда (KAN), был осуществлен разделением всего набора данных (наблюдений) – 354 значений, на 2 участка:
-
• с 1 до 299 – тренинговый набор данных (01.01.2024÷06.11.2024);
-
• с 300 по 354 –тестовый набор данных (07.11.2024÷31.12.2024).
Модель прогнозирования LSTM
В работе, рассмотрена модель прогнозирования LSTM на основе подхода [17]. Для дизайна модели LSTM, используется 10-слойная нейронная сеть LSTM, которую можно обучить на данных отдельных криптовалют. В работе используются три обученные нейронные сети, с 500 раундами обучения значений криптовалют (BTC; ETH; LTC), на соответствующих им тестовых наборах.
Результаты исследования и их обсуждение
Результаты сравнительного анализа точности моделей LSTM и KAN, в прогнозировании цены Бикойна (BTC), Эфи-риума (ETH), Лайткойна (LTC), за период (01.01.2024÷31.12.2024) представлены в таблице, на основе показателей: Информационный критерий Акаике, AIC; Байесовский информационный критерий, BIC; скорректированный Коэффициент детерминации, Adj-R^2; Коэффициент детерминации, R^2; среднеквадратическая ошибка, RMSE (Root Mean Square Error); средняя абсолютная процентная ошибка, MAPE (Mean Absolute Percentage Error).
Как видно из таблицы, в случае прогнозирования цены BTC и ETH, модель прогнозирования KAN, по всем показателям информационных критериев и метрики точности (AIC; BIC; Adj R^2; R^2; RMSE, MAPE) незначительно превосходит модель прогнозирования LSTM, на основе 10 слойной сети LSTM, что говорит о высоком прогнозном потенциале модели KAN в прогнозировании ежедневного нелинейного поведения цены этих криптовалют. Что касается прогнозирования цены LTC, то, как видно из таблицы, модель прогнозирования LSTM, по выбранным показателям информационных критериев и метрики точности/ошибок (AIC; BIC; Adj R^2; R^2; RMSE;) MAPE незначительно превосходит модель KAN, достигая наименьшего значения среднеквадратической ошибки (RMSE ≈ 0.0263), средней абсолютной процентной ошибки (MAPE≈0.612) и наибольшего значения коэффициента детерминации (R^2≈0.970).
Результаты сравнительного анализа точности моделей прогнозирования временных рядов, составленных из ежедневных значений цены основных криптовалют BTC, ETH, LTC за период (01.01.2024÷31.12.2024): 1) на основе нейронной сети Колмогорова-Арнольда; и 2) 10-слойной рекуррентной нейронной сети LSTM, свидетельствуют о том, что модель прогнозирования цены BTC и ETH, на основе нейронной сети Колмогорова-Арнольда (KAN) превосходит по всем выбранным показателям информационных критериев и метрики точности (AIC; BIC; Adj R^2; R^2; RMSE; MAPE) модель прогнозирования на основе 10 слойной рекуррентной нейронной сети LSTM, что подчеркивает способность моделей прогнозирования KAN улавливать сложные нелинейные связи и обеспечивать надежную производительность на сложных наборах данных. Для случая прогнозов цены Лайткойна, модель LSTM незначительно превосходит по выбранным показателям точности модель KAN, которая тем не менее продемонстрировала свою конкурентоспособность.
Полученные результат подчеркивает важный аспект модели KAN: ее производительность, как правило, превосходит все ожидания при работе с большими и сложными наборами данных и многомерными входными данными, где его расширенные возможности аппроксимации и способность моделировать сложные закономерности проявляются лучше всего. Однако на более простых наборах данных, как в случае прогнозирования цены Лайткойна, с ограниченными входными переменными, модели на основе LSTM, могут оказаться более подходящими из-за их присущей им способности оптимизировать более простые взаимодействия признаков и эффективно адаптироваться к ограниченным наборам данных.
Итоговый результат адекватности моделей прогнозирования KAN
(на основе сети Колмогорова-Арнольда) и LSTM (на основе 10 слойной рекуррентной нейронной сети) фактическим значениям временного ряда из ежедневных значений цены Биткойна (BTC), Эфириума (ETH), Лайткойна (LTC), за период (01.01.24÷31.12.24).
Криптовалюта |
Модель прогнозирования |
AIC |
BIC |
Adj-R^2 |
R^2 |
RMSE |
MAPE |
BTC |
LSTM |
–301.45 |
–295.4 |
0.946 |
0.947 |
0.03276 |
0.6540 |
KAN |
-334.20 |
-328.20 |
0.969 |
0.970 |
0.01038 |
0.5380 |
|
ETH |
LSTM |
-148.40 |
-142.38 |
0.955 |
0.956 |
0.00893 |
0.6870 |
KAN |
-392.64 |
-386.67 |
0.957 |
0.958 |
0.00603 |
0.5980 |
|
LTC |
LSTM |
-233.57 |
-227.55 |
0.970 |
0.970 |
0.0263 |
0.6120 |
KAN |
-212.65 |
-206.68 |
0.9666 |
0.967 |
0.0319 |
0.6090 |
Источник: расчеты авторов.
Эти результаты подчеркивают как сильные стороны, так и слабые стороны использования сетей KAN в задачах прогнозирования цены криптовалют. Модели KAN демонстрируют исключительные прогнозные способности в ситуациях, требующих аппроксимации сложных функций. Это делает такие модели особенно преобразующими для наборов данных, характеризующихся обширными наборами переменных и сложными многомерными отношениями между ними. Путем моделирования нелинейных взаимодействий и выявления тонких закономерностей в данных модели KAN часто могут превосходить традиционные методы машинного и глубокого обучения, с точки зрения точности и понимания процедуры получения результатов.
Одна из самых существенных проблем использования моделей KAN заключается в их производительности на небольших или низкоразмерных наборах данных. В таких случаях более простые модели, такие как LSTM, часто могут превосходить модели KAN из-за их способности эффективно фиксировать простые взаимосвязи с минимальными вычислительными затратами. Решение этих проблем – путем оптимизации вычислительных требований к моделям KAN и повышения их адаптивности к разнообразным наборам данных – может расширить диапазон их более широкого применения в задачах предиктивной аналитики, усиливая их потенциал как ведущей модели в передовых приложениях машинного обучения.
Заключение
Прогнозирование цены криптовалют оказывает значительное влияние на инвестиционные решения участников рынка криптовалют. С теоретической стороны результаты исследования развивают концептуальную основу построения прогностических моделей цены криптовалют, основанных на нейронных сетях Колмогорова-Арнольда (KAN), которые демонстрируют свою эффективность в прогнозировании. Результаты исследования эмпирически подтверждают высокую точность моделей прогнозирования KAN, что в совокупности с интерпретируемостью полученных результатов формирует новое направление прогностической/предиктивной аналитики. С практической стороны результаты исследования предлагает ценный инструмент прогнозирования трейдерам и инвесторам для принятия ими обоснованных решений. Новизна исследования заключается в том, что впервые эмпирически получены результаты, подтверждающие высокую прогностическую способность моделей KAN для цены широкого набора криптовалют (Биткойн, Эфириум, Лайткойн). Инвесторы, используя модели KAN в прогнозах цены криптовалют, могут повысить эффективность портфеля и снизить риск, принимая более обоснованные решения. Политики могут использовать модели KAN для разработки более эффективных правил и политик, способствующих экономической стабильности и эффективности рынка криптовалют.
Статья подготовлена по результатам исследований, выполненных за счет бюджетных средств по государственному заданию Финансовому университету.