Форсайт сельскохозяйственного производства на основе мультимодельных ансамблей
Автор: Попова А.В., Ловчикова Е.И., Шестаков Р.Б.
Журнал: Научный журнал молодых ученых @young-scientists-journal
Рубрика: Экономические науки
Статья в выпуске: 1 (14), 2019 года.
Бесплатный доступ
В статье сделан прогноз сельскохозяйственного производства на основе мультимодельных ансамблей и его использование в форсайт процессе. Разработаны рекомендации по применению форсайта в бизнес-процессах.
Форсайт, сельскохозяйственное производство, бизнес процессы, мультимодельные ансамбли, стратегическое управление
Короткий адрес: https://sciup.org/147229009
IDR: 147229009
Текст научной статьи Форсайт сельскохозяйственного производства на основе мультимодельных ансамблей
В современных условиях системе управления любого уровня необходима надежная и эффективная исследовательская система инструментов, позволяющая с определенной уверенностью спрогнозировать сценарии развития отдельных сфер деятельности. Форсайт-исследования используются как системный инструментарий формирования сценариев будущего, учитывающий возможные изменения внешней и внутренней среды.
В широком понимании метод ансамблей в науке о данных известен давно, и открыл второе дыхание с развитием технологий. Он представляет собой среднюю или средневзвешенную оценку результатов анализа, как искусственного интеллекта, так и экспертного сообщества. В сложном процессе это могут быть различные комбинации экспертных и машинных решений. Каждая из моделей или методов, входящих в ансамбль чувствительны к определённым статистическим моментам, и вместе призваны охватить широкий их диапазон (интегральные прогнозы).
Для отражения реального выпуска продукции в таблице 1 приведены данные с учетом корректировки на индекс цен производителей соответствующего периода (PPI).
Таблица 1 – Продукция сельского хозяйства в Российской Федерации и Орловской области за 1998-2018 гг.*
Ежегодный PPI |
Накопленный PPI |
Продукция в фактических ценах, млрд руб. |
Продукция в сопоставимых ценах, млрд руб. |
|||
РФ |
Орл. область |
РФ |
Орл. область |
|||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
1998 |
141,9 |
141,9 |
298,4 |
3,2 |
210,3 |
2,2 |
1999 |
191,4 |
271,6 |
586 |
7,4 |
215,8 |
2,7 |
Продолжение табл. 1
1 |
2 |
3 |
4 |
5 |
6 |
7 |
2000 |
122,2 |
233,9 |
742,4 |
9,0 |
317,4 |
3,9 |
2001 |
117,5 |
143,6 |
918,2 |
10,6 |
639,5 |
7,4 |
2002 |
98,1 |
115,3 |
968,2 |
11,2 |
840,0 |
9,7 |
2003 |
124,7 |
122,3 |
1076,4 |
12,0 |
879,9 |
9,8 |
2004 |
117,7 |
146,8 |
1253,2 |
14,1 |
853,8 |
9,6 |
2005 |
103 |
121,2 |
1380,9 |
14,7 |
1139,1 |
12,2 |
2006 |
110,4 |
113,7 |
1570,6 |
14,7 |
1381,2 |
12,9 |
2007 |
130,2 |
143,7 |
1931,6 |
19,3 |
1343,8 |
13,4 |
2008 |
102,5 |
133,5 |
2461,4 |
25,0 |
1844,4 |
18,7 |
2009 |
98,2 |
100,7 |
2515,9 |
24,7 |
2499,5 |
24,5 |
2010 |
123,6 |
121,4 |
2587,8 |
27,3 |
2132,1 |
22,5 |
2011 |
94,9 |
117,3 |
3261,7 |
36,6 |
2780,7 |
31,2 |
2012 |
110,8 |
105,1 |
3339,2 |
39,1 |
3175,7 |
37,2 |
2013 |
102,7 |
113,8 |
3687,1 |
43,0 |
3240,2 |
37,7 |
2014 |
114,1 |
117,2 |
4319,1 |
52,3 |
3685,8 |
44,6 |
2015 |
108,5 |
123,8 |
5164,9 |
64,6 |
4172,0 |
52,2 |
2016 |
101,8 |
110,5 |
5505,7 |
70,9 |
4984,7 |
64,2 |
2017 |
92,2 |
93,9 |
5111,8 |
61,6 |
5446,2 |
65,6 |
2018 |
99,8 |
91,5 |
5070,9 |
65,6 |
5542,0 |
71,7 |
*Источник: рассчитано авторами по данным ФСГС РФ [1]
В таблице 2 приведены методы описательной статистики исследуемых данных и их наличие по коинтеграции между динамикой производства в Орловской области и в целом по России.
Таблица 2 – Разведочный анализ динамических рядов*
Методы статистики |
Продукция в сопоставимых ценах, млрд руб. |
Продукция в сопоставимых ценах, млрд руб. |
Среднее хронологическое |
2222,4 |
25,9 |
Максимум |
5542,0 |
71,7 |
Минимум |
210,3 |
2,2 |
Размах |
5331,7 |
69,5 |
Среднегодовая волатильность |
377,6 |
4,8 |
Гипотеза о коинтеграции рядов ( p> 0,05) |
Принимается |
*Источник: рассчитано автором по данным таблицы 1
Таким образом, можно сделать предварительный вывод, что результативность регионального агробизнеса идеально коррелируется с федеральными тенденциями, что может косвенно говорить об относительно «нормальном» (не лучше и не хуже, чем в других субъектах) структурно-институциональных условиях.
Из-за сравнительно небольшого размера выборки использование методов унимодельных ансамблей, основанных на ресемплировании, баггинге и бустинге (наример XGBoost или RandomForest), а также глубокого обучения с помощью нейронных сетей будет не целесообразно, так они не будут превышать возможности «классических» методов.
В качестве прогнозных методов мы использовали экспоненциальное сглаживание с учетом тренда и сезонности ETS, интегрированную модель авторегрессии и скользящего среднего ARIMA, а также линейную регрессионную модель общего тренда. Калибровочные модели (бенчмарк) представлены простыми методами. С помощью программной среды анализа данных «R» в автоматическом режиме подобраны следующие параметры для моделей по оптимальному инфорационному критерию Акаике (AIC), скорректированному для малых выборок. Модель разделена на обучаемую и тестовую выборку (тестовая выборка состоит из последних трех значений (2016-2018 годы). Сопоставление проводилось по MAPE (meanabsolutepercentageerror – средней абсолютной ошибки в процентах), которая позволяет сравнивать данные в различных единицах измерения или шкалах.
В таблице 3 некоторые основные модели показывают худшие результаты, чем модели бенчмарка, например, модель общего линейного тренда. Таким образом, мы можем в итоговом интегральным прогнозе заменить основные модели с худшим результатом на калибровочные модели. Кажется логичным замена линейного тренда на модель последнего значения с дрифтом. Сильно сокращать количество моделей даже с высокими метриками не рекомендуется, так как каждая призвана уловить определенные паттерны в данных, особенно это важно при ожидаемой нестабильности или неопределенности.
Таблица 3 – Сопоставление обучаемых моделей по метрике MAPE*
Модели |
Ряд |
Гиперпараметры |
Параметры |
Стат. знач.-ть модели /парт-ов (+), (-) |
MAPE, % |
«Бенчмарк» по наивным моделям |
|||||
Последнее значение (naïve) |
РФ |
Y 2017-2018= Y 2015 |
Y=4172,0 |
+/+ |
17,3 |
Орл. |
Y 2017-2018 = Y 2015 |
Y=52,2 |
+/+ |
17,1 |
|
Cлучайное блуждание (random walk) |
РФ |
Y 2017-2018 = Y 2015 + 2d |
Y=4172,0+ 233,0T |
+/+ |
19,9 |
Орл. |
Y 2017-2018 = Y 2015 + 2d |
Y=52,2 + 2,9T |
+/+ |
20,5 |
|
Основные модели |
|||||
Линейный тренд |
РФ |
Y t = Kt + const |
Const = -433,11 K = 228,93 |
+/+ |
29,5 |
Орл. |
Y t = Kt + const |
Const = -6,14 K = 2,71 |
+/+ |
41,8 |
|
ARIMA |
РФ |
(0,1,0) + d |
d = 218,3 |
+/+ |
18,8 |
Орл. |
(0,2,2) |
ma_1 = -1,21 ma_2 = 0,59 |
+/+ |
11,3 |
|
ETS |
РФ |
(A,A,N) |
Alpha=0.23 Beta=0.23 Gamma = 0 |
+/+ |
15,2 |
Орл. |
(M,A,N) |
Alpha=0,84 Beta=0,001 Gamma = 0 |
+/+ |
14,8 |
*Источник: рассчитано автором
Группа опрошенных нами экспертов посчитала, что с учётом высокого уровня риска и неопределённости в экономике, в особенности, связанных с постоянно меняющимися институциональными условиями, необходимо ограничиться краткосрочным трёхлетним прогнозом. Эксперты сошлись во мнении, что необходимо доверительный интервал использовать 80% вместо часто используемого 95%, который даёт слишком широкий диапазон оценок. При анализе доверительной зоны можно ограничить количество альтернатив развития (сценариев) в планах организации, например, остановиться на негативном или стабильном.
Точечные прогнозы обобщены и доверительные интервалы (ДИ) в интегральном прогнозе (табл. 4), основанном на хронологическом среднем от результатов предсказаний вышеуказанных моделей.
Таблица 4 – Прогнозные данные в соответствии с выбранными моделями временных рядов на 2019-2021 гг.*
Модели |
РФ |
Орловская область |
||||
Точечное значение |
Нижний 80% ДИ |
Верхний 80% ДИ |
Точечное значение |
Нижний 80% ДИ |
Верхний 80% ДИ |
|
Naive |
||||||
2019 |
5542,0 |
5044,7 |
6039,3 |
71,7 |
65,3 |
78,1 |
2020 |
5542,0 |
4838,8 |
6245,2 |
71,7 |
62,7 |
80,7 |
2021 |
5542,0 |
4680,7 |
6403,3 |
71,7 |
60,7 |
82,7 |
ARIMA |
||||||
2019 |
5808,6 |
5437,9 |
6179,3 |
56,3 |
52,4 |
60,1 |
2020 |
6075,2 |
5550,9 |
6599,4 |
62,1 |
57,2 |
67,0 |
2021 |
6341,8 |
5699,7 |
6983,9 |
67,9 |
61,3 |
74,6 |
ETS |
||||||
2019 |
6194,9 |
5840,7 |
6549,0 |
75,2 |
57,3 |
93,2 |
2020 |
6723,4 |
6340,4 |
7106,4 |
79,2 |
54,6 |
103,9 |
2021 |
7252,0 |
6811,0 |
7692,9 |
83,2 |
52,0 |
114,4 |
Ансамбльмоделей |
||||||
2019 |
5848,5 |
5441,1 |
6255,9 |
67,7 |
58,3 |
77,1 |
2020 |
6113,5 |
5576,7 |
6650,3 |
71,0 |
58,2 |
83,9 |
2021 |
6378,6 |
5730,5 |
7026,7 |
74,3 |
58,0 |
90,6 |
Среднегодовой уровень |
6113,5 |
5581,2 |
6645,8 |
71,0 |
58,2 |
83,9 |
*Источник: рассчитано автором с помощью программной среды R на основе полученных моделей
Графики динамических рядов, производство сельскохозяйственной продукции в Российской Федерации и Орловской области соответственно, несмотря на схожие тренды, региональный ряд имеет более широкий доверительный диапазон, что говорит о большей неопределённости в развитии регионального производства.
Однако, здесь лучше дифференцированы сигналы выбора негативного или стабильного сценария. Стабильный сценарий предполагается, если производство находится в границах между точным прогнозом и верхним доверительным интервалом, а негативный, соответственно, между точным прогнозом и нижним доверительным интервалом. Четкий сигнал уже будет виден в 2019 году. В общем, из достаточно «стройного» рисунка доверительных интервалов, модели можно определить как обладающие достаточными прогностическими возможностями.
В ходе исследования были получены следующие результаты и сделаны следующие выводы:
-
1. Процесс форсайтинга имеет важное значение в современном управлении, поскольку включает в себя не только вопросы прогнозирования, но также и оценку альтернатив развития планирования, в том числе стратегического, политику деловой активности в условиях неопределенности и риска.
-
2. Прогнозирование является фундаментом форсайт комплекса. Требованиям современного прогнозирования отвечают сложные интегральные модели, использование которых во многом облегчается использованием современной вычислительной техники и достижениями науки о данных.
-
3. Разработан алгоритм использования прогнозов форсайт процесса с помощью мультимодельных ансамблей.
Кроме того, нами использованы ансамбли в широком понимании форсайта, то есть с привлечением экспертных оценок на разных стадиях исследования.
В качестве положительных моментов можно отметить возможность использования существующей инфраструктуры и широкий выбор бесплатных и условно-бесплатных инструментов анализа, отрицательных – отсутствие специалистов в области анализа данных и разработки ПО.
В качестве основы для дальнейших исследований, предлагается использовать информацию одного форсайта для прогнозирования другого, а также привлечение дополнительных факторов (например, моделей, основанных на векторных, динамических и иерархических регрессиях, проприетарных алгоритмов и других методов, основанных на машинном обучении).
Необходимо расширять круг экспертного сообщества для более эффективного взаимодействия в области регулирования инновационного развития сельскохозяйственного производства.
Список литературы Форсайт сельскохозяйственного производства на основе мультимодельных ансамблей
- Официальный сайт Федеральной службы государственной статистики [Электронный ресурс]. URL:http://www.gks.ru (дата обращения: 01.12.2018).
- Малюк В.И. Стратегический менеджмент. Организация стратегического развития: учебник и практикум для бакалавриата и магистратуры. М.: Издательство Юрайт, 2018. 361 с.
- Пособие ЮНИДО по принципам и методам Форсайта: UNIDO Technology Foresight TrainingManual. [Электронный ресурc] (дата обращения: 01.12.2018 г.).
- Формирование национальной системы технологического прогнозирования: проблемы и перспективы / А.В. Соколов, А.А. Чулок, В.Р. Месропян, С.А. Шашнов // Инновации. 2013. № 12. С. 34-43.
- Поппер Рафаэль Мониторинг исследований будущего // Форсайт. 2012. №2. URL: https://cyberleninka.ru/article/n/monitoring-issledovaniy-buduschego (дата обращения: 5.02.2019).
- Чулок А.А., Кузьминов И.Ф. АПК России: есть ли потенциал для глобального прорыва? // BRICS BusinessMagazine (Россия). 2018. № 1(19). С. 86-91.
- Шестаков Р.Б., Ловчикова Е.И Анализ динамики аграрного производства в условиях общей экономической рестрикции // Экономика, труд, управление в сельском хозяйстве. 2017. № 4 (33). С. 65-73.