Прогнозирование демографических показателей в сфере рождаемости населения: инерционный прогноз versus прогноз на основе машинного обучения
Автор: Зубарев Н.Ю., Федулова Д.Д.
Журнал: Ars Administrandi. Искусство управления @ars-administrandi
Рубрика: Проблемы управления развитием человеческого потенциала
Статья в выпуске: 2 т.13, 2021 года.
Бесплатный доступ
Введение: статья посвящена сравнению методов прогнозирования демографических показателей в сфере рождаемости населения.
Рождаемость населения, машинное обучение, инерционный прогноз, прогнозирование
Короткий адрес: https://sciup.org/147246691
IDR: 147246691 | DOI: 10.17072/2218-9173-2021-2-204-221
Текст научной статьи Прогнозирование демографических показателей в сфере рождаемости населения: инерционный прогноз versus прогноз на основе машинного обучения
Воспроизводство населения представляет собой комплексный процесс, объединяющий две составляющие: процесс рождаемости и смертности населения. Проблема низкой рождаемости характерна для Российской Федерации на протяжении всей новейшей истории. Вкупе с высокой смертностью низкая рождаемость привела к интенсивной депопуляции и отрицательному естественному приросту (Курносова, 2019). Поэтому государственная демографическая политика в сфере рождаемости направлена на увеличение численности населения, прежде всего за счет увеличения количества родившихся.
Для изучения процесса рождаемости населения в демографии используют систему определенных показателей, базовым в которой является показатель «абсолютная численность родившихся». На его основании рассчитываются относительные и специализированные показатели. Они дают представление о росте численности населения и служат для оценки медицинского, социального и демографического благосостояния населения. Показатели рождаемости необходимы как для общего анализа процесса рождаемости, так и для различных демографических исследований, а также для работы органов власти в сфере здравоохранения и социальной политики.
Управление процессом рождаемости и на федеральном, и на региональном уровнях тесно сопряжено с необходимостью разработки прогнозов абсолютной численности родившихся как основного результирующего показателя проводимой демографической политики и эффективности мер воздействия.
ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ИССЛЕДОВАНИЯ
Демографический прогноз в сфере рождаемости – это обоснованное научными методами предвидение будущей демографической ситуации, прежде всего абсолютной численности родившихся и ее структуры (Архангельский и Елизаров, 2016, с. 524; Андреев, 1999, с. 176). В основе прогноза, как правило, лежат перспективные расчеты, построенные на некоторых общих гипотезах относительно будущей динамики показателей рождаемости (Тарасова, 2015, с. 186).
В данной статье будут рассмотрены два метода прогнозирования показателей: метод инерционного прогнозирования и метод машинного обучения на основе градиентного бустинга. Методам факторного анализа и корреляционно-регрессионного моделирования будет посвящена отдельная статья.
Инерционному прогнозированию свойственно выполнение расчетов в нескольких вариантах. Иногда прогнозом называют только общую оценку будущей численности населения (Архангельский и Елизаров, 2016, с. 525). Основным методом расчета является метод передвижки возрастов, в западной литературе его чаще называют методом компонент (Cohort Component Method) (Сафиуллин и др., 2014; Юзаева, 2014; Smith еt al., 2013; Riiman еt al., 2019; Thatkar et al., 2018; Sitkovskiy, 2019). Часто исследователи, определив основную тенденцию на снижение или увеличение численности населения, экстраполируют ее в форме среднего темпа роста / снижения на будущие показатели (Шубат и Киселева, 2016, с. 330). Несмотря на кажущуюся простоту данного метода, иногда он дает достаточно точные прогнозы.
Росстат, как правило, рассчитывает три варианта прогноза на основе гипотез относительно будущих тенденций рождаемости (низкий, средний и высокий). Низкий вариант прогноза основан на экстраполяции существующих демографических тенденций, высокий вариант является нормативным и ориентирован на достижение целей, определенных в Концепции демографической политики Российской Федерации на период до 2025 года 1 . Средний вариант прогноза считается наиболее реалистичным, в нем учтены сложившиеся демографические тенденции и принимаемые меры демографической политики 2 .
Точность прогноза зависит от точности исходной информации. К основным источникам помимо статистических данных относят данные переписей населения, результаты выборочных исследований. При этом важную роль играют текущие демографические тенденции, определяющие тренд и динамику изменения показателей рождаемости. Точность и достоверность прогноза чрезвычайно чувствительна к продолжительности периода, на который делается прогноз (краткосрочный – до 5 лет, среднесрочный – от 5 до 30 лет, долгосрочный – свыше 30 лет). Чем меньше период прогноза, тем точнее результат инерционного прогнозирования.
Ошибки в определении демографических тенденций могут дать существенное отклонение прогноза, снизив его ценность, и привести к значительным ошибкам в реализации социально-экономической политики государства и регионов. Одним из способов определения гипотез возможной динамики рождаемости, используемой Росстатом, является экстраполяция тренда, имевшего место в предшествующий период. Данный прием особенно чувствителен к длине динамического ряда, который должен быть не короче прогнозируемого периода. Использование этого способа определения гипотез возможной динамики показателей рождаемости целесообразно применять при незначительном отклонении прогнозируемых показателей от тренда. Прогноз перспективной динамики показателей рождаемости, основанный на экстраполя- ции их трендов, часто может подвергаться замедлению изменения величины показателя по мере приближения к пороговым значениям.
Второй метод, рассмотренный в статье – это метод машинного обучения на основе градиентного бустинга (Catboost), который позволяет создавать множество алгоритмов (деревьев решения), которые, в свою очередь, способны научиться принимать решения и строить прогнозы на основе данных (Brink et al., 2016; Ibrahim et al., 2020; Hancock and Khoshgoftaar, 2020). Машинное обучение – сравнительно новый метод, при этом для демографической науки он редко применялся ранее (Соловьев и Соловьев, 2018, с. 948). Между тем данный метод постепенно завоевывает популярность в других разделах экономической науки (Kauffman et al., 2017; Köhn and Lessmann, 2020; Zhang et al., 2020).
Идея бустинга состоит в комбинации функций с невысокой обобщающей способностью, которые строятся в ходе итеративного процесса, на каждом шаге которого новая модель обучается с использованием данных об ошибках предыдущих итераций. Итоговая результирующая функция представляет собой линейную комбинацию базовых, слабых моделей. В итоге данный метод создает решающую модель прогнозирования в виде ансамбля слабых моделей, обычно деревьев решений. Он строит модель последовательно, оптимизируя произвольную дифференцируемую функцию потерь.
В рамках данной статьи мы определим точность методов прогнозирования демографических показателей в сфере рождаемости населения на основании сравнения прогнозных значений, полученных с помощью описанных выше методов.
При этом важным остается вопрос выбора факторов, под влиянием которых формируются показатели рождаемости. Разнообразное сочетание факторов обусловливает уровень рождаемости населения (Малева и Синявская, 2006).
Н. Н. Подольная и коллеги разделяют факторы рождаемости на следующие группы (Подольная и др., 2015):
-
- природно-биологические факторы – экологическая обстановка, детородный возраст, наследственность и т.д.;
-
- социально-экономические факторы – уровень жизни населения, система здравоохранения, занятость населения, войны и т.д.;
-
- демографические факторы – половой, брачный, территориальный, возрастной и т.д. состав населения.
И. С. Лунева и соавторы рассматривают основные факторы, которые влияют на рождаемость в современном обществе (Лунева и др., 2019):
-
- изменение социальной роли женщины;
-
- тенденция к малодетным семьям;
-
- время выбора даты рождения;
-
- сложное экономическое положение страны;
-
- рост уровня безработицы.
Иные факторы выделяет С. В. Щепотьева (Щепотьева, 2010):
-
- материальное положение семьи;
-
- возраст;
-
- семейное положение;
-
- число детей в семье;
-
- уровень образованности;
-
- тип населенного пункта;
-
- религия;
-
- занятость женщин;
-
- отношение к семейному образу жизни.
В. А. Карпова разделяет факторы, влияющие на рождаемость, на медикобиологические и социально-психологические. Первые определяют физическое состояние организма человека и влияют на выполнение человеком репродуктивной функции. К медико-биологическим относятся такие факторы, как состояние репродуктивного здоровья населения и возраст матери. Социально-психологические факторы определяют моральную и психологическую готовность человека к реализации репродуктивной функции. Среди них выделяются следующие: внеэкономическая потребность в детях и родительский инстинкт. Медико-биологическая группа факторов является наиболее важной, поскольку от нее зависит репродуктивное здоровье, напрямую влияющее на возможность зачатия и рождения ребенка, безопасность течения беременности, а также здоровье ребенка и матери.
Факторы, которые позитивно влияют на уровень рождаемости, рассматривает В. И. Шарин (Шарин, 2019). Это:
-
- пропаганда семей и семейных ценностей;
-
- налоговые послабления и небольшие дотации для семей с детьми;
-
- снижение пенсионного возраста;
-
- материнский социальный пакет;
-
- усложнение процедуры разводов;
-
- скидки на железнодорожные перевозки;
-
- получение новой профессии в период ухода за ребенком;
-
- запрет абортов;
-
- снижение минимально допустимого возраста вступления в брак;
-
- коммерческое суррогатное материнство;
-
- вспомогательные репродуктивные технологии.
Согласно указу Президента Российской Федерации 2007 года «Об утверждении Концепции демографической политики Российской Федерации на период до 2025 года» 3 , на уровень рождаемости влияют следующие факторы:
-
- низкий уровень доходов семей;
-
- отсутствие нормальных жилищных условий;
-
- рост числа неполных семей;
-
- ориентация на малодетность;
-
- тяжелый физический труд части работающих женщин;
-
- условия труда, которые не отвечают санитарно-гигиеническим нормам;
-
- низкий уровень репродуктивного здоровья;
-
- высокое число абортов.
Подводя итог обзору различных перечней факторов, влияющих на рождаемость населения, обобщим в табл. 1 показатели, рассчитываемые органами статистики и органами власти на регулярной основе, выражающие отдельные факторы, для их дальнейшего использования в разработке прогноза.
Таблица 1 / Table 1
Статистические показатели, выражающие факторы влияния на рождаемость населения в субъекте Российской Федерации / Statistic indicators reflecting the factors influencing fertility in a Russian region
№ |
Показатель |
1 |
Численность городского населения, чел. |
2 |
Численность сельского населения, чел. |
3 |
Число зарегистрированных браков, шт. |
4 |
Число зарегистрированных разводов, шт. |
5 |
Число прерываний беременности, шт. |
6 |
Число мужчин в трудоспособном возрасте, чел. |
7 |
Численность женщин в возрасте 15–19 лет, чел. |
8 |
Численность женщин в возрасте 20–24 лет, чел. |
9 |
Численность женщин в возрасте 25–29 лет, чел. |
10 |
Численность женщин в возрасте 30–34 лет, чел. |
11 |
Численность женщин в возрасте 35–39 лет, чел. |
12 |
Численность женщин в возрасте 40–44 лет, чел. |
13 |
Численность женщин в возрасте 45–49 лет, чел. |
14 |
Численность женщин в возрасте 50–54 лет, чел. |
15 |
Уровень безработицы в возрасте 15–72 лет, %. |
16 |
Уровень занятости в возрасте 15–72 лет, %. |
17 |
Среднемесячная номинальная начисленная заработная плата работников организаций, руб. |
18 |
Среднедушевые денежные доходы населения в месяц, руб. |
19 |
Численность населения с денежными доходами ниже величины прожиточного минимума, в % от общей численности населения субъекта Российской Федерации. |
Источник: составлено авторами.
Таким образом, для построения прогноза абсолютной численности родившихся, в случае с методом инерционного прогнозирования, мы будем использовать простейшую экстраполяцию предыдущей тенденции и динамики показателя, а в случае с методом машинного обучения используем показатели из табл. 1 для построения результирующей прогнозной модели. Построим прогнозы на данных Пермского края за период с 2009 по 2019 годы. Для сопоставления точности прогнозов используем период с 2018 по 2019 годы в качестве прогнозного.
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ
Прогноз с использованием метода инерционного прогнозирования
Для получения прогнозных значений были рассчитаны темпы роста/сни-жения целевого показателя – «абсолютная численность родившихся» и поделены на количество лет, за которые проводились расчеты. Как говорилось ранее, метод инерционного прогнозирования чувствителен к резкому преломлению существующих тенденции и сдвигам в динамике изменения показателей. С 2017 по 2019 годы произошло стремительное ухудшение ситуации с рождаемостью населения в Пермском крае и темпы снижения увеличились до двузначных значений. Средняя ошибка отклонения прогнозных значений от фактических – 11,9 %.
Таблица 2 / Table 2
Фактические и прогнозные значения, полученные методом инерционного прогнозирования / Actual and predicted values obtained through inertial method
Год |
Абсолютная численность родившихся, чел |
Темп роста/(снижения) |
|
(факт) |
(прогноз) |
||
2009 |
36 043 |
- |
Базовый год |
2010 |
37 304 |
- |
3,49 % |
2011 |
37 015 |
- |
(0,77 %) |
2012 |
38 931 |
- |
5,17 % |
2013 |
38 637 |
- |
(0,75 %) |
2014 |
38 837 |
- |
0,51 % |
2015 |
38 761 |
(0,19 %) |
|
2016 |
37 258 |
- |
(3,87 %) |
2017 |
31 915 |
- |
(14,34 %) |
2018 |
29 526 |
31535 |
Среднеарифметический темп роста / (снижения) (1,19 %) |
2019 |
26 617 |
31159 |
Источник: составлено авторами.
Прогноз с использованием метода машинного обучения
В отличие от инерционного метода прогнозирования, для формирования прогнозных значений целевого показателя модели машинного обучения необходимы данные показателей, влияющих на процесс рождаемости населения в Пермском крае. Поэтому метод является более трудозатратным и более требовательным к данным.
□4 о N |
5 40 ГД |
04 о 00 04 |
о о 40 |
04 |
5 00 |
40 ил 2 |
ГД о ил СП |
40 ГД о 40 40 |
3 я 40 |
^ ГД 40 00 |
ГД ил 00 |
00 ил ГД 04 |
о СП о |
40 о 04 |
00 о N |
40 гд LT) 04 гд |
3 ГД 00 00 04 |
04 00 40 |
О 04 |
5 04 |
40 00 ГД ил |
04 ил |
^ О ил 40 |
^ ГД ил 40 |
О о ГД 04 |
о 04 О |
ил 04 00 04 |
о ил о о |
00 00 |
О N |
LT) 04 |
3 иЛ 5 |
in 00 40 |
00 40 04 |
О 00 |
^ ГД ^ ил |
ил 04 ^ 40 ил |
UH 3 |
00 40 04 00 40 |
3 04 04 |
40 СП 04 О |
ил ил 04 04 |
^ 00 00 04 04 |
3 о 40 00 |
so о N |
00 UH ГД |
00 04 04 5 |
3 ГД ^ 40 |
00 |
О 00 |
СО МО |
^ 04 04 40 40 |
Й 3 |
04 О 04 ГД |
04 ^ 40 О |
ил 40 О |
3 00 о о |
00 04 |
ГД ГД ил ^ 00 |
in о |
5 ГП |
00 о 00 04 04 |
^ ГД ГД ил ^ 40 |
О |
ил |
04 00 00 |
^ О 00 |
ГД ил 3 |
ГД 04 04 00 |
00 СП о |
^ 00 00 ^ О |
ил ГД О |
ГД 40 04 |
ГД ГД ^ 00 |
^ о N |
2 сП |
^ К LO 00 04 |
О о ил 40 |
04 |
40 04 04 |
О ил О ГД |
40 О 04 |
^ 40 00 ^ 40 |
00 О 40 00 |
ГД 00 2 |
40 ^ 00 ГД о |
00 00 § |
04 |
04 04 ил 00 |
co о N |
3 СО |
§ к 04 |
04 Ш 04 ил ил 40 |
ил О |
40 40 04 |
ГД о 40 ГД ГД |
ил 04 04 |
ил 40 40 |
О 04 ГД ^ 04 |
00 о 3 |
^ о |
04 ГД о |
^ 04 О 04 |
40 ^ ГД 04 00 |
гд о CM |
8 сП |
LO 00 04 04 40 04 |
00 00 О 5 40 |
ил 04 04 |
^ ГД 00 |
00 00 я |
ГД 40 О 00 |
04 ГД 40 04 40 |
ГД о ГД о |
о ГД |
ГД о о |
3 ГД ГД о |
04 04 00 |
^ ГД о ^ 04 |
H О N |
LO о |
UH 04 |
40 О 00 ил 40 |
00 04 О |
ил |
ГД 00 ГД 40 ГД |
ГД ил 00 |
00 ил |
ил о 04 о |
о 40 04 о |
о § |
о 00 40 о о |
О 00 ^ 40 00 |
00 04 04 |
о о N |
^ S сл |
ГД 04 00 40 |
О 00 |
ГД ГД 04 |
21 00 ГД |
о 40 ГД 00 |
ил ГД о 00 |
ГД 00 |
04 О 04 О |
о ил о |
ГД 00 04 |
о 40 00 |
О 40 40 О |
|
□4 о |
3 О СП |
04 5 |
40 ГД 40 О 40 40 |
5 |
00 00 |
^ СП |
ГД 04 ил ^ 00 |
3 о 00 00 |
04 2 |
ил о |
§ 40 о |
^ сП ил 04 |
ил ГД 00 00 |
40 СП |
Cd M Л и |
о <и и 5 X S и ЕС О (X |
cd К
о Оч о |
cd К
Л Е О и |
И d Оч 40 л к к cd Й О Оч S н Е О Оч та со О Е S |
1 я Й И Й 1-i та СО J |
S о к к О S О Оч О 40 ’S s к cd Й В Оч О Оч К о Е S |
S О к 40 о о И о к н Й к S * g |
н cd Оч со о Й Й к S
л о Н К о к « ё 2 7 ил |
о cd Рч со О Й Й К S
Л о Н К о к « 5 7 5 ° иГ ГД |
о cd Рч со О Й Й К S
Л о Н К О К « ~ 04 5 7 7 ил Т ГД |
о cd Рч со о Й Й к S
н о Н к д ^ 5 и " СП |
о cd Рч со о Й Й к S н к
Л о Н к д ^ ~ 04 5 и Т СП |
н cd Рч со о Й Й д S д * Л о Н д ^ д « 5 7 |
н cd Рч со О Й Й Д S д * Й О н Д О Д « ~ 04 5 7 ил |
<34 © ГД |
со 04 ^ |
Ю? |
'Л 04 ио |
о 04 СО |
со со Ш 2 |
04 |
0© о 04 |
^ со чо со |
^ LO |
<4 2 |
04 О СО 2 |
со о со 04 |
04 2 |
о N |
2 ш 04 |
40 |
'Л 2 |
04 Ш 04 Я |
U0 Ш 40 со 04 |
ю" |
40 о |
40 СО 04 |
со Ю? |
2 |
2 40 |
о о ^ со 04 |
LT? |
in о |
LO LT) 2 |
40 |
со 2 |
00 04 U0 00 04 |
2 о я |
^ 04 |
о |
40 04 О |
СО Ю? |
со о" 40 |
04 О 04 |
Ш со 04 |
2 |
со о 04 |
о LT) |
LTJ 40 |
04 40 |
40 04 |
^ Ш о 40 04 |
|
04 О 04 |
04 |
40 |
'Л 2 |
04 СО 2 |
04 04 |
04 |
н О 04 |
LT) |
'Л |
^ 2 |
со |
2 04 |
|
О О 04 |
2 ш 2 |
со" |
04 40 |
00 ^ |
^ СО 04 |
со |
□4 о 04 |
04 04 2 |
04 04 |
'Л 2 |
00 04 04 Р |
LT) 04 |
40 2 |
S св со ев О И |
н св Он со О И И К 2 * н о Н к ^ 5 Ч 5 ° Т LT) |
Н св Оч со О И и S о Ю со
^ У К «к £0 |
н св 04 со О И И S О св '^ со н Л у К «к ^0 |
св Он Л Св Св н Z—X ^ ^ р , л <7 § я s о о н 1 * S S*l Л со g 3 я ° S я й S S g я я стад й я н U я ю |
g о _ о ^ к 77 * 2 ст S й й и Л й s 5 я оч S и и: |
й в Я « и я я я S Я Я „ Н й Я Я S « r s g Е н у g >s Й ® s g И" ю и о Я О u Я о и й я я о g я Я' 5 1 И 5 S У Й и 5 д Рч <и св У £Г Д Д СТ К в |
(дата обращения: 18.04.2021).
Прогнозные значения за 2018 и 2019 годы можно увидеть в табл. 4. Модель машинного обучения была настроена по умолчанию и дополнительно не модифицировалась. Лучшая итерация модели – 999, средняя ошибка отклонения прогнозных значений от фактических – 19,85 %.
Таблица 4 / Table 4
Фактические и прогнозные значения, полученные методом машинного обучения / Actual and predicted values obtained through machine learning method
Год |
Абсолютная численность родившихся, чел. |
|
(факт) |
(прогноз) |
|
2009 |
36 043 |
– |
2010 |
37 304 |
– |
2011 |
37 015 |
– |
2012 |
38 931 |
– |
2013 |
38 637 |
– |
2014 |
38 837 |
– |
2015 |
38 761 |
– |
2016 |
37 258 |
– |
2017 |
31 915 |
– |
2018 |
29 526 |
33 188 |
2019 |
26 617 |
33 885 |
Источник: составлено авторами.
В процессе построения модели были рассчитаны значения важности показателей (feature importance), которые представлены в табл. 5.
Таблица 5 / Table 5
Значения важности показателей модели машинного обучения / Relevance value indicators for machine learning model
№ |
Показатель |
Важность показателя для модели |
1 |
Численность городского населения, чел. |
5,25 |
2 |
Численность сельского населения, чел. |
6,50 |
3 |
Число зарегистрированных браков, шт. |
3,79 |
4 |
Число зарегистрированных разводов, шт. |
2,19 |
5 |
Число прерываний беременности, шт. |
7,08 |
6 |
Число мужчин в трудоспособном возрасте, чел. |
5,49 |
7 |
Численность женщин в возрасте 15–19 лет, чел. |
2,08 |
8 |
Численность женщин в возрасте 20–24 лет, чел. |
5,66 |
9 |
Численность женщин в возрасте 25–29 лет, чел. |
6,87 |
10 |
Численность женщин в возрасте 30–34 лет, чел. |
6,46 |
11 |
Численность женщин в возрасте 35–39 лет, чел. |
8,77 |
12 |
Численность женщин в возрасте 40–44 лет, чел. |
6,99 |
№ |
Показатель |
Важность показателя для модели |
13 |
Численность женщин в возрасте 45–49 лет, чел. |
3,64 |
14 |
Численность женщин в возрасте 50–54 лет, чел. |
6,97 |
15 |
Уровень безработицы в возрасте 15–72 лет, %. |
2,23 |
16 |
Уровень занятости в возрасте 15–72 лет, %. |
5,06 |
17 |
Среднемесячная номинальная начисленная заработная плата работников организаций, руб. |
5,38 |
18 |
Среднедушевые денежные доходы населения в месяц, руб. |
3,23 |
19 |
Численность населения с денежными доходами ниже величины прожиточного минимума, в % от общей численности населения субъекта. |
6,16 |
Источник: рассчитано авторами.
Как видно из табл. 5, наиболее важными показателями для формирования прогнозного значения являются численность женщин в возрасте 35–39 лет, а также число прерываний беременности. В целом, все 19 показателей демонстрируют невысокие значения важности для модели.
Сравнение полученных прогнозных значений
Оба метода показали плохие результаты, о чем свидетельствуют высокие значения ошибки отклонения прогнозных значений от фактических (табл. 6). При этом более точные прогнозные значения были получены с помощью метода инерционного прогнозирования, даже несмотря на описанные выше сложности, связанные с резким ухудшением тенденции в сфере рождаемости и динамики изменения показателя абсолютной численности родившихся. Метод машинного обучения продемонстрировал крайне высокие значения отклонения прогнозных значений от фактических, что объясняется требовательностью данного метода к наличию большого объема данных за продолжительный промежуток времени. При этом с ростом периодов качество генерации прогнозных значений моделью будет возрастать.
Таблица 6 / Table 6
Сравнительная таблица полученных прогнозных значений / Comparison of the obtained predicted values
Год |
Абсолютная численность родившихся, чел. |
Ошибка отклонения прогнозных значений от фактических, % |
|||
Факт |
Инерционный прогноз |
Прогноз на основе модели машинного обучения |
Инерционный прогноз |
Прогноз на основе модели машинного обучения |
|
2018 |
29 526 |
31 535 |
33 188 |
6,80 |
12,40 |
2019 |
26 617 |
31 159 |
33 885 |
17,06 |
27,30 |
Источник: рассчитано авторами.
Наглядная разница между точностью прогнозных значений представлена на рисунке.
40 000
38000 ,'''**"“*
, -♦ •Л
36 000 •'\
34 000 \ ____
32 000 (В. ......
30 000''^
28 000
26 000*
24 000
22 000
20 000
2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019
--•-- Факт ««Вс* ИП —■—МО
Рис. Фактические и прогнозные значения показателя «абсолютная численность родившихся», полученных с помощью двух методов на данных Пермского края за период с 2009 по 2019 годы / Fig. Actual and predicted values for “absolute number of births” obtained through two methods based on the data for 2009–2019
Источник: составлено авторами на основе собственных расчетов и данных Пермьстата5.
ЗАКЛЮЧЕНИЕ
Таким образом, по итогам сравнения прогнозных значений, полученных с помощью инерционного метода и метода машинного обучения (на данных Пермского края), можно сделать вывод, что оба метода показали достаточно низкую точность, поэтому нельзя однозначно рекомендовать ни один из них в качестве основного для целей прогнозирования демографических показателей в сфере рождаемости населения.
Метод инерционного прогнозирования является простым и не требовательным к объему данных, при этом он весьма чувствителен к резкому изменению прогнозируемых показателей. Поэтому его можно использовать для прогнозирования демографических показателей в сфере рождаемости на данных регионов, имеющих ярко выраженную демографическую тенденцию и демонстрирующих относительно стабильную динамику ее изменения.
Метод машинного обучения требователен к длине временных рядов и наличию статистических показателей, выражающих факторы влияния на процесс рождаемости. Поэтому его применение в ближайшие годы для указанных целей будет осложнено нехваткой данных и их незначительным временным периодом. Но, учитывая специфику метода, он позволяет потенциально полу- чать более точные данные по мере накопления статистики за продолжительный период времени.
В качестве альтернативных методов, позволяющих получать прогнозные значения демографических показателей в сфере рождаемости населения, в будущих публикациях рассмотрим факторный анализ и корреляционнорегрессионное моделирование.
Список литературы Прогнозирование демографических показателей в сфере рождаемости населения: инерционный прогноз versus прогноз на основе машинного обучения
- Андреев Е. М. Современный демографический кризис и прогнозы населения России // Мир России. 1999. Т. 8, № 4. С. 175-186. EDN: JGADWN
- Архангельский В. Н., Елизаров В. В. Демографические прогнозы в современной России: анализ результатов и выбор гипотез // Научные труды: Институт народнохозяйственного прогнозирования РАН. 2016. № 1. С. 524-544. EDN: XGSMUP
- Карпова В. А. Демографические факторы, влияющие на рождаемость // Сб. материалов IX Всерос. науч.-практ. конф. молодых ученых с междунар. участием "Россия молодая" / Под ред. С. В. Костюк. Кемерово: Кузбас. гос. техн. ун-т им. Т. Ф. Горбачева, 2017. 4 с. EDN: ZQWBRD
- Курносова Е. А. Прогнозирование демографических показателей в РФ // Цифровая экономика: проблемы и перспективы развития: сб. науч. статей Межрегион. науч.-практ. конференции: в 2-х т. Т. 2 / Отв. ред. С. В. Мамонтова. Курск: Юго-Запад. гос. ун-т, 2019. С. 237-242. EDN: CGGTFO
- Лунева И. С., Иванова О. Ю., Хардиков А. В. и др. Факторы, влияющие на рождаемость в современной России // Российский вестник акушера-гинеколога. 2019. Т. 19, № 2. С. 14-20. DOI: 10.17116/rosakush20191902114 EDN: YBUIHT