Модели управления потенциалом воспроизводства населения регионов России на основе методов машинного обучения

Автор: Сукиасян Ани Гагиковна

Журнал: Народонаселение @narodonaselenie

Рубрика: Демография: вопросы теории и практики

Статья в выпуске: 4 т.25, 2022 года.

Бесплатный доступ

Статья посвящена исследованию закономерностей развития потенциала воспроизводства населения регионов России с учётом сложившейся в них социально-экономической ситуации. Цель работы заключается в определении факторов социально-экономического развития регионов России, оказывающих наибольшее влияние на уровень воспроизводства населения и анализе чувствительности этой характеристики к изменениям в уровне социально-экономического положения регионов России. Для реализации этой цели проанализированы ключевые характеристики потенциала воспроизводства населения - предельный темп воспроизводства населения и стандартизированные коэффициенты рождаемости по пятилетним возрастным группам матерей за период с 1990 по 2020 годы. Изложенные в статье результаты получены в ходе исследования динамики воспроизводства населения и взаимозависимостей с основными социально-экономическими показателями регионов, оцененных методами корреляционного анализа и машинного обучения, по итогам апробирования которых были определены наиболее информативные факторы, оказывающие существенное влияние на процесс воспроизводства страны и её регионов с учётом возрастной структуры матерей. В частности, было выявлено, что с увеличением возраста матери возрастает влияние факторов, характеризующих экономическое благополучие, при принятии решения о рождении ребенка, тогда как в более молодых возрастных группах большую значимость обретают показатели социального благополучия. На базе этих моделей были получены оценки чувствительности индикаторов воспроизводства населения и показателей рождаемости в каждой из исследуемых возрастных групп матерей в случае изменения уровней социально-экономических факторов. На основе проведённого анализа были сформулированы выводы о влиянии социально-экономической обстановки в стране и регионах на уровень рождаемости в различных возрастных группах матерей, а также в целом на потенциал воспроизводства.

Еще

Повозрастная рождаемость, расширенное воспроизводство населения, депопуляция, предельный темп воспроизводства, модели машинного обучения

Короткий адрес: https://sciup.org/143179675

IDR: 143179675   |   DOI: 10.19181/population.2022.25.4.2

Текст научной статьи Модели управления потенциалом воспроизводства населения регионов России на основе методов машинного обучения

На сегодняшний день одной из ключевых целей развития страны, отражённой в Указе Президента России от 7 мая 2018 г. № 204 «О национальных целях и стратегических задачах развития Российской Федерации на период до 2024 года»1 является обеспечение устойчивого естественного роста численности населения России, которое возможно при одновременном достижении других социальных целей национального развития: повышения ожидаемой продолжительности жизни, обеспечения устойчивого роста реальных доходов населения и снижения уровня бедности, улучшения жилищных условий семей. Проблема депопуляции населения приобрела особую важность в России в конце XX — начале XXI в., став следствием произошедших в ней масштабных политических, социальных и экономических трансформаций.

В последние годы в России реализуется множество различных программ, направленных на переход от депопуляции к расширенному режиму воспроизводства населения. Тем не менее, по итогам 2019– 2020 гг. в стране сохранялась естественная убыль населения. Проблема усугубляется тем, что процесс депопуляции характерен почти для всех регионов России вне зависимости от их уровня развития [1; 2]. Этим обуславливается актуальность настоящего исследования, цель которого — выявить социально-экономические факторы, обуславливающие развитие потенциала воспроизводства в стране с учётом сложившихся в регионах социально-экономических условий. Принимая во внимание тот факт, что депопуляция является следствием не только сокращения рождаемости, но также и проблемы высокого уровня преждевременной смертности, в данной статье автором предложена попытка решения этой задачи только с точки зрения определения факторов, оказы- вающих положительное влияние на процессы воспроизводства населения, и построения на их основе моделей управления. Результаты исследований проблем преждевременной смертности в России и её регионах приводятся автором в ряде других работ и здесь рассматриваться не будут [3].

В отечественной литературе предлагается много подходов к моделированию динамики тех или иных индикаторов демографического потенциала страны и её регионов и их взаимозависимости с показателями социально-экономического развития региона (страны) с использованием методов корреляционного анализа, эконометрического, имитационного, структурного моделирования [4]. В качестве характеристик демографического потенциала наиболее распространены такие показатели, как численность населения, естественный прирост населения, рождаемость, смертность и ожидаемая продолжительность жизни, а в качестве социально-экономических факторов использовались валовый региональный продукт, расходы на образование, здравоохранение, уровень преступности, уровень безработицы, экологическая обстановка региона и другие показатели [5; 6]. Большая часть моделей, представленная в современной научной литературе, базируется на классической модели линейной регрессии, которая при её достоинствах приводит к неудовлетворительным результатам в случае несбалансированности выборки, взаимной коррелированности объясняющих переменных, а также наличия нелинейных взаимосвязей между объясняющими и объясняемыми переменными, что характерно для практически всех социально-экономических процессов. В результате исследователи вынуждены исключать взаимокоррелированные факторы, что негативно отражается на информативности модели и не позволяет оценить влияния исключённых факторов в совокупности с другими на процесс воспроизводства населения, или применять дополнительные инструменты, направленные на нивелирование вышеуказанных проблем (например, [7; 8]).

Современные модели, базирующиеся на методах машинного обучения, в этом смысле обладают существенными преимуществами, поскольку они позволяют выявлять закономерности на больших объёмах данных (79 регионов за 30 лет), характеризующихся нелинейностью взаимосвязей и мультиколлинеарностью. С точки зрения практического применения, данные модели позволяют оценить чувствительность потенциала воспроизводства населения к изменениям социально-экономических условий в регионе с учётом взаимной коррелированности факторов, которая негативно сказывается на качестве других типов эконометрических моделей. Это, в свою очередь, позволит органам, осуществляющим управление демографическими процессами, принимать эффективные адресные меры, направленные на переход регионов России от депопуляции к расширенному воспроизводству.

Настоящее исследование отражает результаты построения закономерностей развития потенциала воспроизводства населения регионов России с учётом постоянно меняющихся социально-экономических условий. Для измерения потенциала воспроизводства автором предлагается использовать предельный темп воспроизводства населения, который рассчитывается на основе коэффициентов рождаемости и дожития женского населения и характеризует темп замещения старого поколения новым. Оценка предельного темпа воспроизводства производится на основе числа родившихся на 1000 женщин в возрасте 15–49 лет и числа умерших женщин на 1000 человек в возрасте 0–49 лет по пятилетним возрастным группам и данных о численности женщин всех категорий фертильных возрастов [9]. Предельный темп воспроизводства численно представляет собой наибольшее собственное значение (Перронов корень) матрицы воспроизводства, для построения которой на основе вышеперечислен- ных показателей рассчитываются коэффициенты дожития и коэффициенты рождаемости девочек. Значение показателя меньшее 1 характеризует депопуляцию населения; значение большее или равное 1 интерпретируется как расширенное воспроизводство населения [10].

Выбор данного показателя обусловлен тем, что он, в отличие от вышеупомянутых, отражает изменения в структуре населения, связанные с процессами рождаемости, депопуляции, старения населения и позволяет оценить закономерности воспроизводства населения в отдалённой перспективе. Кроме того, предельный темп воспроизводства населения в динамике более эластичен к изменениям социально-экономических условий в регионах по сравнению с нетто-коэффициентом воспроизводства, который также рассчитывается по данным о рождаемости девочек и смертности женского населения, но характеризует интенсивность замены старых поколений новыми при постоянном темпе воспроизводства, что обуславливает, учитывая цель исследования и длительный временной промежуток в 30 лет, выбор предельного темпа воспроизводства населения в качестве показателя воспроизводства населения.

Динамика показателей воспроизводства населения в России

Предельный темп воспроизводства населения был получен автором для 79 регионов России за период с 1990 по 2020 годы. Анализ динамики данного показателя, представленный на рис. 1, позволяет обратить внимание на то, что, снижаясь с 1990 г. и достигнув своего минимума в 1999 г., в последующие годы предельный темп воспроизводства возрастает вплоть до 2016 г., однако не достигает значения равного или больше единицы, что свидетельствует о продолжающейся депопуляции населения. Кроме того, начиная с 2017 г. в России и её регионах наблюдается снижение предельного темпа воспроизводства несмотря на все реализуемые го- сударством меры по повышению рождае- их недостаточности в текущих социально-мости населения, что свидетельствует об экономических условиях.

Рис. 1. Динамика предельного темпа воспроизводства населения в целом по России в 1990–2020 гг., безразмерная величина

  • Fig. 1.    Dynamics of the marginal rate of population reproduction in Russia on the whole in 1990–2020, dimensionless

    Источник: составлено автором на основе данных Российской базы данных по рождаемости и смертности Центра демографических исследований Российской Экономической школы (ЦДИ РЭШ).— URL: http://demogr.nes.ru/ (дата обращения: 10.05.2022).

Сопоставительный анализ распределения регионов по уровню рассматриваемого показателя в 1990-2020 гг., приведённый на рис. 2, свидетельствует о существенном сокращении числа регионов с режимом расширенного воспроизводством населения с 22 регионов в 1990 г. до 2 (республики Алтай и Тыва) в 2020 году. При этом, если число регионов, в которых уровень воспроизводства был приближен к расширенному, в 1990 г. составляло 26, то к 2020 г. их число сократилось до 8, что означает, что проблема охватывающей регионы страны депопуляции в условиях беспрецедентных мер по стимулированию рождаемости и поддержки семей с детьми носит серьёзный характер и требует детального изучения.

Анализ динамики повозрастных коэффициентов рождаемости в регионах России

Кроме показателя предельного темпа воспроизводства населения интерес- ным является исследование показателей рождаемости по пятилетним возрастным группам матерей, которое позволит, в частности, выявить возрастные группы, наиболее чувствительные по показателям рождаемости к изменяющейся социальноэкономической обстановке в стране, поддержка которых со стороны государства поможет положительно повлиять на рождаемость, поскольку одни меры могут быть эффективны для стимулирования рождаемости в более молодых группах, а другие в группах зрелого возраста.

Следует отметить, что повозрастные коэффициенты предварительно были стандартизированы путём приведения к единой возрастной структуре женского населения, наблюдаемой в 2016 году. Необходимость стандартизации обусловлена том, что в долгосрочном периоде данные показатели подвержены влиянию возрастной структуры, что подтверждается гистограммой, приведённой на рис. 3, тогда как в краткосрочном периоде или при исследовании пространственной структу-

а)

■io

б)

Рис. 2. Сопоставительный анализ распределения регионов России по уровню предельного темпа воспроизводства населения в 1990 г.(а) и 2020 г. (б)

  • Fig. 2.    Comparative analysis of the distribution of Russian regions by the level of the maximum rate of population reproduction in 1990 (a) and 2020 (b)

  • 18.0%

Источник: составлено автором на основе данных ЦДИ РЭШ.

ры рождаемости в отдельно взятом году влияние возрастной структуры на результатах статистического, корреляционного анализа и моделирования не сказывается. Так, в 1990 г. доля численности женщин в возрасте 15-24 составляла 26% от численности женщин в возрасте 15–49. В то время как, в 2020 г. возрастная группа 15– 24 составляла только 20% от численности женщин в возрасте 15–49. Также, к 2020 г. значительно повысилась доля женщин возрастной группы 40–49 лет. К 2020 г. она составила 31% против 23% в 1989 году. При этом средний возраст родившей впервые матери возрос за этот период на 3 года.

Анализ динамики стандартизированных повозрастных показателей рождаемости, приведённый на рис. 4, свидетельствует в первую очередь о распространяющейся в России в целом и её регионах тенденции, характерной для стран с очень высоким и высоким уровнем развития: неизбежное снижение рождаемости в более молодых возрастных группах в поль-

= 16.0%                                     __

" i4.o%            —Fill— u 12.0%   —                                                        П|r—1

= 10.0%

I 8.0% П ПП u 6.0%

| 4,0%

* 2.0%

0.0%   ■   ■   ■   ■   ■■

15-19    20-24    25-29    30-34    35-39    40-44    45-4950-54

01990 D2O2O

Рис. 3. Повозрастная структура женского населения фертильного возраста в России в 1990 и 2020 гг.,%

Fig. 3. Age-specific structure of the female population at fertile age in Russia in 1990 and 2020,%

Источник: составлено автором на основе данных ЦДИ РЭШ.

01990 0 2020

Рис. 4. Динамика стандартизированных возрастных коэффициентов рождаемости в России в 1990–2020 гг., число новорожденных на 1000 женщин соответствующего возраста

Fig. 4. Dynamics of age-standardized birth rates in Russia in 1990–2020, the number of newborns per 1000 women of the corresponding age

Источник: составлено автором на основе данных ЦДИ РЭШ.

зу возрастания рождаемости в более старших возрастных группах. Коэффициенты рождаемости в возрастных группах 15–19 и 20-24 лет планомерно снижались в течение всего периода, в то время как коэффициенты рождаемости в остальных возрастных группах возросли.

В 1990 г. наибольшие коэффициенты рождаемости в РФ были зафиксированы в возрастных группах 20–24 и 25–29 лет, причём в группе 20–24 года показатели были существенно выше, чем в остальных возрастных группах. Тогда как в 2020 г. с небольшим превосходством максимальный показатель рождаемости был зафик- сирован в группе 25–29 лет, а в группах 20-24 и 30-34 года эти показатели практически совпали. Это обусловлено, в первую очередь увеличением продолжительности жизни, а также тем, что первоначальным приоритетом молодежи на сегодняшний день выступает получение образования, трудоустройство и обеспечение финансовой устойчивости, что позволит в дальнейшем создать благоприятные условия для рождения детей.

Для анализа состояния и построения моделей потенциала воспроизводства населения в регионах РФ в зависимости от различных социально-экономических условий были взяты стандартизированные коэффициенты рождаемости в возрастных группах 20-24, 25-29, 30-34, 35-39 лет в 79 регионах, так как с 1990 г. и к настоящему моменту коэффициенты рождаемости в данных группах принимали наибольшие значения, а значит эти возрастные группы привносят наибольший вес в формирование и развитие потенциала воспроизводства страны и её регионов.

Моделирование зависимости между потенциалом воспроизводства населения регионов России и социальноэкономическими факторами

Для выявления факторов, регулирование которых позволит обеспечить переход к расширенному воспроизводству, необходимо определить и измерить влияние внешней среды на изменение потенциала воспроизводства населения. В качестве внешней среды понимается социальное благополучие региона, экономический потенциал, доступность и объём предоставляемых медицинских услуг.

В рамках представленных результатов исследования методами многомерного статистического и корреляционнодисперсионного анализа к изучению были отобраны 15 переменных — социально-демографических характеристик регионов РФ. Среди них: 6 экономических показателей, которые являются индикаторами состояния экономики, инвестиционной активности в регионе, платежеспособности населения; 4 социально-демографических показателей; 6 показателей, характеризующих систему здравоохранения2 (табл. 1). Для обеспечения возможности сопоставления все переменные, измеряемые в денежных единицах, были приведены к ценам 2016 г. и пересчитаны на душу населения.

Предельный темп воспроизводства населения и повозрастные показатели ро- ждаемости также были трансформированы в бинарные, которые принимали значение 0, если уровень воспроизводства или рождаемости был ниже, чем медианный по России в целом, и 1 — если он был больше или равен медианному уровню по стране, что позволило в дальнейшем реализовать на данных методами машинного обучения модели градиентного бу-стинга и случайного леса для упрощения экономической интерпретации параметров моделей [11]. Следует отметить, что к достоинствам данных моделей помимо отмеченных выше можно отнести то, что они применимы для данных с неколичественными зависимыми переменными, а также хорошо подходят для оценки предельных эффектов влияния объясняющих факторов на результирующий и позволяют определить процентное изменение одного показателя при изменении другого на 1% [12].

Оценка информативности включённых в модели градиентного бустинга и случайного леса объясняющих моделей на основе анализа относительного влияния каждой переменной на функцию ошибок позволила сделать вывод, что наибольшей информативностью для построения прогноза во всех моделях характеризуются переменные: 1) общая площадь жилых помещений, 2) обеспеченность амбулаторно-поликлиническими учреждениями, 3) соотношение разводов и браков [13]. Исключение любой из данных переменных из модели приведёт к увеличению ошибки модели на 42–62%. Для моделей, построенных для стандартизированных коэффициентов рождаемости среди возрастов 30–34 и 35–39 лет, большей информативностью относительно других моделей характеризуется переменная, указывающая численность аку-шер-гинекологов населения, как и объём платных услуг в сфере медицины. Для моделей с коэффициентами рождаемости по возрастным группам в возрасте 30– 34 лет в качестве результирующих более информативны переменные, представляющие среднедушевые денежные доходы

Таблица 1

Основные социально-экономические характеристики регионов России, используемые в исследовании

Table 1

The main socio-economic characteristics of Russian regions used in the study

Группа показателей

Показатели

Экономические

Среднедушевые денежные доходы, тыс. рублей в месяц Инвестиции в основной капитал, тыс. рублей на человека Индекс промышленного производства

Объём платных услуг, тыс. рублей на человека

Вклады юридических и физических лиц, тыс. рублей на человека Оборот розничной торговли, тыс. рублей на человека

Социальные

Преступность на 100 тыс. человек населения

Численность безработных, человек на 100 тыс. человек трудоспособных

Общая площадь жилых помещений, м2 на человека

Соотношение разводов и браков, доли

Здравоохранения

Объём платных услуг в сфере медицины, тыс. рублей на человека

Расходы на здравоохранение, тыс. рублей на человека

Численность врачей на 10 тыс. населения, человек на конец года

Численность акушер-гинекологов на 10 тыс. населения, человек на конец года

Обеспеченность амбулаторно-поликлиническими учреждениями на 10 тыс. населения, посещений в смену на конец года

Обеспеченность койками на 10 тыс. человек населения, штук

Источник: составлено автором.

и объём предоставленных платных услуг в сфере медицины.

Анализ чувствительности показателей воспроизводства населения в зависимости от изменения социально-экономических условий жизнедеятельности

Высокая точность прогнозов, сделанных с помощью данных моделей, позволили достоверно оценить чувствительность индикаторов воспроизводства населения к изменениям тех или иных условий жизнедеятельности в регионе. Поскольку модели случайного леса позволили построить модели с довольно высоким качеством бинарного классификатора за счет наиболее точной оценки нелинейных связей между социально-экономическими показа- телями и результирующими переменными, именно они были выбраны для анализа предельных эффектов факторов социально-экономического положения регионов, выражающихся в определении процентного изменения уровня одних показателей при изменении других на 1% при фиксированных значениях остальных показателей. В качестве базовых значений были взяты значения показателей за 2020 г. в целом по России.

Согласно проведённому анализу, рождаемость во всех изучаемых возрастных группах чувствительна к показателям общей площади доступного жилья, доступности медицинских услуг, соотношения разводов и браков и уровня безработицы в регионе. Все показатели, характеризующие материальное благосостояние граждан, доступность платных медицинских услуг и финансирование области здравоохранения со стороны государства в большей степени влияют на перспективы повышения рождаемости в более старших возрастных группах. Рассмотрим наиболее интересные результаты.

Закономерность, свидетельствующая об увеличении общей площади доступного жилья на 1% в случае сокращения вероятности расширенного воспроизводства населения на 10%, характерную для взаимозависимости площади доступного жилья и уровня рождаемости в возрастных группах 20–24 и 30–34 года, следует рассматривать скорее в следующем клю- че: увеличение рождаемости неизбежно приводит к сокращению площади жилых помещений, приходящихся на одного человека (рис. 5). При этом, следует отметить, что в регионах России зафиксировано медленное увеличение площади жилых помещений, приходящихся на человека, поскольку улучшение жилищных условий требует существенных денежных вложений, что делает подобные взаимозависимости закономерными. Также не следует исключать наличие между данными показателями сериальной корреляции с некоторым лагом [14; 15].

Рис. 5. Предельные эффекты зависимости потенциала воспроизводства населения и изменения общей площади жилых помещений, м2 на человека

  • Fig. 5.    Marginal effects of the relationship between the population reproduction potential and changes in the total area of residential premises, sq.m per person

Источник: составлено автором.

Несмотря на то, что в последние десятилетия семейный статус более не рассматривается как обязательный фактор при решении вопроса о рождении детей, его влияние на рождаемость сохраняется [16], что подтверждается результатами построенной модели. Наиболее чувствительной к данному показателю является модель для коэффициента рождаемости в возрастной группе 25-29 — если на 10 заключенных браков в среднем будет зафиксировано не 6, а 7 разводов, вероятность повышения рождаемости в данной группе снизится на 10% (рис. 6).

Рост вероятности того, что рождаемость в группах возраста матери 30–34 и 35-39 лет превзойдет медианный уро- вень, на 26 и 31% соответственно прямо пропорциональна росту числа безработных на 10 тыс. человек трудоспособного населения на 13% (см. рис. 7). Данная закономерность обусловлена тем, что при более высоком уровне рождаемости большее число женщин вынуждены приостановить свою профессиональную деятельность на определённый период времени, связанный с уходом за детьми.

Анализ демографической ситуации в 2019–2020 гг. свидетельствует о том, что реализуемые меры, направленные на стимуляцию рождаемости и поддержки семей с детьми, оказывают положительный эффект на уровень рождаемости в краткосрочном периоде, однако они не могут

------11рсдсльный темп вопроизводства

----- Рождаемость в возрасте 25-29

.........Рождаемость и возрасте 34-39

— - Рождаемость в возрасте 20-24 — — — Рождаемость в возрасте 30-34

Рис. 6. Изменение вероятности роста потенциала воспроизводства населения при увеличении соотношения разводов и браков, безразмерная величина

  • Fig. 6.    Changes in the probability of population reproduction potential growth with an increase in the ratio of divorces and marriages, dimensionless

    Источник: составлено автором.

    Рождаемость в возрасте 20-24

    Рождаемость в возрасте 30-34

    11рслсльиый темп вопроизводства Рождаемость в возрасте 25-29 Рождаемость н возрасте 34-39

    Рис. 7. Предельные эффекты зависимости вероятности роста потенциала воспроизводства населения и численности безработных, человек на 100 тыс. трудоспособных (до 60 лет для женщин, до 65 лет для мужчин)

    Fig. 7. Marginal effects of the relationship between the probability of population reproduction growth and changes in the number of unemployed, per 100 thousand people at working ages (60 for females, 65 for males)

    Источник: составлено автором.


в долгосрочной перспективе изменить сложившуюся ситуацию с депопуляцией населения. Поскольку на этот исторически сложившийся за многие десятилетия процесс влияет не только воспроизводство в прошедшие временные периоды, но и в значительной степени сложившаяся в стране и её регионах социально-экономическая обстановка. Планомерное улучшение ситуации во всех сферах жизнедеятельности, связанное с обеспечением населения, в первую очередь, улучшенными условиями жизни, новыми рабочими местами в регионах с несбалансированным рынком труда, устойчивым эконо- мическим ростом, социальным благополучием, доступной квалифицированной медицинской помощью в купе с реализуемыми программами способно в дальнейшей перспективе привести к переходу от депопуляции населения к расширенному воспроизводству. Разработанные модели позволяют оценить степень влияния тех или иных сфер жизнедеятельности на этот процесс, как следствие, они могут быть использованы в качестве моделей управления при принятии решений об адресном финансировании конкретных направлений развития не только в рамках страны в целом, но и в отдельно взятых регионов.

Статья научная