Оценка уровня жизни населения Калужской области с помощью эконометрического моделирования

Бесплатный доступ

Проведен всесторонний анализ уровня жизни населения Калужской области с помощью эконометрических методов, определены ключевые факторы, оказывающие влияние на его динамику, а также оценена степень и направленность их воздействия. В ходе анализа установлено, что коэффициент Джини оказывает наиболее значимое воздействие на доходы населения. Это указывает на то, что уровень экономического неравенства в регионе является более значимым фактором, чем другие рассматриваемые социально-экономические показатели.

Качество уровня жизни, эконометрическое моделирование, Калужская область, тест Дики-Фуллера, модель ARIMA, коэффициент Джини, Gretl

Короткий адрес: https://sciup.org/148332976

IDR: 148332976

Assessment of the lifestyle of the population of the Kaluga region using econometric modeling

A comprehensive analysis of the living standards of the population of the Kaluga region was conducted using econometric methods, and the key factors influencing its dynamics were identified and evaluated. The analysis revealed that the Gini coefficient has the most significant impact on the population's income. This indicates that the level of economic inequality in the region is a more significant factor than other socioeconomic indicators considered.

Текст научной статьи Оценка уровня жизни населения Калужской области с помощью эконометрического моделирования

Уровень жизни населения является одним из важных показателей оценки эффективности социальноэкономической политики региона и определяется через комплекс критериев качества жизни населения при помощи социально-экономических показателей, которые формируются на основе статистических данных, показывающих объем, состав, использование и распределение между определенными группами населения [1]. Уровень жизни – это комплексная социально-экономическая категория, отражающая степень удовлетворения материальных, духовных и социальных потребностей населения. Он характеризует качество жизни людей в конкретном регионе или стране и зависит от множества факторов: экономического развития, социальной политики государства, демографической ситуации, экологических условий и других аспектов.

По уровню жизни Калужская область занимает средние позиции среди регионов России. Согласно рейтингам (см.: , в 2023 году она находилась в топ-15, занимала 12 место по качеству жизни, опережая многие соседние регионы, кроме Москвы и

ГРНТИ 06.52.17

EDN MXAKYV

Дарья Кирилловна Батырова – кандидат экономических наук, доцент кафедры статистики и эконометрики Санкт-

Петербургского государственного экономического университета. ORCID 0000-0002-3079-5751

Московской области. В ходе исследования применен комплекс методов экономико-статистического анализа, корреляционно-регрессионного моделирования и визуализации данных, позволяющих всесторонне оценить факторы, влияющие на уровень жизни населения. Информационной основой послужили официальные статистические данные Росстата. Автором дана оценка влияния ключевых социальноэкономических факторов на уровень жизни в Калужской области, выявлены наиболее значимые детерминанты благосостояния населения и определен характер их воздействия.

Материалы и методы

Динамика большинства экономических показателей характеризуются тенденцией и случайными колебаниями, поэтому естественна количественная оценка закономерности развития явления в виде уравнения тренда, то есть трендовой модели. Предполагая сохранение принципа инерционности процессов, трендовая модель экстраполирует на будущее найденную тенденцию, действующую в предпрогнозном периоде. При правильной спецификации модели (выборе математической функции) результаты краткосрочного прогнозирования могут быть неплохими [4].

Для анализа уровня жизни Калужской области были отобраны ключевые показатели (11 показателей), отражающие различные аспекты социально-экономического развития региона. Каждая переменная была включена в модель исходя из ее статистической значимости по t-критерию Стьюдента. Для оценки благосостояния населения за 2000–2023 гг. были проанализированы следующие показатели (см.: :

  •    среднедушевые доходы – основной индикатор материального благополучия (позволяет оценить динамику реальных доходов населения с поправкой на инфляцию, что критически важно для анализа покупательной способности);

  •    доля населения с доходами ниже прожиточного минимума – показатель социального неравенства и бедности (включение в модель помогает выявить масштабы расслоения общества и эффективность социальной политики);

  •    потребительские расходы на душу населения (отражает фактическое потребление товаров и услуг, что дополняет данные о доходах и показывает, как изменения доходов влияют на расходы);

  •    общая площадь жилья на человека – индикатор качества жилищных условий (улучшение этого показателя свидетельствует о развитии инфраструктуры и комфорте проживания);

  •    уровень безработицы – ключевой маркер экономической стабильности. Низкая безработица связана с высоким уровнем жизни, так как обеспечивает население стабильными доходами;

  •    объем инвестиций в основной капитал на душу населения (показатель экономической активности и потенциала роста, инвестиции напрямую влияют на создание рабочих мест и модернизацию производства, что сказывается на благосостоянии);

  •    ВРП на душу населения – агрегированный индикатор экономического развития региона (рост ВРП обычно коррелирует с повышением качества жизни);

  •    численность медперсонала на 10 тыс. чел. (отражает доступность медицинской помощи, что критически важно для оценки социального благополучия);

  •    коэффициент Джини – мера неравенства в распределении доходов (позволяет оценить, насколько рост экономики сопровождается снижением социального расслоения);

  •    число студентов на 10 тыс. чел. – индикатор развития образования и человеческого капитала, который влияет на долгосрочные перспективы региона;

  •    ожидаемая продолжительность жизни – комплексный показатель, зависящий от качества медицины, экологии, доходов и образа жизни населения.

Выбранные переменные охватывают все ключевые сферы, определяющие уровень жизни: экономику (доходы, ВРП, инвестиции), социальную политику (бедность, медицина, образование), инфраструктуру (жилье) и демографию (продолжительность жизни). Их совместный анализ позволяет построить многомерную модель, которая выявит не только индивидуальное влияние каждого фактора, но и их взаимосвязи. Например, рост инвестиций может снижать безработицу, а увеличение числа медработников – повышать продолжительность жизни. Данные за двадцать четыре года дают возможность проследить долгосрочные тренды.

Для сопоставимости данных и исключения влияния демографических колебаний были взяты данные на душу населения. Такой метод устраняет искажения, связанные с абсолютными значениями, и дает возможность анализировать реальную доступность благ для жителей. Например, общие расходы на здравоохранение в регионе малоинформативны без учета количества людей, которые могут воспользоваться этими услугами. Нормированные показатели позволяют выявить истинный уровень обеспеченности социальными благами, доходами или инфраструктурой, что особенно важно для корректного межрегионального сравнения. Некоторые переменные потребовали пересчета с учетом ИПЦ для приведения денежных показателей с учетом инфляции.

Среднедушевые доходы населения являются оптимальной целевой переменной для эконометрического моделирования уровня жизни Калужской области, так как являются интегральным показателем благосостояния. Они напрямую отражают материальное положение населения, которое является ключевым критерием уровня жизни. Этот показатель агрегирует влияние множества факторов: заработной платы, социальных выплат, предпринимательских доходов и других источников. В отличие от узкоспециализированных метрик (например, площадь жилья или число медработников), доходы позволяют оценить общую способность удовлетворять свои потребности.

Доходы населения тесно связаны с потребительскими расходами (чем выше доходы, тем больше тратят домохозяйства); качеством медицинских и образовательных услуг (платежеспособность влияет на доступ к коммерческим услугам); жилищными условиями (возможность приобретения/аренды жилья); социальным неравенством (коэффициент Джини). Анализ стационарности временных рядов проведен с помощью теста Дики-Фуллера, что обеспечивает надежность полученных результатов и соответствие современным стандартам эконометрического анализа (см. табл. 1).

Таблица 1

Результаты теста Дики-Фуллера

Показатель

p-value

Среднедушевые доходы с учетом ИПЦ, руб.

0,970399

Доля населения с доходами ниже прожиточного минимума, %

0,879754

Потребительские расходы на душу населения с учетом ИПЦ, руб.

0,995766

Общая площадь жилья на человека, кв. м

0,998726

Уровень безработицы в трудоспособном возрасте, %

0,998637

Объем инвестиций в основной капитал на душу населения с учетом ИПЦ, руб.

0,808335

ВРП на душу населения с учетом ИПЦ, руб.

0,998836

Численность среднего мед персонала на 10000 населения, чел.

0,990174

Коэффициент Джини

0,054356

Число студентов бакалавриата/специалитета/магистратуры на 10000 населения, чел.

0,667204

Ожидаемая продолжительность жизни, лет

0,861589

Построено автором по данным ЕМИСС.

Исходя из полученных результатов, внесенных в таблицу 1, можно сделать вывод о том, что все переменные являются нестационарными. Проверка на мультиколлинеарность является обязательным этапом эконометрического моделирования, поскольку наличие сильной корреляции между объясняющими переменными существенно искажает результаты анализа. Мультиколлинеарность приводит к неустойчивости оценок коэффициентов регрессии – их значения становятся крайне чувствительными к незначительным изменениям в данных, а стандартные ошибки коэффициентов неоправданно увеличиваются. Это затрудняет интерпретацию модели: формально значимые переменные могут оказаться статистически незначимыми, а знаки коэффициентов – противоречащими экономической логике.

Особенно важно это учитывать при моделировании уровня жизни, где многие социально-экономические показатели тесно взаимосвязаны по своей природе. После анализа матрицы парных коэффициентов корреляции осталось четыре объясняющих переменных, которые были включены в модель: потребительские расходы на душу населения с учетом ИПЦ, число студентов бакалавриата/специали-тета/магистратуры на 10000 населения, численность медицинского персонала на 10000 населения, чел. и коэффициент Джини. В таблице 2 представлены значения коэффициентов корреляции выбранных рядов с целевой переменной ( y – среднедушевые доходы населения с учетом ИПЦ, руб.).

Потребительские расходы на душу населения с учетом ИПЦ имеют слишком высокую корреляцию с целевой переменной (0,997). Такая сильная взаимосвязь создает две основные проблемы для анализа: во-первых, эти переменные по своей экономической сути являются взаимозависимыми – расходы напрямую определяются доходами населения, что делает их включение в модель одновременно методологически некорректным; во-вторых, столь высокая корреляция (близкая к 1) приводит к эффекту мультиколлинеарности, что существенно искажает оценки коэффициентов регрессии для других переменных. Остальные переменные демонстрируют умеренные корреляции (от 0,31 до 0,53), что соответствует ожиданиям и позволяет рассматривать их как потенциально независимые факторы влияния.

Таблица 2

Значения коэффициентов корреляции выбранных рядов со среднедушевыми доходами населения с учетом ИПЦ, руб.

Объясняющая переменная

Значение коэффициента корреляции

Потребительские расходы на душу населения с учетом ИПЦ, руб.

0,997

Число студентов бакалавриата/специалитета/магистратуры на 10000 населения, чел.

-0,53

Численность медицинского персонала на 10000 населения, чел.

0,31

Коэффициент Джини

0,29

Построено автором по данным ЕМИСС.

Построение модели. Практические результаты

Модели ARIMA являются оптимальным выбором для анализа динамики уровня жизни по нескольким ключевым причинам: во-первых, они специально разработаны для работы с нестационарными временными рядами, что характерно для социально-экономических показателей – через параметр d (дифференцирование) модель устраняет нестационарность, сохраняя при этом информативность данных; во-вторых, ARIMA сочетает два важных компонента: авторегрессию (AR), которая учитывает влияние прошлых значений ряда, и скользящее среднее (MA), отражающее влияние прошлых ошибок прогноза. Это особенно полезно для показателей уровня жизни, где текущее состояние часто зависит от предыдущих периодов.

В отличие от простых регрессионных моделей, ARIMA не требует строгой экзогенности переменных и эффективно работает даже при ограниченном наборе данных, что делает её идеальным инструментом для прогнозирования социально-экономических показателей на региональном уровне, таких как динамика доходов в Калужской области. Наиболее сложно определить структуру динамического ряда для выбора параметров модели: p, d, q. На стадии идентификации модели рекомендуется изучать поведение автокорреляционной и частной автокорреляционной функций [2]. Модели класса ARIMA могут использоваться не только как самостоятельные модели при прогнозировании социально-экономических явлений, но и как инструмент корректировки других моделей по временным рядам. В этом случае ARIMA применяется к остаткам модели, рассматриваемой исследователем [3].

Например, строится полиномиальный тренд с высоким значением коэффициента детерминации, но остатки оказались не стационарны. Остатки можно смоделировать с помощью ARIMA, а прогноз представить суммарно как трендовый прогноз + ARIMA прогноз остатков. Аналогично можно корректировать и модель регрессии, построенную по временным рядам, то есть к остаткам от регрессии применяется ARIMA-модель [2].

Для оценки уровня жизни Калужской области в ППП Gretl была построена модель ARIMA (1 2 1). Параметры авторегрессии (AR) и скользящего среднего (MA) имеют значения 1 и 1. Параметр I равен 2, так как для стационарности ряда целевой переменной используется логарифмирование и дифференциация второго порядка. Однако при учете всех факторов (x) модель содержит статистически незначимые переменные по t-критерию Стьюдента. Статистически надежной оказалась модель, содержащая из изначальных факторов только коэффициент Джини. Итоговая модель выглядит следующим образом:

△2log(yt) = 196,203 + 0,605 log(yt_1) - 0,999Et_1 + 66541,5x1>t + Et,

где y t – среднедушевые доходы с учетом ИПЦ в период t , руб.; y t-1 – среднедушевые доходы с учетом ИПЦ в период ( t -1), руб.; S -i — остатки в период ( t -1); x i,t - коэффициент Джини; S t - остатки в период t .

Построенная модель (1,2,1) с двойным дифференцированием зависимой переменной и включением индекса Джини в качестве регрессора продемонстрировала высокое качество и статистическую значимость. Все коэффициенты модели оказались значимыми на 5%-ном уровне значимости, что подтверждает их существенное влияние на исследуемый показатель. Особого внимания заслуживает сильное воздействие индекса Джини (коэффициент 66541,5 при p-value = 0,0118), что свидетельствует о важности учета неравенства доходов при анализе динамики среднедушевые доходов населения. Модель обладает исключительно высокой объясняющей способностью, о чем свидетельствует значение R -квадрат на уровне 0,9896 и скорректированный R -квадрат 0,9885. Такие показатели означают, что модель объясняет около 99% вариации зависимой переменной. Отметим, что информационные критерии (Акаике = 383,44, Шварца = 388,90, Хеннана-Куинна = 384,73) находятся на сопоставимых уровнях, что дополнительно подтверждает адекватность выбранной спецификации.

Коэффициент φ₁ = 0,605 при авторегрессионной компоненте первого порядка свидетельствует о наличии умеренной инерционности в динамике среднедушевых доходов. Это означает, что примерно 60,5% от величины изменения доходов в предыдущем периоде сохраняет свое влияние на текущие показатели. Такая зависимость отражает устойчивость экономических процессов, связанных с формированием доходов населения, и подтверждает наличие адаптивных механизмов, характерных для социально-экономических показателей.

Значимый отрицательный коэффициент θ₁ = -0,999 при компоненте скользящего среднего демонстрирует высокую чувствительность модели к случайным колебаниям предыдущего периода. Практически полная компенсация прошлых шоков указывает на наличие эффективных механизмов саморегуляции в системе распределения доходов, которые быстро нивелируют внешние воздействия и возвращают динамику к устойчивому тренду. Это особенно важно для анализа краткосрочных колебаний доходов.

Коэффициент при переменной «коэффициент Джини» (66541,5) имеет положительное значение и статистически значим ( p = 0,0118). В контексте модели это означает, что увеличение неравенства в распределении доходов на 1 единицу сопровождается ростом среднедушевых доходов в среднем на 66541.

В рамка построенной модели был проведен комплекс диагностических тестов, который позволяет всесторонне оценить ее качество и пригодность для дальнейшего прогноза.

Тест на нормальность распределения остатков показал отсутствие существенных отклонений от нормального закона (χ²=1,874, p-value = 0,392). Это крайне важный результат, поскольку нормальность распределения ошибок является ключевым предположением метода максимального правдоподобия, использованного для оценки параметров модели. Полученные значения свидетельствуют, что остатки модели ведут себя в соответствии с гауссовским распределением, что подтверждает надежность сделанных статистических выводов и корректность расчетов доверительных интервалов для коэффициентов.

Тест на гетероскедастичность (ARCH-тест) не выявил наличия ARCH-эффектов первого порядка (LM = 0,893, p-value = 0,345). Этот результат указывает на постоянство дисперсии ошибок модели на всем анализируемом временном интервале. Отсутствие условной гетероскедастичности означает, что традиционные методы оценки стандартных ошибок остаются валидными, и нет необходимости применять более сложные методы для коррекции волатильности.

Тест на автокорреляцию остатков подтвердил гипотезу об отсутствии значимой автокорреляции вплоть до 4-го порядка (χ² = 2,571 при критическом значении 5,991 для уровня значимости 5%). Этот результат имеет принципиальное значение, так как наличие автокорреляции в остатках могло бы свидетельствовать о неполноте модели либо о пропущенных лаговых зависимостях или о необходимости включения дополнительных регрессоров. Полученные значения статистики теста позволяют заключить, что выбранная спецификация (1 2 1) адекватно улавливает временную структуру зависимостей в данных.

Так, средняя абсолютная процентная ошибка (MAPE = 3,78%) свидетельствует о высоком качестве прогнозов – согласно общепринятой шкале, значения ниже 5% считаются выдающимися. Это означает, что модель в среднем ошибается менее чем на 4% относительно фактических значений, что является отличным результатом для экономических прогнозов.

Заключение

В рамках исследования реализована задача построения адекватной эконометрической модели, описывающей зависимость среднедушевых доходов от ключевых социально-экономических показателей. Выбранная спецификация ARIMA (1 2 1) продемонстрировала высокую объясняющую способность ( R ² = 0,989), что свидетельствует о корректности методологического подхода. Модель не только подтвердила ожидаемую инерционность доходов (φ₁ = 0,605), но и выявила их чувствительность к внешним шокам (θ₁ = -0,999), что соответствует теоретическим представлениям о динамике социально-экономических показателей. Особое значение имеет выполнение задачи по оценке влияния различных факторов на уровень жизни.

В ходе анализа установлено, что коэффициент Джини оказывает наиболее значимое воздействие на доходы населения. После отбора признаков только он вошел в модель. Это указывает на то, что уровень экономического неравенства в регионе является более значимым фактором, чем другие рассматриваемые социально-экономические показатели. Полученные результаты имеют значительную практическую ценность и могут быть использованы как для совершенствования социальной политики в регионе, так и для разработки более сложных эконометрических моделей с учетом дополнительных факторов.