Корреляционно-регрессионный анализ жилищных условий населения Республики Мордовия
Бесплатный доступ
Одной из задач статистического исследования является изучение взаимосвязей между явлениями и процессами с целью определения факторов, оказывающих основное влияние на их вариацию. В статье проведен анализ обеспеченности населения региона жильем на основе корреляционно-регрессионного анализа. Установлено, что наиболее значимыми факторами являются индекс цен на первичном рынке жилья и размер тарифов на услуги ЖКХ.
Индекс цен на первичном рынке жилья, корреляционно-регрессионный анализ, обеспеченность населения жильем, размер тарифов на услуги жкх, рынок жилья
Короткий адрес: https://sciup.org/147248822
IDR: 147248822
Текст научной статьи Корреляционно-регрессионный анализ жилищных условий населения Республики Мордовия
Социально-экономические явления редко развиваются индивидуально, а чаще всего образуют целые комплексы, где одно самостоятельное явление влияет на другие или само подчиняется влиянию других явлений. Для достоверного отображения существующих социально-экономических явлений необходимо выявить имеющиеся взаимосвязи и дать им количественную оценку. Поэтому одна из задач статистического исследования состоит в изучении связей между наблюдаемыми явлениями и процессами, что позволяет определить факторы (признаки), оказывающие основное влияние на вариацию изучаемых явлений и процессов. Такая задача чаще всего решается методами корреляционно-регрессионного анализа, который включает в себя измерение тесноты, направления связи и установление аналитического выражения (формы) связи. Для этого строятся регрессионные модели влияния факторов на исследуемый процесс или явление.
Корреляционно-регрессионный анализ в рамках данного исследования проведен для выявления основных факторов, оказавших влияние на жилищные условия населения Республики Мордовия в 2000-2011 гг., характеризующиеся обеспеченностью населения жильем.
Абстрактно-логический анализ категорий сферы социально-экономических характеристик жилищных условий населения позволил выделить из массива данных государственной статистики следующие показатели для проведения корреляционно – регрессионного анализа обеспеченности населения региона жильем (Y - площадь жилищ, приходящаяся в среднем на одного жителя (на конец года), кв. м.):
X 1 – индекс цен на первичном рынке жилья, процентов;
Х 2 – ввод в действие жилых домов, тыс. кв. м. общей площади;
Х 3 – инвестиции в основной капитал организаций, осуществляющих строительную деятельность, в процентах к соответствующему периоду предыдущего года в сопоставимых ценах;
Х 4 – реальные располагаемые денежные доходы, в процентах к предыдущему году;
Х 5 – численность населения с денежными доходами ниже величины прожиточного минимума, в процентах от общей численности;
Х 6 – удельный вес расходов домашних хозяйств на оплату ЖКХ, процентов;
Х 7 – уровень зарегистрированной безработицы (зарегистрированные безработные к численности экономически активного населения), процентов;
Х 8 – брачность (количество браков на 1000 человек населения);
Х 9 – удельный вес числа семей, состоявших на учете на получение жилья, в общем числе семей (на конец года), процентов.
Матрица исходных данных представлена в таблице 1.
Таблица 1
Исходные данные для корреляционно-регрессионного анализа
Год |
Y |
Х1 |
Х2 |
Х3 |
Х4 |
Х5 |
Х6 |
Х7 |
Х8 |
Х9 |
2000 |
19,7 |
182,1 |
120,7 |
117,9 |
105,1 |
52,9 |
5,0 |
2,1 |
5,8 |
13,5 |
2001 |
20,0 |
183,5 |
116,7 |
155,9 |
109,1 |
49,5 |
5,6 |
2,0 |
6,3 |
13,3 |
2002 |
20,4 |
144,5 |
126,0 |
127,0 |
112,7 |
44,6 |
6,9 |
1,9 |
6,3 |
13,2 |
2003 |
21,1 |
153,7 |
126,6 |
167,6 |
112,2 |
36,1 |
7,1 |
1,8 |
7,1 |
10,2 |
2004 |
21,5 |
155,9 |
134,2 |
20,4 |
105,0 |
32,0 |
7,3 |
1,9 |
6,1 |
6,4 |
2005 |
22,0 |
180,7 |
144,9 |
71,3 |
110,7 |
30,1 |
8,8 |
1,5 |
6,6 |
6,7 |
2006 |
22,5 |
213,2 |
119,1 |
220,0 |
107,4 |
28,7 |
7,5 |
1,4 |
6,8 |
6,7 |
2007 |
22,9 |
242,8 |
124,1 |
45,6 |
114,7 |
24,6 |
6,9 |
1,3 |
7,8 |
7,3 |
2008 |
23,4 |
284,1 |
139,2 |
96,8 |
118,4 |
20,4 |
6,4 |
1,1 |
7,1 |
7,8 |
2009 |
23,9 |
276,6 |
86,7 |
51,7 |
101,5 |
19,7 |
7,7 |
1,7 |
7,0 |
8,2 |
2010 |
24,0 |
288,9 |
98,4 |
186,0 |
110,0 |
18,3 |
7,5 |
1,5 |
7,0 |
8,7 |
2011 |
24,5 |
298,0 |
101,9 |
143,7 |
96,7 |
20,2 |
9,0 |
1,2 |
7,7 |
8,3 |
Изучение взаимосвязи между явлениями начинается с установления ее тесноты, что производится методами корреляционного анализа. Основой измерения связей является матрица парных коэффициентов корреляции. В ППП «Statistica», используя значения таблицы 1, была получена матрица парных коэффициентов корреляции с указанием вероятности принятия гипотезы об их незначимости. На основании её данных определили зависимости между результативными и факторными признаками (таблица 2).
Таблица 2
Матрица парных коэффициентов корреляции
Y |
Х1 |
Х2 |
Х3 |
Х4 |
Х5 |
Х6 |
Х7 |
Х8 |
Х9 |
|
Y |
1,00 |
0,88 |
-0,45 |
-0,05 |
-0,21 |
-0,97 |
0,66 |
-0,82 |
0,78 |
-0,70 |
Х1 |
1,00 |
-0,56 |
0,05 |
-0,20 |
-0,79 |
0,31 |
-0,73 |
0,68 |
-0,39 |
|
Х2 |
1,00 |
-0,24 |
0,61 |
0,30 |
-0,14 |
-0,01 |
-0,28 |
-0,11 |
||
Х3 |
1,00 |
-0,01 |
0,13 |
-0,07 |
-0,04 |
0,03 |
0,30 |
|||
Х4 |
1,00 |
0,07 |
-0,35 |
-0,16 |
0,04 |
0,04 |
||||
Х5 |
1,00 |
-0,68 |
0,82 |
-0,75 |
0,81 |
|||||
Х6 |
1,00 |
-0,54 |
0,52 |
-0,67 |
||||||
Х7 |
1,00 |
-0,81 |
0,68 |
|||||||
Х8 |
1,00 |
-0,50 |
||||||||
Х9 |
1,00 |
По значениям, представленным в таблице 2 видно, что в ряде случаев связь является отрицательной, то есть с ростом показателей происходит уменьшение обеспеченности населения региона жильем. Исключение составляют три признака: ввод в действие жилых домов (X 1 ), удельный вес расходов домашних хозяйств на оплату ЖКХ (Х 6 ) и показатель брачности (Х 8 ). Полученные направления связи в ряде случаев выгладят нелогичными: отрицательная зависимость между Y и Х 3 , Y и Х 4 , и Y и Х 9 . Это объясняется временным лагом, т.е. текущее обеспечение населения жильем удовлетворяет потребности семей, вставших на учет в предыдущие годы (Х 6 ) и инвестиции в организации, осуществляющие строительную деятельность, способствуют росту объемов строительства не в текущем периоде, а по истечении определенного времени. Кроме того, это может быть объяснено тем, что некоторые факторные признаки находятся в зависимости друг от друга, то есть являются мультиколлинеарными – значения коэффициентов корреляции между ними больше 0,8.
Для устранения обозначенных проблем и недопущения искажения коэффициентов уравнения регрессии часть мультиколлинеарных факторов были устранены из дальнейшего анализа Х 5 , Х 7 и Х 9 ). После этого пересчитали матрицу парных коэффициентов корреляции.
Анализ парных коэффициентов корреляции, указывает на отсутствие мультиколлинеарности между факторами, следовательно, в процедуру последующего регрессионного анализа следует включить все шесть оставшихся факторов. Процесс пошагового регрессионного анализа состоит из последовательности следующих шагов:
-
1) построение уравнения регрессии;
-
2) проверка значимости уравнения регрессии;
-
3) проверка значимости коэффициентов уравнения регрессии;
-
4) расчёт характеристик регрессии: бета-коэффициентов, коэффициентов
эластичности и других.
Для описания влияния выделенных показателей на обеспеченность населения Республики Мордовия жильем строится регрессионная модель. Математически задача формулируется следующим образом: требуется найти аналитическое выражение зависимости экономического явления от определяющих его факторов, то есть необходимо найти функцию:
Y = f(X v X 2 ,...,X k ) (1)
Цель состоит в том, чтобы раскрыть характер и степень влияния аргументов на функцию. Параметры уравнения регрессии находятся методом наименьших квадратов, сущность которого заключается в отыскании таких параметров а п , для которых сумма квадратов отклонений расчетных значений результативного признака от эмпирических (фактических) будет минимальной. С помощью ППП «Statistica» получили результаты, представленные в таблице 3.
Таблица 3
Предварительные результаты регрессионного анализа
Характеристики параметров регрессионной модели |
||||
Независимые факторы |
бета-коэффициенты |
Параметры уравнения |
t-критерий Стьюдента |
Вероятность ошибки t-критерия Стьюдента |
Свободный параметр |
9,773 |
2,957 |
0,032 |
|
X1 |
0,695 |
0,020 |
5,055 |
0,004 |
Х2 |
-0,080 |
-0,008 |
-0,536 |
0,615 |
ХЗ |
-0,074 |
-0,002 |
-0,814 |
0,452 |
Х4 |
0,127 |
0,035 |
0,914 |
0,403 |
Х6 |
0,451 |
0,645 |
3,708 |
0,014 |
Х8 |
0,047 |
0,127 |
0,324 |
0,759 |
На основе таблицы 2 составлено предварительное уравнение регрессии:
Y = 9,773 + 0,020 - Xx - 0,008 • Х 2 - 0,002 • Х 3 + 0,035 • X 4 + 0,645 • X 6 + 0,127 • X8
(0,032) (0,004) (0,615) (0,452) (0,403) (0,014) (0,759) (2)
R = 0.9817 R2 = 0.9638 F = 22.183
Необходимо определить, является ли данное уравнение статистически значимым. Это можно сделать с применением F-критерия Фишера, рассчитываемого по формуле:
D 2
F = общ расч 2
ост
Далее полученное по этой формуле значение сравнивается с теоретическим значением, получаемым из специальных таблиц для заданных условий значимости (вероятности ошибки, равной в нашем случае 5%, и степеней свободы к и п-к-1). Если фактическое значение оказывается больше табличного, то гипотеза о статистической незначимости уравнения отклоняется в пользу противоположной. Проверка с помощью F-критерия Фишера показала, что уравнение является статистически значимым, так как его расчетное значение оказалось больше табличного (22,183>4,9502), то есть оно объективно характеризует существующие взаимосвязи. Однако при этом только для одного фактора выполняется проверка на статистическую значимость, которая осуществляется с помощью t-критерия Стьюдента по формуле:
t
a j
a
S
a j
где S – это квадратный корень из элементов главной диагонали ковариационной матрицы.
Находится табличное значение статистики Стьюдента при уровне значимости р и степенях свободы (n-k-l) . Коэффициент регрессии признается значимым, если расчётное значение t-критерия больше табличного.
Последний столбец таблицы 3 показывает, что вероятность для 4 из 6 признаков превышает допустимые 5%, поэтому методом пошаговой регрессии будем исключать из модели по одному факторному признаку. В результате получили новую модель (таблица 4).
Таблица 4
Итоговый результат регрессионного анализа
Характеристики регрессионной модели |
||||
Множественный коэффициент корреляции R |
0,9742 |
|||
Множественный коэффициент детерминации R2 |
0,9491 |
|||
F-критерий Фишера Ft |
83,923 (4,2564) |
|||
Характеристики параметров регрессионной модели |
||||
Независимые факторы |
Параметры уравнения |
Бета-коэффициенты |
t-критерий Стьюдента |
Вероятность ошибки t-критерия Стьюдента |
Свободный параметр |
13,184 |
16,266 |
0,000 |
|
Х1 |
0,021 |
0,750 |
9,478 |
0,000 |
Х6 |
0,614 |
0,430 |
5,425 |
0,000 |
В результате уравнение регрессии имеет следующий вид:
Y = 13,1843 + 0,021 - X + 0,614 • X6
(16,266) (9,478) (5,425) (5) R = 0.9742 R2 = 0.9491 F = 83.923
Проведенная проверка с помощью F-критерия Фишера показала, что сравнение является статистически значимым (расчетное значение оказалось больше табличного – 83,923>4,2564). Также статистически значимыми являются и все оставшиеся в модели признаки. Оставшиеся в модели два признака на 94,9% определяют вариацию результативного показателя (об этом свидетельствует величина множественно коэффициента детерминации, равного 0,949). Теснота связи между этими признаками весьма высокая, что подтверждает значение множественного коэффициента корреляции (0,974).
Следовательно, на обеспеченность населения региона жильем оказывают влияние два фактора: индекс цен на первичном рынке жилья (X 1 ) и удельный вес расходов домашних хозяйств на оплату ЖКХ (Х 6 ). Причем оба фактора оказывают положительное влияние на результативный показатель, т.е. при увеличении индекса цен на первичном рынке жилья на 1 ед., площадь жилищ, приходящаяся в среднем на одного жителя возрастет на 0,0,21 кв.м. в среднем, а рост удельного веса расходов домашних хозяйств на оплату ЖКХ (Х 6 ) на 1 % приведет к увеличению площади жилищ, приходящейся в среднем на одного жителя на 0,615 кв.м в среднем.
Вычислим нормированные коэффициенты регрессии (коэффициенты эластичности) определяющие меру влияния вариации соответствующего фактора на вариацию результативного признака, и показывающие, на сколько процентов изменится величина обеспеченности жильем, если значение какого-либо из трех признаков увеличится на 1%: для X 1 коэффициент эластичности составляет 2,11%, а для Х 6 – 19,79%. Таким образом, на величину площади жилищ, приходящуюся в среднем на одного жителя Республики Мордовия, наибольшее влияние оказывает удельный вес расходов домашних хозяйств на оплату ЖКХ (Х 1 ).
В результате приведенного анализа получили следующие результаты: уравнение и образующие его факторы статистически значимы, весьма высоким является значение коэффициента детерминации (94,9%), т.е. оставшиеся в модели три признака в значительной степени определяют вариацию результативного показателя. Установлено, что жилищные условия населения Республики Мордовия, характеризуемые уровнем обеспеченности жильем, зависят от ценообразования на рынке жилья, характеризующимся индексом цен на первичном рынке жилья и покупательской способности населения региона, определяемой удельным весом расходов домашних хозяйств на оплату ЖКХ.