Корреляционно-регрессионный анализ численности населения крупнейших городов России
Бесплатный доступ
В данной статье рассматривается построение многофакторной модели численности населения крупнейших городов с применением программы для работы с электронными таблицами «Microsoft Excel», оснащенного необходимым набором функций. В качестве факторных признаков взяты следующие: средняя номинальная заработная плата, основные фонды, инвестиции в основной капитал, стоимость ЖКХ, стоимость жилья.
Многофакторная модель, регрессия, корреляция, демография, население, программа "microsoft excel"
Короткий адрес: https://sciup.org/140279844
IDR: 140279844
Текст научной статьи Корреляционно-регрессионный анализ численности населения крупнейших городов России
Знания экономической и эконометрической статистики необходимы для решения задач в области социологических и маркетинговых исследований. Статистический анализ позволяет выявить тенденции, вероятные альтернативы, связи между данными, на основе чего целесообразно уже принимать решение. Статистика стремится к объективизации, пытаясь избавиться от субъективной стороны, в этом ее огромное преимущество по сравнению с решениями, принятыми отчасти на интуиции. В условиях сегодняшней рыночной системы знание точной информации, основанной на принципах эконометрики, - важный инструмент для конкурентоспособности на микроуровне и макроуровне. Для специалиста по социологии и экономике умение обращаться с современными компьютерными программами для обработки статистической информации позволит автоматизировать объемные вычисления.
В данной работе была использована программа для работы с электронными таблицами «Microsoft Excel» для анализа экономикоматематической модели. Для обработки статистической информации использовались функции «Регрессия» и «Корреляция» внутри программы.
В качестве исходных данных были взяты следующие показатели по 15 городам России, численность населения которых превышает 1 млн. человек. Показатели взяты за 2016 год. Соответственно результативным фактором стал показатель численности населения. Основываясь на статистических предположениях о взаимосвязях результативного и факторных признаков, в модель были включены следующие переменные (независимые) (см. Таблица 1):
-
- x1 – средняя начисленная номинальная заработная плата, руб.;
-
- x2 – наличие основных фондов организаций, млн. руб.;
-
- x3 – инвестиции в основной капитал, млн. руб.;
-
- x4 – годовая стоимость ЖКХ (исходя из площади в 45 кв.м.), руб.;
-
- x5 - стоимость кв. м. жилья, руб.;
-
- x6 - обеспеченность ТЦ, кв. м на 1 тыс. жителей;
-
- y – население, чел. (в качестве наблюдения взяты города – миллионнеры).
Таблица 1 – Исходные данные для проведения корреляционно- регрессионного анализа [1; 2]
Города (наблюдения) |
y |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
Волгоград |
1016000 |
29902,4 |
889610,5 |
101042,1 |
35069 |
50395 |
281 |
Воронеж |
1032000 |
30819,6 |
713939,3 |
63260,8 |
34382 |
49525 |
321 |
Екатеринбург |
1444000 |
41477,7 |
2496786,3 |
105644,1 |
38004 |
73539 |
477 |
Казань |
1217000 |
34741 |
1177816 |
108722,5 |
34313 |
67584 |
300 |
Красноярск |
1067000 |
39671,9 |
830925,7 |
66542,4 |
34665 |
57083 |
201 |
Москва |
12330000 |
64310 |
12243250,7 |
1611512 |
48929 |
217054 |
376 |
Нижний Новгород |
1267000 |
36406,8 |
974449,1 |
95743,9 |
43544 |
63929 |
500 |
Новосибирск |
1584000 |
37093 |
923633,5 |
77557,5 |
31203 |
61635 |
230 |
Омск |
1178000 |
31077,4 |
592333,5 |
57710,6 |
32196 |
47778 |
221 |
Пермь |
1042000 |
36756,3 |
938139,1 |
117093,3 |
36331 |
54034 |
133 |
Ростов-на-Дону |
1120000 |
35394,7 |
1095005,5 |
106443,6 |
37096 |
61455 |
342 |
Самара |
1171000 |
34234,1 |
1302540,2 |
87009,8 |
34168 |
62672 |
562 |
Санкт-Петербург |
5226000 |
44187 |
4102243,8 |
521293 |
34035 |
108779 |
388 |
Уфа |
1111000 |
35674,1 |
1196775,8 |
97286,8 |
34599 |
65469 |
336 |
Челябинск |
1192000 |
32711 |
755367,3 |
81851,8 |
28147 |
45718 |
306 |
В процессе выполнения работы на первом этапе были собраны исходные данные, основным источник послужили статистические сборники Росстата, но при заполнении данных по обеспеченности городов ТЦ были использованы материалы Cushman & Wakefield. При этом показатель годовой стоимости ЖКХ рассчитывается для площади 45 м2 (годовое потребление электричества = 2400 кВт*ч; горячей и холодной воды по 24 м3).
Далее необходимо провести корреляцию показателей для выяснения мультиколлинеарности связей. Используется следующая «Корреляция». Полученный результат представлен в таблице 2.
Таблица 2 – Данные для определения коллинеарности признаков
y |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
|
y |
1 |
||||||
x1 |
0,933555 |
1 |
|||||
x2 |
0,987431 |
0,951136 |
1 |
||||
x3 |
0,994962 |
0,930206 |
0,991161 |
1 |
|||
x4 |
0,669242 |
0,728452 |
0,722351 |
0,704162 |
1 |
||
x5 |
0,985535 |
0,960097 |
0,992557 |
0,985598 |
0,735705 |
1 |
|
x6 |
0,15987 |
0,179862 |
0,217336 |
0,147032 |
0,362317 |
0,235489 |
1 |
Таким образом, из возможных факторов остается «Средняя начисленная номинальная заработная плата», «Наличие основных фондов», «Инвестиции в основной капитал», «Годовая стоимость ЖКХ», «Стоимость жилья». Факторный признак «Обеспеченность ТЦ» отпадает, показав самую низкую тесноту связи (0,16).
Представим регрессию из оставшихся факторов через функцию «Регрессия». Результаты представлены чуть ниже в таблице 3. R-квадрат равен – 0,87 (очень сильная детерминационная связь).
Таблица 3 – Результаты регрессионного анализа
Регрессионная статистика |
|
Множественный R |
0,950999405 |
R-квадрат |
0,904399868 |
Выходит, что 90% вариации результата объясняется вариацией признаков-факторов. Коэффициент множественной корреляции составил
0,95, что говорит о сильной тесноте связи. Это является достаточным для использования модели.
Также то, что вариант модели является статистически надежным, указывает F-критерий Фишера, который составил 319, 2. Критическим значением для уровня значимости 0,05 при числе степеней свободы 5 и 9 является 3,5.
Дополним нашу модель результатами дисперсионного анализа (см. Таблицу 4).
Таблица 4 – Результаты дисперсионного анализа
Коэффициенты |
Стандартная ошибка (m a и m b) |
t-статистика (t a и t b) |
|
Y-пересечение |
838712,0318 |
1124581,662 |
0,745799136 |
Средняя начисленная номинальная заработная плата, руб. (X1) |
12,4347959 |
34,84104228 |
0,356900801 |
Наличие основных фондов организаций, млн. руб. (X2) |
-0,1649883 |
0,271497465 |
-0,607697387 |
Инвестиции в основной капитал, млн. руб. (X3) |
6,384169337 |
1,548116962 |
4,123828816 |
Годовая стоимость ЖКХ (исходя из площади в 45 кв.м.), руб (X4) |
-52,51125891 |
22,62490474 |
-2,320949393 |
Стоимость кв. м. жилья, руб. (X5) |
23,47374156 |
16,8108889 |
1,396341485 |
Таким образом, зная коэффициенты, можно построить уравнение множественной регрессии:
y x = 838712 + 12,4x1 - 0,2x2 + 6,4x3 - 52,5x4 + 23,5x5 (1)
Самую большую тесноту показывает показатель «годовая стоимость ЖКХ». Существенная отрицательная связь с признаком «Годовая стоимость ЖКХ», где коэффициент регрессии равен (-52,51), то есть при увеличении годовой стоимости ЖКХ на 1 руб. уменьшается количество населения 52,5 человека. На первый взгляд, вызывает сомнения положительная величина коэффициента регрессии у показателя «Стоимость квадратного метра», но это можно объяснить просчетами модели: логично предположить, что чем больше населения в городе, тем дороже там жилье. В данном случае результативным фактором мог вполне наоборот выступать показатель ««Стоимость квадратного метра». Наименее оказывающим влияние признаком является наличие основных фондов (-0,16).
Таким образом, использовав в качестве инструмента экономикоматематического моделирования корреляцию и регрессию, были определены показатели, которые, возможно выступают как факторный признака по своему влиянию на показатель «Население».
Список литературы Корреляционно-регрессионный анализ численности населения крупнейших городов России
- Обеспеченность торговыми площадями, города России [Электронный ресурс]. - Режим доступа: http://cwrussia.ru/analytics/infographic/office-property-map.html/ (дата обращения: 12.01.2018)
- Россия в цифрах. 2017: Крат.стат.сб./Росстат- M., - 2017 - 511 с