Корреляционно-регрессионный анализ численности населения крупнейших городов России
Бесплатный доступ
В данной статье рассматривается построение многофакторной модели численности населения крупнейших городов с применением программы для работы с электронными таблицами «Microsoft Excel», оснащенного необходимым набором функций. В качестве факторных признаков взяты следующие: средняя номинальная заработная плата, основные фонды, инвестиции в основной капитал, стоимость ЖКХ, стоимость жилья.
Многофакторная модель, регрессия, корреляция, демография, население, программа "microsoft excel"
Короткий адрес: https://sciup.org/140279844
IDR: 140279844
Correlation and regression analysis of population the largest cities of Russia
This article discusses the construction of multifactor regression models of population largest cities using the Microsoft Excel. Consider the following factor signs: average nominal wage, investment in fixed assets, the cost of utilities, the cost per square meter of housing.
Текст научной статьи Корреляционно-регрессионный анализ численности населения крупнейших городов России
Знания экономической и эконометрической статистики необходимы для решения задач в области социологических и маркетинговых исследований. Статистический анализ позволяет выявить тенденции, вероятные альтернативы, связи между данными, на основе чего целесообразно уже принимать решение. Статистика стремится к объективизации, пытаясь избавиться от субъективной стороны, в этом ее огромное преимущество по сравнению с решениями, принятыми отчасти на интуиции. В условиях сегодняшней рыночной системы знание точной информации, основанной на принципах эконометрики, - важный инструмент для конкурентоспособности на микроуровне и макроуровне. Для специалиста по социологии и экономике умение обращаться с современными компьютерными программами для обработки статистической информации позволит автоматизировать объемные вычисления.
В данной работе была использована программа для работы с электронными таблицами «Microsoft Excel» для анализа экономикоматематической модели. Для обработки статистической информации использовались функции «Регрессия» и «Корреляция» внутри программы.
В качестве исходных данных были взяты следующие показатели по 15 городам России, численность населения которых превышает 1 млн. человек. Показатели взяты за 2016 год. Соответственно результативным фактором стал показатель численности населения. Основываясь на статистических предположениях о взаимосвязях результативного и факторных признаков, в модель были включены следующие переменные (независимые) (см. Таблица 1):
-
- x1 – средняя начисленная номинальная заработная плата, руб.;
-
- x2 – наличие основных фондов организаций, млн. руб.;
-
- x3 – инвестиции в основной капитал, млн. руб.;
-
- x4 – годовая стоимость ЖКХ (исходя из площади в 45 кв.м.), руб.;
-
- x5 - стоимость кв. м. жилья, руб.;
-
- x6 - обеспеченность ТЦ, кв. м на 1 тыс. жителей;
-
- y – население, чел. (в качестве наблюдения взяты города – миллионнеры).
Таблица 1 – Исходные данные для проведения корреляционно- регрессионного анализа [1; 2]
|
Города (наблюдения) |
y |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
|
Волгоград |
1016000 |
29902,4 |
889610,5 |
101042,1 |
35069 |
50395 |
281 |
|
Воронеж |
1032000 |
30819,6 |
713939,3 |
63260,8 |
34382 |
49525 |
321 |
|
Екатеринбург |
1444000 |
41477,7 |
2496786,3 |
105644,1 |
38004 |
73539 |
477 |
|
Казань |
1217000 |
34741 |
1177816 |
108722,5 |
34313 |
67584 |
300 |
|
Красноярск |
1067000 |
39671,9 |
830925,7 |
66542,4 |
34665 |
57083 |
201 |
|
Москва |
12330000 |
64310 |
12243250,7 |
1611512 |
48929 |
217054 |
376 |
|
Нижний Новгород |
1267000 |
36406,8 |
974449,1 |
95743,9 |
43544 |
63929 |
500 |
|
Новосибирск |
1584000 |
37093 |
923633,5 |
77557,5 |
31203 |
61635 |
230 |
|
Омск |
1178000 |
31077,4 |
592333,5 |
57710,6 |
32196 |
47778 |
221 |
|
Пермь |
1042000 |
36756,3 |
938139,1 |
117093,3 |
36331 |
54034 |
133 |
|
Ростов-на-Дону |
1120000 |
35394,7 |
1095005,5 |
106443,6 |
37096 |
61455 |
342 |
|
Самара |
1171000 |
34234,1 |
1302540,2 |
87009,8 |
34168 |
62672 |
562 |
|
Санкт-Петербург |
5226000 |
44187 |
4102243,8 |
521293 |
34035 |
108779 |
388 |
|
Уфа |
1111000 |
35674,1 |
1196775,8 |
97286,8 |
34599 |
65469 |
336 |
|
Челябинск |
1192000 |
32711 |
755367,3 |
81851,8 |
28147 |
45718 |
306 |
В процессе выполнения работы на первом этапе были собраны исходные данные, основным источник послужили статистические сборники Росстата, но при заполнении данных по обеспеченности городов ТЦ были использованы материалы Cushman & Wakefield. При этом показатель годовой стоимости ЖКХ рассчитывается для площади 45 м2 (годовое потребление электричества = 2400 кВт*ч; горячей и холодной воды по 24 м3).
Далее необходимо провести корреляцию показателей для выяснения мультиколлинеарности связей. Используется следующая «Корреляция». Полученный результат представлен в таблице 2.
Таблица 2 – Данные для определения коллинеарности признаков
|
y |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
|
|
y |
1 |
||||||
|
x1 |
0,933555 |
1 |
|||||
|
x2 |
0,987431 |
0,951136 |
1 |
||||
|
x3 |
0,994962 |
0,930206 |
0,991161 |
1 |
|||
|
x4 |
0,669242 |
0,728452 |
0,722351 |
0,704162 |
1 |
||
|
x5 |
0,985535 |
0,960097 |
0,992557 |
0,985598 |
0,735705 |
1 |
|
|
x6 |
0,15987 |
0,179862 |
0,217336 |
0,147032 |
0,362317 |
0,235489 |
1 |
Таким образом, из возможных факторов остается «Средняя начисленная номинальная заработная плата», «Наличие основных фондов», «Инвестиции в основной капитал», «Годовая стоимость ЖКХ», «Стоимость жилья». Факторный признак «Обеспеченность ТЦ» отпадает, показав самую низкую тесноту связи (0,16).
Представим регрессию из оставшихся факторов через функцию «Регрессия». Результаты представлены чуть ниже в таблице 3. R-квадрат равен – 0,87 (очень сильная детерминационная связь).
Таблица 3 – Результаты регрессионного анализа
|
Регрессионная статистика |
|
|
Множественный R |
0,950999405 |
|
R-квадрат |
0,904399868 |
Выходит, что 90% вариации результата объясняется вариацией признаков-факторов. Коэффициент множественной корреляции составил
0,95, что говорит о сильной тесноте связи. Это является достаточным для использования модели.
Также то, что вариант модели является статистически надежным, указывает F-критерий Фишера, который составил 319, 2. Критическим значением для уровня значимости 0,05 при числе степеней свободы 5 и 9 является 3,5.
Дополним нашу модель результатами дисперсионного анализа (см. Таблицу 4).
Таблица 4 – Результаты дисперсионного анализа
|
Коэффициенты |
Стандартная ошибка (m a и m b) |
t-статистика (t a и t b) |
|
|
Y-пересечение |
838712,0318 |
1124581,662 |
0,745799136 |
|
Средняя начисленная номинальная заработная плата, руб. (X1) |
12,4347959 |
34,84104228 |
0,356900801 |
|
Наличие основных фондов организаций, млн. руб. (X2) |
-0,1649883 |
0,271497465 |
-0,607697387 |
|
Инвестиции в основной капитал, млн. руб. (X3) |
6,384169337 |
1,548116962 |
4,123828816 |
|
Годовая стоимость ЖКХ (исходя из площади в 45 кв.м.), руб (X4) |
-52,51125891 |
22,62490474 |
-2,320949393 |
|
Стоимость кв. м. жилья, руб. (X5) |
23,47374156 |
16,8108889 |
1,396341485 |
Таким образом, зная коэффициенты, можно построить уравнение множественной регрессии:
y x = 838712 + 12,4x1 - 0,2x2 + 6,4x3 - 52,5x4 + 23,5x5 (1)
Самую большую тесноту показывает показатель «годовая стоимость ЖКХ». Существенная отрицательная связь с признаком «Годовая стоимость ЖКХ», где коэффициент регрессии равен (-52,51), то есть при увеличении годовой стоимости ЖКХ на 1 руб. уменьшается количество населения 52,5 человека. На первый взгляд, вызывает сомнения положительная величина коэффициента регрессии у показателя «Стоимость квадратного метра», но это можно объяснить просчетами модели: логично предположить, что чем больше населения в городе, тем дороже там жилье. В данном случае результативным фактором мог вполне наоборот выступать показатель ««Стоимость квадратного метра». Наименее оказывающим влияние признаком является наличие основных фондов (-0,16).
Таким образом, использовав в качестве инструмента экономикоматематического моделирования корреляцию и регрессию, были определены показатели, которые, возможно выступают как факторный признака по своему влиянию на показатель «Население».
Список литературы Корреляционно-регрессионный анализ численности населения крупнейших городов России
- Обеспеченность торговыми площадями, города России [Электронный ресурс]. - Режим доступа: http://cwrussia.ru/analytics/infographic/office-property-map.html/ (дата обращения: 12.01.2018)
- Россия в цифрах. 2017: Крат.стат.сб./Росстат- M., - 2017 - 511 с