Корреляционно-регрессионный анализ численности населения крупнейших городов России

Автор: Кесаев У.С.

Журнал: Форум молодых ученых @forum-nauka

Статья в выпуске: 1 (17), 2018 года.

Бесплатный доступ

В данной статье рассматривается построение многофакторной модели численности населения крупнейших городов с применением программы для работы с электронными таблицами «Microsoft Excel», оснащенного необходимым набором функций. В качестве факторных признаков взяты следующие: средняя номинальная заработная плата, основные фонды, инвестиции в основной капитал, стоимость ЖКХ, стоимость жилья.

Многофакторная модель, регрессия, корреляция, демография, население, программа "microsoft excel"

Короткий адрес: https://sciup.org/140279844

IDR: 140279844

Текст научной статьи Корреляционно-регрессионный анализ численности населения крупнейших городов России

Знания экономической и эконометрической статистики необходимы для решения задач в области социологических и маркетинговых исследований. Статистический анализ позволяет выявить тенденции, вероятные альтернативы, связи между данными, на основе чего целесообразно уже принимать решение. Статистика стремится к объективизации, пытаясь избавиться от субъективной стороны, в этом ее огромное преимущество по сравнению с решениями, принятыми отчасти на интуиции. В условиях сегодняшней рыночной системы знание точной информации, основанной на принципах эконометрики, - важный инструмент для конкурентоспособности на микроуровне и макроуровне. Для специалиста по социологии и экономике умение обращаться с современными компьютерными программами для обработки статистической информации позволит автоматизировать объемные вычисления.

В данной работе была использована программа для работы с электронными таблицами «Microsoft Excel» для анализа экономикоматематической модели. Для обработки статистической информации использовались функции «Регрессия» и «Корреляция» внутри программы.

В качестве исходных данных были взяты следующие показатели по 15 городам России, численность населения которых превышает 1 млн. человек. Показатели взяты за 2016 год. Соответственно результативным фактором стал показатель численности населения. Основываясь на статистических предположениях о взаимосвязях результативного и факторных признаков, в модель были включены следующие переменные (независимые) (см. Таблица 1):

  • -     x1 – средняя начисленная номинальная заработная плата, руб.;

  • -     x2 – наличие основных фондов организаций, млн. руб.;

  • -     x3 – инвестиции в основной капитал, млн. руб.;

  • -    x4 – годовая стоимость ЖКХ (исходя из площади в 45 кв.м.), руб.;

  • -     x5 - стоимость кв. м. жилья, руб.;

  • -     x6 - обеспеченность ТЦ, кв. м на 1 тыс. жителей;

  • -    y – население, чел. (в качестве наблюдения взяты города – миллионнеры).

Таблица 1  – Исходные данные для проведения корреляционно- регрессионного анализа [1; 2]

Города (наблюдения)

y

x1

x2

x3

x4

x5

x6

Волгоград

1016000

29902,4

889610,5

101042,1

35069

50395

281

Воронеж

1032000

30819,6

713939,3

63260,8

34382

49525

321

Екатеринбург

1444000

41477,7

2496786,3

105644,1

38004

73539

477

Казань

1217000

34741

1177816

108722,5

34313

67584

300

Красноярск

1067000

39671,9

830925,7

66542,4

34665

57083

201

Москва

12330000

64310

12243250,7

1611512

48929

217054

376

Нижний

Новгород

1267000

36406,8

974449,1

95743,9

43544

63929

500

Новосибирск

1584000

37093

923633,5

77557,5

31203

61635

230

Омск

1178000

31077,4

592333,5

57710,6

32196

47778

221

Пермь

1042000

36756,3

938139,1

117093,3

36331

54034

133

Ростов-на-Дону

1120000

35394,7

1095005,5

106443,6

37096

61455

342

Самара

1171000

34234,1

1302540,2

87009,8

34168

62672

562

Санкт-Петербург

5226000

44187

4102243,8

521293

34035

108779

388

Уфа

1111000

35674,1

1196775,8

97286,8

34599

65469

336

Челябинск

1192000

32711

755367,3

81851,8

28147

45718

306

В процессе выполнения работы на первом этапе были собраны исходные данные, основным источник послужили статистические сборники Росстата, но при заполнении данных по обеспеченности городов ТЦ были использованы материалы Cushman & Wakefield. При этом показатель годовой стоимости ЖКХ рассчитывается для площади 45 м2 (годовое потребление электричества = 2400 кВт*ч; горячей и холодной воды по 24 м3).

Далее необходимо провести корреляцию показателей для выяснения мультиколлинеарности связей. Используется следующая «Корреляция». Полученный результат представлен в таблице 2.

Таблица 2 – Данные для определения коллинеарности признаков

y

x1

x2

x3

x4

x5

x6

y

1

x1

0,933555

1

x2

0,987431

0,951136

1

x3

0,994962

0,930206

0,991161

1

x4

0,669242

0,728452

0,722351

0,704162

1

x5

0,985535

0,960097

0,992557

0,985598

0,735705

1

x6

0,15987

0,179862

0,217336

0,147032

0,362317

0,235489

1

Таким образом, из возможных факторов остается «Средняя начисленная номинальная заработная плата», «Наличие основных фондов», «Инвестиции в основной капитал», «Годовая стоимость ЖКХ», «Стоимость жилья». Факторный признак «Обеспеченность ТЦ» отпадает, показав самую низкую тесноту связи (0,16).

Представим регрессию из оставшихся факторов через функцию «Регрессия». Результаты представлены чуть ниже в таблице 3. R-квадрат равен – 0,87 (очень сильная детерминационная связь).

Таблица 3 – Результаты регрессионного анализа

Регрессионная статистика

Множественный R

0,950999405

R-квадрат

0,904399868

Выходит, что 90% вариации результата объясняется вариацией признаков-факторов. Коэффициент множественной корреляции составил

0,95, что говорит о сильной тесноте связи. Это является достаточным для использования модели.

Также то, что вариант модели является статистически надежным, указывает F-критерий Фишера, который составил 319, 2. Критическим значением для уровня значимости 0,05 при числе степеней свободы 5 и 9 является 3,5.

Дополним нашу модель результатами дисперсионного анализа (см. Таблицу 4).

Таблица 4 – Результаты дисперсионного анализа

Коэффициенты

Стандартная ошибка (m a и m b)

t-статистика (t a и t b)

Y-пересечение

838712,0318

1124581,662

0,745799136

Средняя начисленная номинальная заработная плата, руб. (X1)

12,4347959

34,84104228

0,356900801

Наличие основных фондов организаций, млн. руб. (X2)

-0,1649883

0,271497465

-0,607697387

Инвестиции в основной капитал, млн. руб. (X3)

6,384169337

1,548116962

4,123828816

Годовая стоимость ЖКХ (исходя из площади в 45 кв.м.), руб (X4)

-52,51125891

22,62490474

-2,320949393

Стоимость кв. м. жилья, руб. (X5)

23,47374156

16,8108889

1,396341485

Таким образом, зная коэффициенты, можно построить уравнение множественной регрессии:

y x = 838712 + 12,4x1 - 0,2x2 + 6,4x3 - 52,5x4 + 23,5x5        (1)

Самую большую тесноту показывает показатель «годовая стоимость ЖКХ». Существенная отрицательная связь с признаком «Годовая стоимость ЖКХ», где коэффициент регрессии равен (-52,51), то есть при увеличении годовой стоимости ЖКХ на 1 руб. уменьшается количество населения 52,5 человека. На первый взгляд, вызывает сомнения положительная величина коэффициента регрессии у показателя «Стоимость квадратного метра», но это можно объяснить просчетами модели: логично предположить, что чем больше населения в городе, тем дороже там жилье. В данном случае результативным фактором мог вполне наоборот выступать показатель ««Стоимость квадратного метра». Наименее оказывающим влияние признаком является наличие основных фондов (-0,16).

Таким образом, использовав в качестве инструмента экономикоматематического моделирования корреляцию и регрессию, были определены показатели, которые, возможно выступают как факторный признака по своему влиянию на показатель «Население».

Список литературы Корреляционно-регрессионный анализ численности населения крупнейших городов России

  • Обеспеченность торговыми площадями, города России [Электронный ресурс]. - Режим доступа: http://cwrussia.ru/analytics/infographic/office-property-map.html/ (дата обращения: 12.01.2018)
  • Россия в цифрах. 2017: Крат.стат.сб./Росстат- M., - 2017 - 511 с
Статья научная