Корреляционный анализ рождаемости и численности населения в Орловской области за 2004-2014 годы

Автор: Акимова А.Р.

Журнал: Научный журнал молодых ученых @young-scientists-journal

Рубрика: Технические науки

Статья в выпуске: 2 (5), 2015 года.

Бесплатный доступ

Статья посвящена корреляционному анализу рождаемости и численности населения в Орловской области за 2004-2014 гг.

Население, численность, рождаемость, корреляционный анализ, выборка

Короткий адрес: https://sciup.org/14769645

IDR: 14769645

Текст научной статьи Корреляционный анализ рождаемости и численности населения в Орловской области за 2004-2014 годы

Корреляционный анализ – это группа статистических методов, направленная на выявление и математическое представление структурных зависимостей между выборками [4].

Одной из важнейших задач статистики является изучение существующих связей между явлениями. Проведем анализ взаимосвязи численности населения от факторного признака – рождаемости в Орловской области на протяжении 2004-2014 гг.

Таблица 1 – Исходные данные о рождаемости и численности населения в Орловской области за 2004-2014 гг.

Год

Число родившихся, тыс. чел.

Численность населения, тыс. чел.

2004

7,726

850,016

2005

7,232

835,165

2006

7,492

822,096

2007

7,926

811,389

2008

8,353

805,207

2009

8,447

798,855

2010

8,687

793,144

2011

8,204

785,592

2012

8,718

781,281

2013

8,524

775,826

2014

8,440

769,980

Для определения формы связи между показателями построим эмпирическую линию регрессии. Так как в данной совокупности независимым признаком является рождаемость, а результативным – численность, то ось X – количество родившихся в Орловской области за год, а ось Y – численность сельского населения Орловской области на конец этого же года.

Построим график зависимости на графике 1.

Число родившихся,тыс. чел.

Рисунок 1 – Корреляционное поле зависимости численности населения от рождаемости в Орловской области в 2004-2014 гг.

Анализ точек, расположенных на поле графика позволяет сделать вывод о том, что между изучаемыми факторами существует линейная зависимость, которая математически выражается уравнением прямой линии:

Y = a + bx (1)

где yx - теоретическое значение результативного признака, х – факторный признак, а – параметр уравнения (не имеет экономического смысла), b – Коэффициент регрессии.

Параметры уравнения регрессии а и b определим путем решения системы нормальных уравнений[3]:

^ y=an+b^\

^ ух =а ^ х +b ^ х2

Таблица 2 – Расчет сумм для вычисления параметров уравнения прямой

Год

X

Y

Расчетные величины

X 2

Y 2

X x Y

2004

7,726

850,016

59,691

722527,200

6567,224

2005

7,232

835,165

52,302

697500,577

6039,913

2006

7,492

822,096

56,130

675841,833

6159,143

2007

7,926

811,389

62,821

658352,109

6431,069

2008

8,353

805,207

69,773

648358,313

6725,894

2009

8,447

798,855

71,352

638169,311

6747,928

2010

8,687

793,144

75,464

629077,405

6890,042

2011

8,204

785,592

67,306

617154,790

6444,997

2012

8,718

781,281

76,004

610400,001

6811,208

2013

8,524

775,826

72,659

601905,982

6613,141

2014

8,44

769,98

71,234

592869,200

6498,631

Итого

89,749

8828,551

734,734

7092156,723

71929,190

{ 8828,551 = 89 , 749 b + 11a

1 71929,19 = 89749 a + 734,734 b

11а = 8828,551 – 89749 b a = 802,596 – 8,159 b

89,749 x (802,596 - 8,159 b) + 734,734 b = 71929,19

72032,188 – 732,262 b + 734,734 b = 71929,19

2,472 b = -102,996

b = -41.665 тыс. чел.

Подставив b в одно из уравнений системы, найдем параметр а:

11a+89,749 ×( -41,665 ) =8828,551

11a = 12552,995

а = 1141,178 тыс. чел.

Уравнение зависимости численности населения от численности родившихся будет иметь вид:

Ух = 11441,178 – 41,665x;

Таким образом, исходя из полученного уравнения можно сделать вывод о том, что при увеличении рождаемости на 1 тыс.чел. число жителей Орловской области уменьшится на 41,665 тыс.чел. Для оценки силы связи признаков у и х найдем средний коэффициент эластичности, представляющий собой показатель силы связи фактора x с результатом у , показывающий, на сколько процентов изменится значение у при изменении значения фактора на 1 %:

х

Э=b у

Для этого определим средние значения признаков:

х i х=

n

∑у у= i

n х=89,749=8,159 тыс.чел.

;                                   8828,551

у=         =802,596 тыс.чел.

Вычислим коэффициент эластичности:

8,159

Э=-41,498        = -0,422

802,596

Это означает, что при увеличении рождаемости на 1% численность населения Орловской области снизится на 0,422%.

Для измерения тесноты связи в статистике используют коэффициент корреляции, характеризует тесноту связи между двумя случайными величинами на основе линейной зависимости: [2]

ху-х × у

(σ_х × σ_у )

где - σ_x и σ_y среднее квадратичное отклонение.

ху ху=

n

71929,19

ху=         =6539,017 тыс . чел .

734,734

Oy=  -------- х       11

- ( 8,159 ) 2 =0,474 тыс.чел.

а у = |^ - ( У ) 2

7092156,723

ау=  -----^-- ( 802,596 ) 2 =24,108 тыс.чел.

В итоге находим коэффициент корреляции:

_ 6539,017 - 8,159 х 802,596

= -0,15917

R      0,474 х 124,108

Связь между признаками прямая. Определим силу связи в соответствии со шкалой Чеддока. В связи с тем, что связь является прямой отрицательной, то коэффициент корреляции находится в пределах от 0 до -1:

R<-0,3 – связь слабая;

  • - 0,3

  • - 0,5

  • - 0,7

  • R >-0,9 – связь очень сильная.

В соответствии со шкалой Чеддока связь характеризуется как слабая.

Изменение результативного признака у обусловлено вариацией факторного признака х. [1] Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака характеризует коэффициент детерминации D, характеризующий долю вариации (дисперсии) результативного признака y , объясняемую регрессией, в общей вариации (дисперсии) y .:

D = R2 х 100%              (10)

D = (-0, 15917)2 х 100% = 2,5%.

Следовательно, вариация численности населения на 9 % объясняется вариацией рождаемости, а остальные 91 % численности населения Орловской области обусловлены изменением других факторов.

Результаты корреляционного анализа свидетельствуют о том, что при увеличении рождаемости на 1 тыс.чел. число жителей Орловской области уменьшится на 41,665 тыс.чел.

Коэффициент эластичности показывает, что при увеличении рождаемости на 1% численность населения Орловской области снизится на 0,422%. Вариация численности населения на 9 % объясняется вариацией рождаемости, а остальные 91 % численности населения Орловской области обусловлены изменением других факторов.

Список литературы Корреляционный анализ рождаемости и численности населения в Орловской области за 2004-2014 годы

  • Балдин К.В. Общая теория статистики М.: Издательский дом «Дашков и К», 2010. 254 с.
  • Ефимова М.Р. Практикум по общей теории статистики. М.: Финансы и статистика, 2012. 336 с.
  • Ефимова М.Р. Социальная статистика: учебное пособие. М.:Финансы и статистика, 2011. 560 с.
  • Яковлева Н.А., Сарычева О. А. Статистический анализ показателей воспроизводства состава сельского населения Обрловской области//Сборник статей ПС-32. 2015. №2. С.2-4.
Статья научная