Корреляционный анализ рождаемости и численности населения в Орловской области за 2004-2014 годы
Автор: Акимова А.Р.
Журнал: Научный журнал молодых ученых @young-scientists-journal
Рубрика: Технические науки
Статья в выпуске: 2 (5), 2015 года.
Бесплатный доступ
Статья посвящена корреляционному анализу рождаемости и численности населения в Орловской области за 2004-2014 гг.
Население, численность, рождаемость, корреляционный анализ, выборка
Короткий адрес: https://sciup.org/14769645
IDR: 14769645
Текст научной статьи Корреляционный анализ рождаемости и численности населения в Орловской области за 2004-2014 годы
Корреляционный анализ – это группа статистических методов, направленная на выявление и математическое представление структурных зависимостей между выборками [4].
Одной из важнейших задач статистики является изучение существующих связей между явлениями. Проведем анализ взаимосвязи численности населения от факторного признака – рождаемости в Орловской области на протяжении 2004-2014 гг.
Таблица 1 – Исходные данные о рождаемости и численности населения в Орловской области за 2004-2014 гг.
Год |
Число родившихся, тыс. чел. |
Численность населения, тыс. чел. |
2004 |
7,726 |
850,016 |
2005 |
7,232 |
835,165 |
2006 |
7,492 |
822,096 |
2007 |
7,926 |
811,389 |
2008 |
8,353 |
805,207 |
2009 |
8,447 |
798,855 |
2010 |
8,687 |
793,144 |
2011 |
8,204 |
785,592 |
2012 |
8,718 |
781,281 |
2013 |
8,524 |
775,826 |
2014 |
8,440 |
769,980 |
Для определения формы связи между показателями построим эмпирическую линию регрессии. Так как в данной совокупности независимым признаком является рождаемость, а результативным – численность, то ось X – количество родившихся в Орловской области за год, а ось Y – численность сельского населения Орловской области на конец этого же года.
Построим график зависимости на графике 1.

Число родившихся,тыс. чел.
Рисунок 1 – Корреляционное поле зависимости численности населения от рождаемости в Орловской области в 2004-2014 гг.
Анализ точек, расположенных на поле графика позволяет сделать вывод о том, что между изучаемыми факторами существует линейная зависимость, которая математически выражается уравнением прямой линии:
Y = a + bx (1)
где yx - теоретическое значение результативного признака, х – факторный признак, а – параметр уравнения (не имеет экономического смысла), b – Коэффициент регрессии.
Параметры уравнения регрессии а и b определим путем решения системы нормальных уравнений[3]:
^ y=an+b^\
^ ух =а ^ х +b ^ х2
Таблица 2 – Расчет сумм для вычисления параметров уравнения прямой
Год |
X |
Y |
Расчетные величины |
||
X 2 |
Y 2 |
X x Y |
|||
2004 |
7,726 |
850,016 |
59,691 |
722527,200 |
6567,224 |
2005 |
7,232 |
835,165 |
52,302 |
697500,577 |
6039,913 |
2006 |
7,492 |
822,096 |
56,130 |
675841,833 |
6159,143 |
2007 |
7,926 |
811,389 |
62,821 |
658352,109 |
6431,069 |
2008 |
8,353 |
805,207 |
69,773 |
648358,313 |
6725,894 |
2009 |
8,447 |
798,855 |
71,352 |
638169,311 |
6747,928 |
2010 |
8,687 |
793,144 |
75,464 |
629077,405 |
6890,042 |
2011 |
8,204 |
785,592 |
67,306 |
617154,790 |
6444,997 |
2012 |
8,718 |
781,281 |
76,004 |
610400,001 |
6811,208 |
2013 |
8,524 |
775,826 |
72,659 |
601905,982 |
6613,141 |
2014 |
8,44 |
769,98 |
71,234 |
592869,200 |
6498,631 |
Итого |
89,749 |
8828,551 |
734,734 |
7092156,723 |
71929,190 |
{ 8828,551 = 89 , 749 b + 11a
1 71929,19 = 89749 a + 734,734 b
11а = 8828,551 – 89749 b a = 802,596 – 8,159 b
89,749 x (802,596 - 8,159 b) + 734,734 b = 71929,19
72032,188 – 732,262 b + 734,734 b = 71929,19
2,472 b = -102,996
b = -41.665 тыс. чел.
Подставив b в одно из уравнений системы, найдем параметр а:
11a+89,749 ×( -41,665 ) =8828,551
11a = 12552,995
а = 1141,178 тыс. чел.
Уравнение зависимости численности населения от численности родившихся будет иметь вид:
Ух = 11441,178 – 41,665x;
Таким образом, исходя из полученного уравнения можно сделать вывод о том, что при увеличении рождаемости на 1 тыс.чел. число жителей Орловской области уменьшится на 41,665 тыс.чел. Для оценки силы связи признаков у и х найдем средний коэффициент эластичности, представляющий собой показатель силы связи фактора x с результатом у , показывающий, на сколько процентов изменится значение у при изменении значения фактора на 1 %:
х
Э=b у
Для этого определим средние значения признаков:
∑ х i х=
n
∑у у= i
n х=89,749=8,159 тыс.чел.
; 8828,551
у= =802,596 тыс.чел.
Вычислим коэффициент эластичности:
8,159
Э=-41,498 = -0,422
802,596
Это означает, что при увеличении рождаемости на 1% численность населения Орловской области снизится на 0,422%.
Для измерения тесноты связи в статистике используют коэффициент корреляции, характеризует тесноту связи между двумя случайными величинами на основе линейной зависимости: [2]
ху-х × у
(σ_х × σ_у )
где - σ_x и σ_y среднее квадратичное отклонение.
∑ ху ху=
n
71929,19
ху= =6539,017 тыс . чел .

734,734
Oy= -------- х 11
- ( 8,159 ) 2 =0,474 тыс.чел.
а у = |^ - ( У ) 2
7092156,723
ау= -----^-- ( 802,596 ) 2 =24,108 тыс.чел.
В итоге находим коэффициент корреляции:
_ 6539,017 - 8,159 х 802,596
= -0,15917
R 0,474 х 124,108
Связь между признаками прямая. Определим силу связи в соответствии со шкалой Чеддока. В связи с тем, что связь является прямой отрицательной, то коэффициент корреляции находится в пределах от 0 до -1:
R<-0,3 – связь слабая;
-
- 0,3
-
- 0,5
-
- 0,7
-
R >-0,9 – связь очень сильная.
В соответствии со шкалой Чеддока связь характеризуется как слабая.
Изменение результативного признака у обусловлено вариацией факторного признака х. [1] Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака характеризует коэффициент детерминации D, характеризующий долю вариации (дисперсии) результативного признака y , объясняемую регрессией, в общей вариации (дисперсии) y .:
D = R2 х 100% (10)
D = (-0, 15917)2 х 100% = 2,5%.
Следовательно, вариация численности населения на 9 % объясняется вариацией рождаемости, а остальные 91 % численности населения Орловской области обусловлены изменением других факторов.
Результаты корреляционного анализа свидетельствуют о том, что при увеличении рождаемости на 1 тыс.чел. число жителей Орловской области уменьшится на 41,665 тыс.чел.
Коэффициент эластичности показывает, что при увеличении рождаемости на 1% численность населения Орловской области снизится на 0,422%. Вариация численности населения на 9 % объясняется вариацией рождаемости, а остальные 91 % численности населения Орловской области обусловлены изменением других факторов.
Список литературы Корреляционный анализ рождаемости и численности населения в Орловской области за 2004-2014 годы
- Балдин К.В. Общая теория статистики М.: Издательский дом «Дашков и К», 2010. 254 с.
- Ефимова М.Р. Практикум по общей теории статистики. М.: Финансы и статистика, 2012. 336 с.
- Ефимова М.Р. Социальная статистика: учебное пособие. М.:Финансы и статистика, 2011. 560 с.
- Яковлева Н.А., Сарычева О. А. Статистический анализ показателей воспроизводства состава сельского населения Обрловской области//Сборник статей ПС-32. 2015. №2. С.2-4.