Моделирование криминогенной обстановки и прогнозирование количества преступлений в регионах Российской Федерации
Автор: Аксенюшкина Елена Владимировна, Леонова Ольга Васильевна
Журнал: Вестник Бурятского государственного университета. Математика, информатика @vestnik-bsu-maths
Рубрика: Математическое моделирование и обработка данных
Статья в выпуске: 2, 2020 года.
Бесплатный доступ
В работе представлена разработка комплексного эконометрического исследования криминогенной обстановки на территории Российской Федерации, в основе которого заложен регрессионный анализ. В качестве объекта исследования использовались эмпирические данные Федеральной государственной службы статистики за 2018 г. с целью выявления факторов, оказывающих значимое влияние на количество совершенных тяжких и особо тяжких преступлений в России. В процессе установления взаимосвязей между переменными был построен «веер» из шести эконометрических моделей множественной регрессии. Для выбора наилучшей модели были проведены тесты Бокса - Кокса и Зарембки, которые дали возможность выделить линейную регрессионную модель. Полное эконометрическое исследование рассматриваемой проблемы также включало в себя анализ мультиколлинеарности факторов и исследование гетероскедастичности остатков линейной модели регрессии. Проверка неоднородности наблюдений для модели, которая в процессе исследования оказалась наилучшей из всех рассмотренных моделей, проводилась с использованием тестов Уайта, Бреуша - Пагана, Гольдфельда - Квандта, Парка и Глейзера. По всем проведенным тестам гипотеза о гомоскедастичности остатков была отклонена. Поскольку в результате исследования предпочтение было отдано линейной регрессионной модели, то именно на основе этой модели были построены точечный и интервальный прогнозы. Установлены количественные взаимосвязи исследуемых переменных.
Эконометрическое исследование, мультиколлинеарность факторов, гетероскедастичность остатков, регрессионная модель, коэффициенты эластичности, прогнозирование
Короткий адрес: https://sciup.org/148308960
IDR: 148308960 | DOI: 10.18101/2304-5728-2020-2-36-51
Текст научной статьи Моделирование криминогенной обстановки и прогнозирование количества преступлений в регионах Российской Федерации
Развитие любой страны в значительной мере продиктовано воздействием неявных закономерностей большого многообразия факторов. Нахождение и исследование таких взаимосвязей для общества имеют важное значение, поскольку открывают двери для возможного управления различными показателями [2; 4; 13; 14]. Поэтому на сегодняшний день становится актуальной разработка комплексной методологической базы такого исследования на примере анализа криминогенной обстановки Российской Федерации.
В любом обществе проблема уменьшения уровня преступности всегда являлась одной из первостепенных задач. Количество совершенных преступлений является той призмой, через которую можно судить о состоянии государства, о тенденции развития общества.
Выявление факторов, непосредственно оказывающих влияние на состояние криминогенной обстановки в стране, часто поднимается в российских и международных исследованиях [7; 8; 9; 10; 11]. Несмотря на это, определение факторов, построение типа зависимости, а также проведение анализа полученных результатов еще недостаточно изучены.
В данной статье исследуется зависимость количества преступлений, совершаемых на территории Российской Федерации, от различных факторов, которые, по мнению экспертов, могут оказывать влияние на изучаемый показатель. Это дает возможность найти новые рычаги, оказывающие влияние на уровень преступности в стране.
Для проведения исследования применяются эконометрические методы. В этом случае предполагается существование связей между объяс-няемой и объясняющими переменными. Рассмотренный подход требует грамотного подбора всех переменных исходя из логических соображений и, что немаловажно, дает возможность отследить изменения социальноэкономической обстановки в регионах Российской Федерации. Для получения результатов в работе используется регрессионный анализ [12].
Было проведено исследование статистических данных общего количества зарегистрированных тяжких и особо тяжких преступлений в Российской Федерации в 2018 г. с целью определения влияния ряда факторов на этот показатель.
1 Постановка задачи
Обозначим через Y зависимую (результирующую) переменную — количество зарегистрированных тяжких и особо тяжких преступлений. Рассмотрим существование взаимосвязи количества преступлений со следующими независимыми факторами:
x 1 — число пациентов с психическими расстройствами, связанными с употреблением алкоголя, т. е. с синдромом алкогольной зависимости (количество зарегистрированных в год), чел;
x 2 — число пациентов с психическими расстройствами, связанными с синдромом зависимости от наркотических веществ (количество зарегистрированных в год), чел;
x 3 — средняя годовая численность постоянного населения, чел.;
x 4 — численность рабочей силы, тыс. человек;
x 5 — средний денежный доход населения, руб/чел.;
x 6 - x 12 — соотношения денежных доходов и величины прожиточного минимума, %:
x 6 — денежный доход меньше половины прожиточного минимума;
x 7 — денежный доход составляет от 0,5 до 1 прожиточного минимума;
x 8 — денежный доход составляет от 1 до 1,5 прожиточных минимумов;
x 9 — денежный доход составляет от 1,5 до 2 прожиточных минимумов; x 10 — денежный доход составляет от 2 до 3 прожиточных минимумов;
x 11 — денежный доход составляет от 3 до 6 прожиточных минимумов;
x 12 — денежный доход составляет более шести прожиточных минимумов;
x 13 — общий прирост постоянного населения, чел.;
x 14 — доля городского населения в общей численности населения, %;
x 15 — число выбывших за 2018 г., чел.;
x 16 — число прибывших за 2018 г., чел.
В качестве эмпирической базы используются открытые данные Федеральной государственной службы статистики за 2018 г.1
Построим модели множественной регрессии — зависимости количества совершаемых преступлений от перечисленных выше факторов (при расчетах используем пакет «Анализ данных» MS Excel). Проведем анализ для выбора наилучшей модели, построим по ней точечные и интервальные прогнозы и установим количественные связи между переменными.
2 Построение моделей регрессии
Для построения моделей необходимо провести отбор факторов, которые будут включены в уравнение регрессии. Для отбора факторов будем использовать метод включения [3].
Для определения наиболее значимого фактора определим парные коэффициенты корреляции переменной Y с факторами x 1 - x 12. Результаты расчетов приведем в таблице 1.
Таблица 1
Парные коэффициенты корреляции
Фактор |
x 1 |
x 2 |
x 3 |
x 4 |
x 5 |
x 6 |
x 7 |
x 8 |
Коэффициент корреляции |
0,712 |
0,854 |
0,960 |
0,967 |
0,391 |
-0,291 |
-0,399 |
-0,467 |
Фактор |
x 9 |
x 10 |
x 11 |
x 12 |
x 13 |
x 14 |
x 15 |
x 16 |
Коэффициент корреляции |
-0,474 |
-0,094 |
0,438 |
0,490 |
0,642 |
0,403 |
0,900 |
0,906 |
Сравнивая коэффициенты корреляции по модулю, делаем вывод, что наиболее влияющим фактором является x 4 — численность рабочей силы. На основании этого получаем следующую линейную модель для переменных Y и x 4:
Y = - 43,9 + 5,66 x 4 + £ , R 2 = 0,94, (1)
( - 0,18) (34,15)
где £ — случайная компонента, R 2 — показатель детерминации, в скобках указаны t -статистики параметров модели.
Далее в модель (1) последовательно вводим другие факторы согласно их ранжированию по коэффициенту корреляции (от большего к меньшему). Добавленные факторы тестируются на значимость с помощью критерия Стьюдента [12]. Незначимые факторы из модели исключаются и в дальнейшем исследовании не используются. В результате нескольких итераций остаются только значимые факторы: x 2, x 4 и x 14, для которых множественная линейная регрессия имеет вид:
Y = - 1800,8 + 4,7 x 2 + 4,75 x 4 + 25,07 x 14 + £ , R 2 = 0,9495. (2)
( - 2,5) (3,59) (17,9) (2,002)
Качество модели (2) можно оценить как хорошее, поскольку все параметры модели значимые и коэффициент детерминации близок к 1.
Не будем ограничиваться только линейной моделью, рассмотрим еще и самые популярные нелинейные модели [6]: полиномиальную, полулогарифмическую, обратную, степенную и показательную.
Выберем наилучшую из них опытным путем, для этого проведем оценку параметров рассматриваемых моделей с помощью метода наименьших квадратов [6], предварительно проделав соответствующие преобразования. В зависимости от типа нелинейности модели будем использовать замену переменных или логарифмические преобразования.
Результаты оценок параметров моделей, t -статистики, коэффициенты детерминации и F -статистики приведены в табл. 2.
Таблица 2
Линейная и нелинейные модели в линеаризованном виде
Оцененные модели регрессии |
Коэффициент детерминации, скорректированный коэффициент детерминации |
Общий F -критерий |
Линейная Y = - 1800,8 + 4,7 x 2 + 4,75 x 4 + 25,07 x 14 + £ ( - 2,5) (3,59) (17,9) (2,002) |
R2 = 0,9495 R2 = 0,9475 |
F = 482,68 |
Полином второй степени Y = - 765,713 + 7,9 x 2 - 0,00318 x 2 2 + 3,35 x 4 + ( - 0,9) (2,25) ( - 0,61) (5,81) + 0,000237 x 4 2 + 9,9 x 14 + 0,109 x 14 + £ (2,18) (0,12) (0,18) |
R2 = 0,9557 R2 = 0,9521 |
F = 266,26 |
Обратная - = 0,00118 - 4,6 • 10 - 7 x 2 - 6,7 - 10 - 8 x. - Y (5,7) ( - 1,4) 2 ( - 1,04) 4 - 8,9 - 10 - 6 x 14 + £ ( - 2,97) |
R2 = 0,33 R2 = 0,3 |
F = 12,77 |
Степенная ln Y = 0,81 + 0,19ln x 2 + 0,69 ln x 4 + (1,15) (4,88) (12,37) + 0,47 ln x 14 + ln £ (2,75) |
R2 = 0,89 R2 = 0,88 |
F = 216,47 |
Показательная ln Y = 6,75 + 0,001583 x 2 + 0,000359 x 4 + (21,46) (3,27) (3,67) + 0,0114 x 14 + ln £ (2,46) |
R2 = 0,68 R2 = 0,67 |
F = 56,67 |
Полулогарифмическая Y = - 35566,2 + 667 ln x 2 + 4428,9 ln x 4 + ( - 3,92) (1,33) (6,15) + 2155,62 ln x 14 + £ (0,98) |
R2 = 0,61 R2 = 0,59 |
F = 40,91 |
Если сравнить t -статистики параметров моделей с критической точкой tp = 1,66, то можно сделать вывод, что полиномиальная, обратная и полулогарифмическая модели имеют незначимые параметры и в дальнейших исследованиях не участвуют.
Оставшиеся три модели являются статистически значимыми, так как их F -статистики, приведенные в таблице 2, больше, чем критическая точка FKP = 2,72.
Таким образом, продолжим поиск модели, наиболее точно описывающей взаимосвязь между переменными среди линейной, степенной и показательной.
3 Выбор наилучшей модели
Поскольку разница между наибольшим и наименьшим значениями зависимой переменной больше 10, а также зависимые переменные в линеаризованных моделях различны, то это дает возможность использовать тест Бокса — Кокса для выбора наилучшей модели.
Тест основан на утверждении, что как исходные (наблюдаемые), так и преобразованные значения переменной являются частным случаем реализации специальной функции [5] при различных значениях X Суть теста заключается в поиске таких значений параметра X , при которых остаточная сумма квадратов SS0CT будет минимальной.
Для непреобразованного значения зависимой переменной при X = 1 получим
Y * =- 1801,8 + 4,7 x 2 + 4,75 x 4 + 25,07 x 14 + s ; SS ^ T = 1,43 - 108.
Для логарифмированного значения зависимой переменной при X ^ 0 получим
Y * = 24133,64 + 5,65 x 2 + 1,28 x 4 + 40,73 x 14 + s ; SS X T = 2,5 - 108.
Остаточная сумма квадратов при X = 0 меньше, чем при X ^ 0, следовательно, связь между переменными лучше всего характеризует линей -ная функция в отличие от степенной и показательной.
Модификацией теста Бокса — Кокса является преобразование Зарем-бки [5], которое применяется только для двух форм зависимой переменной — непреобразованной и логарифмированной.
После преобразования зависимой переменной Y
- 0
Y получены геом
уравнения:
Y 0 = - 0,5 + 0,0013 x 2 + 0,0013 x 4 + 0,007 x 14 + s ;
ln Y 0 = - 1,42 + 0,0015 x 2 + 0,00035 x 4 + 0,011 x 14 + s ;
ss^ = 11,2;
SS ocm = 19,57.
Поскольку остаточная дисперсия у первой модели меньше, то следует отдать предпочтение линейной модели.
Проверим значимость остаточных сумм квадратов с помощью теста
X 2. Статистика х 2 =
81 11,2
ln
2 19,57
= 22,5
больше, чем критическая точка
X <205 (1) = 3,84, поэтому для всех исследуемых моделей статистически значимыми являются различия между остаточными суммами квадратов.
Таким образом, можно утверждать, что линейная модель лучше всего описывает взаимосвязь между показателями.
4 Анализ мультиколлинаерности факторов
Мультиколлинеарность факторов возникает при наличии высокой корреляционной связи между регрессорами и может привести к неустойчивости и ненадежности оценок параметров построенных моделей.
Существуют различные способы выявления и устранения мультиколлинеарности факторов [1]. Построим матрицу парных коэффициентов корреляции и проведем исследование существования корреляционной связи между факторами модели
037 )
0,35 .
1 J
( 1
Г хх = 0,82
v 0,37
0,82
1 0,35
Подчеркнем, что между переменными x2 и x4 очень тесная связь, что подтверждает интеркорреляцию этих переменных. Между переменными x4 и x14 , x2 и x14 получена достаточно слабая связь. Определитель матрицы rxx равен 0,27, что говорит о наличии мультиколлинеарности объяс- няющих переменных.
Парные коэффициенты корреляции между зависимой переменной и факторами равны rY = 0,85 ; r Yx = 0,96; rY = 0,40. Поскольку значения межфакторной корреляции меньше этих коэффициентов, то сделаем вывод о том, что все переменные можно включить в модель.
Для измерения степени мультиколлинеарности регрессоров используем фактор вздутия дисперсии (VIF) [12]. Для этого рассчитаем коэффициенты детерминации для регрессий между переменной xj и другими фак- торами:
x2 = - 81,86 + 0,16 x 4 + 1,54 x 14; R 2 XA4 = 0,68 ;
x4 = - 32,3 + 3,93 x 2 + 3,84 x 14; R2XA4 = 0,68;
x 14 = 65,9 + 0,016 x 2 + 0,0017 x 4; RXu хл = 0,14.
Следовательно, фактор вздутия дисперсии для каждой независимой переменной будет равен
VIF x 2
1 - 0,68
= 3,125,
VIF x4
1 - 0,68
= 3,125,
VIF x 14
1 - 0,14
= 1,16.
Рассчитанные величины свидетельствуют о наличии мультиколлинеарности переменных.
Для устранения мультиколлинеарности воспользуемся специальными методами корректировки моделей: ридж-регрессии [12] и главных компонент [1].
После применения ридж-регрессии получили уравнение:
у — - 1733,29 + 4,71 x 2 + 4,75 x 4 + 24,1 x14 + £ .
После применения метода главных компонент получили уравнение:
у — - 1612,41 + 4,73 x 2 + 4,75 x 4 + 22,38 x 14 + £ .
Отметим, что изменения в моделях были относительно невелики, что указывает на невысокую степень мультиколлинеарности, которой можно пренебречь.
5 Исследование гетероскедастичности случайных остатков модели
Проверку неоднородности наблюдений в модели, которая в процессе исследования оказалась наилучшей из всех рассмотренных моделей, проведем с использованием тестов Уайта, Бреуша — Пагана, Гольдфельда — Квандта, Парка и Глейзера.
Для теста Уайта необходимо построить квадратичную функцию зависимости квадратов остатков от всех факторов и их квадратов .
Оцененная квадратичная модель имеет вид:
-
l 2 = 4218833 + 7176,3 x 2 - 14,31 x 2 2 + 2334,29 x 4 + 0,02 x 4 2 - 132492 x 14 +
(0,56) (0,69) ( - 1,03) (1,37) (0,06) ( - 0,58)
+ 861 x 24 + § , F — 2,9,
(0,5) 14
где l — случайные остатки модели (1), § — случайная компонента.
Табличное значение F -критерия равно FKp — F (0,05; 6; 74) = 2,22. Так как F > Fkp , то по тесту Уайта гипотеза об отсутствии гетероскедастично-сти отклоняется.
Отметим, что все параметры этой модели незначимы, но наибольшее значение t -критерия (достаточно близкое к табличному tkp — 1,66) имеет параметр при переменной x 4. Таким образом, переменная x 4 может быть рассмотрена как возможная причина гетероскедастичности остатков .
Для проведения теста Бреуша — Пагана [6] необходимо оценить зависимость вида:
-
l 2 „ .
-
— — — 0,83 - 0,00078 x 2 + 0,001 x. - 0,0098 x.. + v ,
2 7 7 2 7 4 7 14 7
S 1
где S2 — оценка дисперсии случайных остатков, v — случайная компо- нента.
Наблюдаемое значение критерия х 2 = SS °cm = 66°69 = 33,034 больше табличного х кр = х 2 (0,05; 3) = 7,81, поэтому нулевая гипотеза о гомоске-дастичности случайных остатков отвергается.
Исследуем влияние всех трех независимых переменных по отдельности на дисперсию случайных остатков. В итоге получили зависимости:
-
— = 0,41 + 0,0032 х, + v ; х 2 = 18,09;
S 1
-
— = 0,16 + 0,00087 х. + v ; х 2 = 31,955;
-
2 4
S 1
— = - 0,00076 - 0,014 х.. + v ; х 2 = 1,4.
2 14
S 1
Табличное значение критерия в данном случае хКр = х2(0,05; 1) = 3,84, неравенство х2 > хКр справедливо только для переменных х2 и х4, то есть остатки гетероскедастичны по этим переменным.
Опираясь на выявленное влияние на дисперсию остатков переменных х 2 и х 4, проверим эту связь с помощью других тестов.
Использование теста Гольдфельда — Квандта [6] предполагает упорядочивание данных, в нашем случае по переменным х 2 и х 4
Общий объем наблюдений составляет 71 регион, то есть их можно разбить на три равные группы по 27 регионов. Для первой и третьей совокупности наблюдений найдем параметры множественной линейной регрессии и остаточные суммы квадратов.
Если производить упорядочивание по переменной х2, то получим ре- зультаты:
Y = - 407,65 + 17,45 х 2 + 2,76 х 4 + 11,82 х 14; SS£ Т = 14034165;
Y = - 5202,17 + 6,44 х 2 + 4,65 х 4 + 59,05 х 14; SS OC Т = 94056651.
= 6,7. Табличное зна
Наблюдаемое значение критерия F = 14034165
чение критерия F^ = 2,014, так как F > F^ , то дисперсия остатков зави- сит от величины значений переменной х2 .
Если производить упорядочивание по переменной х 4 , то получим результаты:
Y = - 203,62 + 8,82 х 2 + 4,9 х 4 + 1,8 х 14; SS OC Т = 125720050;
Y = - 4159,43 + 4,45 х 2 + 4,79 х 4 + 55,74 х 14; SS OC Т = 1,5 • 108.
Наблюдаемое значение критерия F = 8,38. Табличное значение критерия FKp = 2,014, так как F > Fkp , то дисперсия остатков зависит от величины значений переменной x 4 .
Исследование по тесту Парка [6] приводит к результатам:
ln 1 2 = 8,4 + 0,86ln x 2 + v ; t = 3,46,
In 1 2 = 1,08 + 1,73ln x 4 + v ; t = 5,07.
Табличное значение критерия Стьюдента tKp = 1,66; так как для обоих факторов t > tKp , то гипотеза о гомоскедастичности отвергается.
По тесту Глейзера [6] необходимо найти параметры целой серии уравнений, задаваемых функцией
I S i = a 0 + a Л + v , где к — какое-либо число, например, к = ± 1; ± 0,5 и т. п.
Для переменной x 2 получили уравнения:
при к = 1, 1 1 | = 553,13 + 2,044 x 2 + v , t = 4,36;
t = - 1,27;
t = 4,59;
при к = - 1, 1 11 = 972,39 - 1747,37 — + v , x 2
при к = 0,5 , 11|= 161,95 + 65,43^x. + v, при к = - 0,5, 11|= 1208,9-2226,89-1= + v, t = - 2,43.
x 2
Для переменной x 4 получили уравнения:
при к = 1, 1 1 | = 477,72 + 0,46 x 4 + v , t = 5,04 ;
при к = - 1, 1 1 | = 1175,08 - 114486,345 — + v , t = - 2,53;
x 4
при к = 0,5, 1 1 1 =- 183,86 + 39,4T x T + v , t = 5,42;
при к = - 0,5, 1 1 1 = 1723,93 - 18722,1—1= + v , t = - 3,66.
x 4
Табличное значение критерия Стьюдента tKp = 1,66, таким образом, по тесту Глейзера практически при всех k гипотеза о гомоскедастичности остатков отвергается.
Подводя итоги исследования гетероскедастичности остатков изучаемых показателей, отметим, что по всем проведенным тестам гипотеза о гомоскедастичности остатков была отвергнута, то есть можно утверждать, что на дисперсию случайных остатков оказывают влияние переменные x 2 и x 4 , то есть эти переменные являются причиной гетероскеда-стичности остатков.
Для устранения гетероскедастичности остатков была предпринята попытка использования обобщенного метода наименьших квадратов для нахождения оценок параметров модели, но она не увенчалась успехом, поскольку некоторые параметры в новой модели оказались незначимыми.
6 Прогнозирование по линейной множественной регрессии
Результаты исследования показали, что линейная модель регрессии (2) достаточно точно описывает связь изучаемых показателей, поэтому используем ее для прогнозирования.
В таблице 3 приведены прогнозные значения переменных x 2, x 4 и x 14 . Используя значения этих показателей, построены точечный и интервальный прогнозы.
Таблица 3
Среднее прогнозируемое значение количества зарегистрированных тяжких и особо тяжких преступлений по федеральным округам
№ |
Субъект Российской Федерации |
Прогнозное значение |
Прогнозируемое количество преступлений (точечный прогноз) |
Прогнозируемое количество преступлений (интервальный прогноз) |
||
x 2 |
x 4 |
x 14 |
||||
1 |
Центральный федеральный округ |
95 |
558 |
65 |
2926 |
(189; 5664) |
2 |
Московская область и г. Москва |
858 |
5159 |
81 |
28774 |
(25758; 31790) |
3 |
СевероЗападный федеральный округ |
65 |
480 |
85 |
2916 |
(144; 5688) |
4 |
Ленинградская область и г. Санкт-Петербург |
363 |
2219 |
90 |
12704 |
(9921; 15488) |
5 |
Южный федеральный округ |
150 |
1033 |
53 |
5141 |
(2371; 7910) |
6 |
СевероКавказский федеральный округ |
93 |
732 |
56 |
3518 |
(762; 6237) |
7 |
Приволжский федеральный округ |
147 |
972 |
63 |
5087 |
(2347; 7828) |
8 |
Уральский федеральный окру |
280 |
1133 |
73 |
6728 |
(3989; 9468) |
9 |
Сибирский федеральный округ |
188 |
653 |
63 |
3764 |
(1020; 6509) |
10 |
Иркутская область |
339 |
1070 |
71 |
6675 |
(3918; 9432) |
11 |
Дальневосточный федеральный округ |
188 |
456 |
85 |
3380 |
(607; 6153) |
7 Интерпретация линейной модели множественной регрессии
Построенная модель (1) дает возможность утверждать, что между количеством зарегистрированных тяжких и особо тяжких преступлений наблюдается прямая связь с числом пациентов с психическими расстройствами, связанными с употреблением алкоголя, численностью рабочей силы и долей городского населения в общей численности населения.
Коэффициенты при переменных x 2, x 4 и x 14 показывают абсолютную силу связи и характеризуют среднее изменение результирующего показателя при единичном изменении соответствующего фактора при условии неизменности остальных регрессоров, входящих в модель.
Таким образом, можно сделать вывод, что с изменением на одного человека числа пациентов с психическими расстройствами, связанными с синдромом зависимости от наркотических веществ, количество преступлений в среднем изменится в ту же сторону на 4,7 при неизменном уровне численности рабочей силы и доли городского населения в общей численности населения.
Изменение численности рабочей силы на 1 тыс. человек приведет к изменению количества преступлений в среднем на 4,75 при неизменных значениях числа пациентов с психическими расстройствами, связанными с синдромом зависимости от наркотических и доли городского населения в общей численности населения.
При изменении доли городского населения в общей численности населения на 1% количество преступлений в среднем изменится на 25,07 при том же уровне числа пациентов с психическими расстройствами и численности рабочей силы.
Коэффициенты регрессии нельзя сравнить между собой поскольку у них разный масштаб измерения. Для ранжирования факторов по силе их воздействия на результативный признак можно использовать относительные показатели связи — частные коэффициенты эластичности.
Для характеристики силы связи количества преступлений и числа пациентов с психическими расстройствами, уровнем численности рабочей силы и долей городского населения в общей численности населения получены коэффициенты эластичности:
Ёх = 0,16; Ех = 0,85; Ёх = 0,33.
x 2 x 4 x ]4
То есть с изменением числа пациентов с психическими расстройствами на 1% от среднего уровня количество зарегистрированных тяжких и особо тяжких преступлений изменится в ту же сторону на 0,16% своего среднего уровня при неизменном уровне численности рабочей силы и доли городского населения в общей численности населения.
С изменением численности рабочей силы на 1% от среднего уровня количество зарегистрированных тяжких и особо тяжких преступлений изменится в ту же сторону на 0,85% своего среднего уровня при неизменном уровне числа пациентов с психическими расстройствами и доли городского населения в общей численности населения.
С изменением доли городского населения в общей численности населения на 1% от среднего уровня количество зарегистрированных тяжких и особо тяжких преступлений изменится в ту же сторону на 0,33% своего среднего уровня при неизменном уровне числа пациентов с психическими расстройствами и численности рабочей силы.
Сопоставляя полученные коэффициенты эластичности, можно сделать вывод о том, что наиболее сильное влияние на количество зарегистрированных тяжких и особо тяжких преступлений оказывает численность рабочей силы. На втором месте по силе влияния оказалась доля городского населения в общей численности населения и самое слабое влияние оказывает число пациентов с психическими расстройствами, связанными с синдромом зависимости от наркотических веществ.
Заключение
В статье использовался регрессионный анализ для моделирования и прогнозирования количества зарегистрированных тяжких и особо тяжких преступлений на основе наиболее полных и актуальных данных по восьми округам Российской Федерации. После проведенного анализа среди построенных моделей наилучшей оказалась множественная линейная регрессия. Тем не менее анализ на гетероскедастичность она не прошла, но, несмотря на это точечный прогноз, построенный по линейной модели, не сильно отличается от средних показателей преступности по каждому округу. Это говорит о том, что непостоянство дисперсии случайных остатков в данном случае не оказало значимого влияния на свойства оценок параметров. Заметим, что на точность прогнозирования влияют не только различия в количестве преступлений в различных округах, но и неоднородность других данных, например, численность рабочей силы.
Авторы считают, что построенные и верифицированные модели можно использовать в других исследовательских областях. Предложенная методика исследований открывает достаточно широкие горизонты для прогно-48
зирования поведения различных социально-экономических показателей. Полученные количественные взаимосвязи между анализируемыми показателями и построенные прогнозы могут быть использованы различными службами, администрациями, правительствами областей при построении стратегии развития регионов для достижения улучшения качества жизни населения.
Список литературы Моделирование криминогенной обстановки и прогнозирование количества преступлений в регионах Российской Федерации
- Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы. М.: ЮНИТИ, 1998. 1000 с.
- Балдынова Е. В., Малютина С. А. Сравнительный анализ среднемесячной реальной заработной платы работников организаций в разрезе видов экономической деятельности по Иркутской области // Известия Байкальского государственного университета. 2018. Т. 28, № 3. С. 409-418.
- Валентинов В. А. Эконометрика. М.: Дашков и К°, 2009. 436 с.
- Волченко Л. Ю., Мамонова Н. В., Завьялова Е. О. Моделирование влияния деятельности таможенных органов на социально-экономическое развитие и инвестиционную активность регионов // Инновационное развитие экономики. 2017. № 6(42). С. 16-26.
- Дрейпер Н., Смит Г. Прикладной регрессионный анализ: пер. с англ. 3-е изд. М.: Вильямс, 2007. 392 с.