Abstract and keywords
Abstract (English):
The aim of the work is to implement regression models of crime in practice, which will show the complex impact of various socio-economic factors on the state of crime in Russia, and determine the forecast for the near future. The result of this study is the construction of a linear multivariate regression model and a predictive ARMA model with three forecast options. Based on the correlation analysis, the factors that have the strongest relationship with the variable that characterizes crime are determined. The multiple regression model showed the interrelated influence of individual factors on the state of crime in the framework of the developed equation. The quality of the obtained models is confirmed by evaluation tests for statistical significance. The initial data of the study were: official statistical data of the Russian statistics for 1992–2020, an array of data from more than 500 observations was used.

Keywords:
crime, forecast, crime model, regression, statistical analysis, statistical data
Text
Publication text (PDF): Read Download


В предыдущей статье «Особенности статистического моделирования и прогнозирования преступности: теоретический аспект» нами был проведен анализ источников литературы, который обозначил результаты исследования отечественных и зарубежных авторов и показал эффективные модели и методики прогнозирования, а также группы факторов, оказывающие высокое влияние на развитие криминальной обстановки. Практическая реализация рассмотренных методик в отдельных странах показала различную достоверность (качество) прогнозных значений. 
При этом в мировой практике наибольшую распространенность получили следующие методы прогнозирования: экстраполяция, моделирование, метод экспертных оценок [1]. Высокие показатели получили: метод случайной лесной регрессии (точность прогнозирования до 97 %), метод экспоненциального сглаживания Хольта с ежемесячной сезонностью, логистическая регрессия и нейросетевая модель, простая линейная экстраполяция, а также некоторые другие методы, показавшие наибольшую эффективность применительно к конкретным пространственно-временным характеристикам и отдельным типам преступности [2, с. 61–70]. 
В данной работе представлены практические результаты моделирования и прогнозирования преступности в Российской Федерации на основе построения регрессионных моделей по данным динамических рядов.
Для реализации инструментария моделирования и прогнозирования регистрируемой преступности выбраны методы построения линейной модели множественной регрессии и построение авторегрессионной модели [3; 4]. Использование выбранных методик позволит показать величину зависимости преступности от других переменных, благодаря которым можно осуществить планирование мероприятий, направленных на снижение преступности [5].

Таблица 1
Перечень показателей, использованных для проведения 
корреляционно-регрессионного анализа
МДля исследования влияния различных факторов на состояние преступности в Российской Федерации были выбраны данные Росстата по показателям, представленным в таблице 1 [6, с. 35].
Таким образом, было выделено 19 переменных (в том числе зависимая переменная Y). Показатели отражены в  динамике за 1992–2018 годы в собственных величинах. С целью недопущения искажения результатов анализа из-за влияния накопленной инфляции стоимостные показатели учитывались в сопоставимых ценах базисного 1992 года. В качестве зависимой переменной, характеризующей состояние преступности, взят показатель «число зарегистрированных преступлений» (тыс. ед.). Далее были выделены корреляционные связи Y с влияющими переменными (табл. 2), рассмотренными в таблице 1. 
Интерпретируя полученные результаты, следует обратить внимание на то, что наиболее тесная связь наблюдается между факторами: X1, Х2, X5, X11, Х12, Х16, Х18 и Y. Степень влияния остальных факторов на количество лиц, совершивших преступления, невысокая. При этом следует отметить, что показатели динамических рядов могут быть подвержены влиянию тенденции (наличие тренда), поэтому может наблюдаться явление ложной корреляции. 
В программной среде Gretl нами с использованием метода наименьших квадратов была построена линейная модель множественной регрессии. Попытка усовершенствовать модель за счет включения в нее временного тренда показала отсутствие такой необходимости (переменная времени статистически не значима), поэтому в итоговую модель после анализа на мультиколлинеарность методом инфляционных факторов (табл. 3) были включены компоненты, показанные на рисунке 1.

Таблица 2
Коэффициенты парной корреляции зависимой переменной Y 
и независимых переменных Х1 – X18

Таблица 3
Коэффициенты парной корреляции зависимой переменной Y 
и независимых переменных Х1 – X18

Для проверки обоснованности применения линейной модели были выполнены тесты на нелинейность: нелинейность (квадраты), нелинейность (логарифмы). Результат теста на нелинейность (квадраты) показал: р-значение = P (Хи-квадрат > 10,181) = 0,117234; 0,117234 ˃ 0,05. Таким образом, гипотеза о корректности линейной модели не отвергается. Тест на нелинейность (логарифмы) показал: р-значение = P (Хи-квадрат > 7,4114) = 0,284469; 0,284469 ˃ 0,05, что также не отвергает нулевую гипотезу о корректности линейной модели.
С учетом полученных результатов (рис. 1) модель можно характеризовать следующим образом. Множественный коэффициент корреляции R = 0,9582 показывает, что теснота связи между количеством зарегистрированных преступлений и факторами, включенными в модель, высокая. Множественный коэффициент детерминации (R-квадрат) D = 0,9182, то есть 91,82 % вариации числа зарегистрированных преступлений объясняется вариацией изучаемых факторов. Проверка значимости коэффициента множественной корреляции путем сравнения фактического и табличного значений F-критерия (тест Фишера) показала адекватность модели (Fфакт = 37,39 ˃ Fтабл = 2,60, при вероятности ошибки α = 0,05). Таким образом, тест Фишера подтвердил значимость всей модели. Достоверность по уровню значимости критерия Фишера (значимость F = 7,62609E-10) значительно меньше 0,05. Таким образом, модель является статистически значимой. 
Проверка справедливости выдвинутой гипотезы путем сравнения расчетного критерия значимости с критическим уровнем значимости (p < 0,05) показала значимость гипотезы по всем включенным в модель факторам. Тест Стьюдента (tфакт ˃ tтабл = 2,086) также подтвердил статистическую значимость всех факторов. Статистика Дарбина-Уотсона  (DW ≈ 2,0  при d1 = 0,925 и d2 = 1,974) показала отсутствие автокорреляции остатков. Тест Уайта подтвердил нулевую гипотезу об отсутствии гетероскедастичности (LM = 7,46554; р-значение = P (Хи-квадрат > 7,46554) = 0,82538 ˃ 0,05). Тестирование модели с использованием методики Бриша-Пэгана также подтвердило гипотезу об отсутствии гетероскедастичности (LM = 4,621814; р-значение = P (Хи-квадрат > 4,621814) = 0,593148 ˃ 0,05).
Тест на нормальное распределение ошибок подтвердил гипотезу о том, что остатки распределены по нормальному закону (Хи-квадрат = 1,87978; р–значение = 0,39067 ˃ 0,05). Результаты теста Рамсея (RESET-тест) на ошибку спецификации указали на то, что в модели не хватает одного или нескольких важных объясняющих факторов (F(2, 18) = 9,84742; р-значение = P (F(2, 18) > 9,84742) = 0,00129097; 0,00129097 < 0,05). Здесь следует отметить, что на информационных ресурсах Росстата, МВД, прокуратуры не раскрыта статистическая информация по отдельным важным показателям (факторам), характеризующим, например, эффективность работы правоохранительных органов (количество раскрытых/нераскрытых преступлений), численный состав МВД и так далее, либо такая информация раскрыта за относительно небольшой временной интервал, что не позволило ее учесть при построении регрессионной модели.

Используя приведенные коэффициенты и учитывая результаты проведенных тестов, составлено уравнение модели:

Ŷ= –4,543,93 + 2,22 ∗ X1 – 0,00254 ∗ X4 ∗ 21,9 ∗ X9 + 1,23 ∗ X13 + 0,513 ∗ X14 + 0,00226 ∗ X15

где Ŷ– число зарегистрированных преступлений, тыс. ед.
Комплексное влияние на объемы преступности в рамках данной модели оказывают факторы: X1, X4, X9, X13, X14, X15.
На основе данной модели трудно прогнозировать состояние преступности, поскольку невозможно определить поведение всех влияющих факторов, включенных в модель на перспективу. Для прогнозирования в среде Gretl нами была построена ARMA-модель (2, 0) со следующими характеристиками: уровень надежности – 95 %, R2 = 0,79. Значения информационных критериев следующие: AIC = 404,42, HQC = 406,13, BIC = 409,89. Использован точный метод максимального правдоподобия. Динамический ряд (1992–2020) предварительно был протестирован на стационарность (ADF-тест), ряд оказался стационарным в уровнях ряда. Модель успешно прошла все основные тесты на статистическую значимость: тест на нормальное распределение ошибок, тест на отсутствие ARCH-процессов, LM-тест на отсутствие автокорреляции. Уравнение модели имеет следующий вид:

yt= 2626,42 + 1,18243 ∗ yt-1– 0,371075 ∗ yt-2 + et
где yt – число зарегистрированных преступлений, тыс. ед.
В рамках данной модели нами рассчитаны варианты прогноза на среднесрочную перспективу 2021‒2023 годов (рис. 2): 
– расчетный прогноз (предсказание): 2021 год – 2 161,418 тыс. ед., 2022 год – 2 292,636 тыс. ед., 2023 год – 2 404,295 тыс. ед.;
– позитивный сценарий: 2021 год – 1 732,938 тыс. ед., 2022 год – 1 629,096 тыс. ед., 2023 год – 1 608,084 тыс. ед.;
– негативный сценарий: 2021 год – 2 589,899 тыс. ед., 2022 год – 2 956,177 тыс. ед., 2023 год – 3 200,506 тыс. ед.
Таким образом, расчетный прогноз показывает незначительный рост регистрируемой преступности на среднесрочную перспективу, остальные варианты свидетельствуют, соответственно, снижение и значительный рост показателя. При этом реализация конкретного сценария будет зависеть от эффективности проводимой государством социально-экономической политики.

Следует отметить, что данная модель не может прогнозировать реальные объемы преступности, поскольку значительная их часть латентна и не регистрируется. При этом разработка методик прогнозирования общего объема преступности актуальна и требует выработки новых подходов к количественной оценке не учитываемых (из-за их латентности) показателей.
Подводя итог проведенному исследованию, отметим следующие основные результаты:
– выделены статистически значимые факторы, оказывающие взаимосвязанное влияние на состояние преступности в рамках полученной многофакторной модели: количество заключенных, количество разводов, численность населения с денежными доходами ниже величины прожиточного минимума, численность студентов, обучающихся по программам подготовки специалистов среднего звена, численность студентов, обучающихся по программам бакалавриата, прибыло в Российской Федерации из стран СНГ и стран дальнего зарубежья;
– разработанная прогнозная ARMA-модель показала три варианта прогноза регистрируемой преступности. Реализация того или иного варианта будет зависеть от эффективности реализуемой государством социально-экономической политики. 
Использование прогностического подхода в практике деятельности аппарата государственного управления способствует повышению качества принятия управленческих решений. Проведение дальнейших исследований, направленных на совершенствование моделей и инструментов моделирования, будет способствовать формулировке более точных выводов относительно взаимосвязи между различными параметрами состояния преступности.

References

1. Pilyugina T. V., Pichkurenko E. A., Vendina A. A. Mathematical methods of crime forecasting. Aspectus, 2015, no. 1, pp. 98–103. (In Russ.)

2. Pilyugina T. V., Natura D. A. Using the method of mathematical modeling in predicting regional crime in the issues of its prevention. All-Russian criminological journal, 2017, vol. 11, no. 1, pp. 61–70. (In Russ.)

3. Bogdanova M. V., Parshintseva L. S., Kvachko V. Yu. Methods of modeling and fore-casting crime in the Russian Federation. Legal Informatics, 2019, no. 4, pp. 50–62. (In Russ.)

4. Osipov V. A. Some aspects of forecasting the development of extremist crime in the Russian Federation. Bulletin of the Belgorod law Institute of the Ministry of internal Affairs of Russia named after I. D. Putilin, 2019, no. 4, pp. 17–22. (In Russ.)

5. Markina S. A. Assessment and forecasting of economic crime in the system of ensuring economic security. Izvestiya Yugo-Zapadnogo gosudarstvennogo universiteta. Series: Economics. Sociology. Management, 2019, vol. 9, no. 6 (35), pp. 147–162. (In Russ.)

6. Bunkovsky D. V., Kapustyuk P. A. Economic factors influencing the development of organized crime. In the book: The activities of law enforcement agencies in modern conditions: collection of materials of the XXII International scientific and practical conference: in 2 vol. Irkutsk, 2017. Pp. 35–39. (In Russ.)


Login or Create
* Forgot password?