Автоматический подбор параметров модели ARIMA для прогноза количества случаев заражения и смерти от COVID-19
Автор: Макаровских Татьяна Анатольевна, Аботалеб Мостафа Салахелдин Абделсалам
Статья в выпуске: 2 т.10, 2021 года.
Бесплатный доступ
В работе исследовано применение модели ARIMA прогнозирования временных рядов для анализа открытых данных о распространении коронавирусной инфекции в ряде регионов Российской Федерации. Рассматривается возможность применения существующих методов и алгоритмов языка программирования для статистической обработки данных R, приводятся алгоритмы подбора параметров модели ARIMA. Разработан и опубликован скрипт на языке программирования R, позволяющий осуществить с помощью стандартной библиотеки auto.arima прогнозирование суммарных случаев заражения и летальных исходов на выбранный промежуток времени. В работе показано, что параметры модели различны для временных рядов разной длины, для различных регионов, кроме того, параметры модели меняются с течением времени. Исследован имеющийся инструментарий языка R и показано, что существуют наборы данных для которых он не позволяет получить параметры модели, дающей наименьшую погрешность. Исследована частота переобучения модели, приведены данные об изменении параметров модели для временных рядов разной длины. Исследование случаев ошибки автоматического подбора параметров модели является темой для дальнейших исследований. Приведена содержательная интерпретация полученных данных. Проведено сравнение прогнозов, полученных в конце октября 2020 г. и актуальных данных на середину ноября 2020 г. Показано, что полученный прогноз позволил достаточно точно предсказать суммарное число заражений и летальных исходов на 7-10 дней.
ARIMA, Covid-19, прогнозирование, скрипт, подбор параметров
Короткий адрес: https://sciup.org/147234292
IDR: 147234292 | DOI: 10.14529/cmse210202
Список литературы Автоматический подбор параметров модели ARIMA для прогноза количества случаев заражения и смерти от COVID-19
- Аботалеб М.С.А., Макаровских Т.А. Ручной подбор параметров модели ARIMA для прогнозирования летальных случаев Covid-19 в Челябинсклй области. URL: https: //rpubs.com/abotalebmostaf a/710535 (дата обращения: 09.01.2021).
- Аботалеб М.С.А., Макаровских Т.А. New package «Epidemic.ta» for forecasting Covid-19 infection cases apply Example For forecasting infection cases in the USA. URL: https: //rpubs.com/abotalebmostafa/711262 (дата обращения: 09.01.2021).
- Аботалеб М.С.А., Макаровских Т.А. Research opportunities automatic parameter selection arima models for short term forecast cases Covid-19. URL: https://rpubs.com/ abotalebmostafa/710470 (дата обращения: 09.01.2021).
- Аботалеб М.С.А., Макаровских Т.А. Using auto arima for forecasting Deaths of COVID-19 in Chelyabinsk. URL: https://rpubs.com/abotalebmostafa/710528 (дата обращения: 09.01.2021)
- Коронавирус: статистика. URL: https://yandex.ru/covidl9/stat (дата обращения: 09.01.2021) .
- Лакман И.А., Агапитов А.А., Садикова Л.Ф. и др. Возможности математического прогнозирования коронавирусной инфекции в Российской Федерации // Артериальная гипертензия. 2020. Т. 26, № 3. С. 288-294. DOI: 10.18705/1607-419Х-2020-26-3-288-294.
- Эверитт Б. Большой словарь по статистике. СПб.: Проспект, 2012. 736 с.
- Abotaleb M.S.A. Predicting COVID-19 Cases using Some Statistical Models: An Application to the Cases Reported in China Italy and USA // Academic Journal of Applied Mathematical Sciences. 2020. Vol. 6, no. 4. P. 32-40. DOI: 10.32861/ajams.64.32.40.
- Chaurasia V., Pal S. COVID-19 Pandemic: ARIMA and Regression Model-Based Worldwide Death Cases Predictions // SN Computer Science. 2020. Art. 1:288. DOI: 10.1007/s42979-020-00298-6.
- COVID-19 Data Repository by the Center for Systems Science and Engineering (CSSE) at Johns Hopkins University. URL: https://github.com/CSSEGISandData/C0VID-19 (дата обращения: 23.11.2020).
- COVID-19: Status of Cases in Toronto. URL: https://www.toronto.ca/home/covid-19/ covid-19-latest-city-of-toronto-news/covid-19-status-of-cases-in-toronto/ (дата обращения: 23.11.2020).
- Elie R., Hubert E., Turinici G. Contact rate epidemic control of COVID-19: an equilibrium view // Mathematical Modelling of Natural Phenomena. 2020. Vol. 15, art. 35. DOI: 10.1051/mmnp/2020022.
- Hernandez-Matamorosb A., Fujitaa H., Hayashib T., Perez-Meana H. Forecasting of COVID-19 per regions using ARIMA models and polynomial functions // Applied Soft Computing Journal. 2020. Vol. 96, art. 106610. DOI: 10.1016/j.asoc.2020.106610.
- Hussain N., Li B. Using R-studio to examine the COVID-19 Patients in Pakistan Implementation of SIR Model on Cases // International Journal of Scientific Research in Multidisciplinary Studies. 2020. Vol. 6, no. 8. P. 54-59. DOI: 10.13140/RG.2.2.32580.04482.
- Hyndman R.J., Athanasopoulos G. Forecasting: principles and practice. OTexts, 2018. 384 p.
- Kumar M., Gupta S., Kumar К., Sachdeva М. Spreading of Covid-19 in India, Italy, Japan, Spain, UK, US: A Prediction Using ARIMA and LSTM Model // Digital Government: Research and Practice. 2020. Vol. 1, no. 4, art. 24. DOI: 10.1145/3411760.
- Panda M. Application of ARIMA and Holt-Winters forecasting model to predict the spreading of COVID-19 for India and its states. DOI: 10.1101/2020.07.14.20153908 (дата обращения: 10.02.2021).
- Perone G. ARIMA forecasting of COVID-19 incidence in Italy, Russia, and the USA. DOI: 10.2139/ssrn.3612402 (дата обращения: 10.02.2021).
- Shokeralla A.A.A., Sameeh F.R.I., Musa A.G.M., Zahrani S. Prediction the daily number of confirmed cases of covid-19 in Sudan with arima and holt winter exponential smoothing // International Journal of Development Research. 2020. Vol. 10, no. 8. P. 39408-39413 DOI: 10.37118/ijdr. 19811.08.2020.
- Sun D., Duan L., Xiong J., Wang D. Modelling and forecasting the spread tendency of the COVID-19 in China // BMC Infectious Diseases. DOI: 10.21203/rs.3.rs-26772/vl (дата обращения: 10.02.2021).
- Volpert V., Banerjee M., d’Onofrio A., Lipniacki T., Petrovskii S., Tran V.Ch. Coronavirus: scientific insights and societal aspects // Mathematical Modelling of Natural Phenomena. 2020. Vol. 15, art. E2. DOI: 10.1051/mmnp/2020010.
- Volpert V., Banerjee M., Petrovskii S., Volpert V. On a quarantine model of coronavirus infection and data analysis // Mathematical Modelling of Natural Phenomena. 2020. Vol. 15, art. 24. DOI: 10.1051/mmnp/2020006.