Прогнозирование развития эпидемии COVID-19 в странах Европейского союза с использованием энтропийно-рандомизированного подхода
Ключевые слова:
моделирование эпидемий, SARS-CoV-2, COVID-19, рандомизированное машинное обучение, энтропия, энтропийное оценивание, прогнозирование, рандомизированное прогнозированиеАннотация
Работа посвящена прогнозированию развития эпидемии COVID-19 с помощью нового метода рандомизированного машинного обучения. Основу метода составляет идея оценивания распределений вероятностей параметров модели по реальным данным вместе с распределением вероятностей измерительных шумов. Энтропийно-оптимальные распределения соответствуют состоянию максимальной неопределенности, что позволяет использовать получаемые в итоге прогнозы, как прогнозы наиболее ``негативного'' сценария исследуемого процесса. Полученные оценки параметров и шумов, которые представляют собой распределения вероятностей, необходимо генерировать, получая таким образом ансамбль траекторий, который требуется анализировать статистическими методами. Для целей такого анализа проводится вычисление средней и медианной по ансамблю траектории, а также траектории, соответствующей средним по распределению значениям параметров модели. Предлагаемый подход используется для прогнозирования общего количества инфицированных с помощью трехпараметрической логистической модели роста. Проведенный эксперимент основан на реальных данных о распространении COVID-19 в нескольких странах Европейского союза. Основной целью эксперимента является демонстрация энтропийно-рандомизированного подхода для прогнозирования эпидемического процесса на основе реальных данных вблизи пика. Существенная неопределенность, содержащаяся в доступных реальных данных моделируется аддитивным шумом в пределах 30%, который используется как на этапе обучения модели, так и при прогнозировании. Для настройки гиперпараметров модели используется схема их настройки по тестовой выборке с последующим переобучением. Показано, что при одинаковых наборах данных, предлагаемый подход позволяет более эффективно прогнозировать развитие эпидемии по сравнению со стандартным подходом, основанным на методе наименьших квадратов.
Литература
2. Kumar J., Hembram K.P.S.S. Epidemiological study of novel coronavirus (COVID-19). ArXiv. 2020. URL: http://arxiv.org/abs/2003.11376 (accessed 02.09.2021).
3. Yang W., Zhang D., Peng L., Zhuge C., and Hong L. Rational evaluation of various epidemic models based on the COVID-19 data of China. ArXiv. 2020. URL: http://arxiv.org/abs/2003.05666 (accessed 02.09.2021).
4. Tátrai D., Várallyay Z. COVID-19 epidemic outcome predictions based on logistic fitting and estimation of its reliability. ArXiv. 2020. URL: http://arxiv.org/abs/2003.14160 (accessed 02.09.2021).
5. Morais A.F. Logistic approximations used to describe new outbreaks in the 2020 COVID-19 pandemic. ArXiv. 2020. URL: http://arxiv.org/abs/2003.11149 (accessed 02.09.2021).
6. Shen C.Y. Logistic growth modelling of COVID-19 proliferation in China and its international implications. International Journal of Infectious Diseases. 2020. vol. 96. pp. 582–589. URL: https://doi.org/10.1016/j.ijid.2020.04.085 (accessed 02.09.2021).
7. Wang P., Zheng X., Li J., Zhu B. Prediction of epidemic trends in COVID-19 with logistic model and machine learning technics. Chaos, Solitons & Fractals. 2020. vol. 139. pp. 110058. URL: https://doi.org/10.1016/j.chaos.2020.110058 (accessed 02.09.2021).
8. Chen D.-G., Chen X., Chen J.K. Reconstructing and forecasting the COVID-19 epidemic in the United States using a 5-parameter logistic growth model. Global Health Research and Policy. 2020. vol. 5. no. 1. 25 p.
9. Попков Ю.С., Попков А.Ю., Дубнов Ю.А. Рандомизированное машинное обучение при ограниченных наборах данных: от эмпирической вероятности к энтропийной рандомизации. М.: ЛЕНАНД, 2019.
10. Больцман Л. О связи между вторым началом механической теории теплоты и теорией вероятностей в теоремахо тепловом равновесии. Больцман Л.Э. Избранные труды. Под ред. Шлак Л.С. М.: Наука, 1984.
11. Jaynes E.T. Information theory and statistical mechanics. Physical review. 1957. vol. 106. no. 4. pp. 620–630.
12. Jaynes E.T. Probability theory: the logic of science. Cambridge university press. 2003.
13. Shannon C.E. Communication theory of secrecy systems. Bell Labs Technical Journal. 1949. vol. 28. no. 4. pp. 656–715.
14. Verhulst P.-F. Notice sur la loi que la population suit dans son accroissement. Corresp. Math. Phys. 1838. vol. 10. pp. 113–126.
15. Singer H.M. The COVID-19 pandemic: growth patterns, power law scaling, and saturation. Physical Biology. 2020. vol. 17. no. 5. pp. 055001.
16. Popkov Yu.S., Dubnov Yu.A., Popkov A.Yu. Randomized machine learning: Statement, solution, applications. Intelligent Systems (IS), 2016 IEEE 8th International Conference on IEEE. 2016. pp. 27–39.
17. Popkov Y.S., Dubnov Y.A., Popkov A.Y. Introduction to the Theory of Randomized Machine Learning. Learning Systems: From Theory to Practice / ed. by Sgurev V., Piuri V., Jotsov V. Cham: Springer International Publishing, 2018. pp. 199–220.
18. Popkov Y.S., Dubnov Y.A., Popkov A.Y. New method of randomized forecasting using entropy-robust estimation: Application to the World population prediction. Mathematics. 2016. vol. 4. no. 1. pp. 1–16.
19. Popkov Y.S., Volkovich Z., Dubnov Y.A., Avros R., Ravve E. Entropy 2-Soft Classification of Objects. Entropy. 2017. vol. 19. no. 4. P. 178.
20. Dubnov Y.A. Entropy-Based Estimation in Classification Problems. Automation and Remote Control. 2019. vol. 80, pp. 502–512.
21. Popkov Y.S., Popkov A.Y., Dubnov Y.A., Solomatine D. Entropy-Randomized Forecasting of Stochastic Dynamic Regression Models. Mathematics. 2020. No. 8. pp. 1119.
22. Popkov A.Y. Randomized machine learning of nonlinear models with application to the prediction of the development of epidemic process. Automation and Remote Control. 2021.
23. Dong E., Du H., Gardner L. An interactive web-based dashboard to track COVID-19 in real time. The Lancet infectious diseases. 2020. vol. 20. no. 5. pp. 533–534.
24. COVID-19 Data Repository by the Center for Systems Science and Engineering (CSSE) at Johns Hopkins University. URL: https://github.com/CSSEGISandData/COVID-19 (accessed 02.09.2021).
25. Golan A., Judge G., Miller D. Maximum Entropy Econometrics: Robust Estimation with Limited Data. New York : John Wiley & Sons. 1996.
26. Golan A. Information and entropy econometrics. A review and synthesis. Foundations and trends in Econometrics. 2008. vol. 2. no. 1-2. pp. 1–145.
27. Nocedal J., Wright S. Numerical optimization. Springer Science & Business Media. 2006.
28. Nash S.G. Newton-type minimization via the Lanczos method. SIAM Journal on Numerical Analysis. 1984. vol.21. no. 4. pp. 770–788.
Опубликован
Как цитировать
Раздел
Copyright (c) Юрий Соломонович Попков, Юрий Андреевич Дубнов, Попков Алексей Юрьевич
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями: Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале. Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале. Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).