Рандомизированное машинное обучение и прогнозирование нелинейных динамических моделей c применением к эпидемиологической модели SIR
Ключевые слова:
рандомизированное машинное обучение, энтропия, энтропийное оценивание, прогнозирование, рандомизированное прогнозированиеАннотация
В работе предлагается подход к оцениванию параметров нелинейных динамических моделей с помощью концепции Рандомизированного машинного обучения (РМО), основанной на переходе от детерминированных моделей к случайным (со случайными параметрами) с последующим оцениванием вероятностных распределений параметров и шумов по реальным данным. Главной особенностью данного метода является его эффективность в условиях малого количества реальных данных. В работе рассматриваются модели, сформулированные в терминах обыкновенных дифференциальных уравнений, которые преобразуются к дискретному виду для постановки и решения задачи энтропийной оптимизации. Применение предлагаемого подхода демонстрируется на задаче прогнозирования общего количества инфицированных COVID-19 с помощью динамической
эпидемиологической модели SIR. Для этого в работе строится рандомизированная модель SIR (R-SIR) с одним параметром, энтропийно-оптимальная оценка которого реализуется его функцией плотности распределения вероятностей, а также функциями плотности распределения вероятностей измерительных шумов в точках, в которых производится обучения. Далее применяется техника рандомизированного прогнозирования с фильтрацией шумов, основанная на генерации соответствующих распределений и построении ансамбля прогнозных траекторий с вычислением средней по ансамблю траектории. В работе реализуется вычислительный эксперимент с использованием реальных оперативных данных о заболеваемости в виде сравнительного исследования с известным методом оценивания параметров модели, основанным на методе наименьших квадратов. Полученные в эксперименте результаты демонстрируют существенное снижение средне-абсолютной процентной ошибки (MAPE) при по отношению к реальным наблюдениям на интервале прогноза, что показывают работоспособность предложенного метода и его эффективность в задачах рассматриваемого в работе типа.
Литература
2. van den Driessche P. Mathematical Epidemiology / ed. by Brauer F., van den Driessche P., Wu J. Berlin, Heidelberg: Springer Berlin Heidelberg, 2008. Vol. 1945 of Lecture Notes in Mathematics. P. 147–157. https://doi.org/10.1007/978-3-540-78911-6.
3. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики.— М.:Юнити, 1998.
4. Лагутин М.Б. Наглядная математическая статистика. — Бином. Лаб. знаний, 2013.
5. Боровков А.А. Математическая статистика. — М.:Наука, 1984.
6. Bishop C. Pattern Recognition and Machine Learning (Information Science and Statistics), 2006. Springer, New York, 2006.
7. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning: Data mining, Inference, and Prediction. Springer New York, 2009.
8. Мерков А.Б. Распознавание образов. Введение в методы статистического обучения. М. : URSS, 2010.
9. Попков Ю.С., Попков А.Ю., Дубнов Ю.А. Рандомизированное машинное обучение при ограниченных наборах данных: от эмпирической вероятности к энтропийной рандомизации. — М.: ЛЕНАНД, 2019. ISBN: 978-5-9710-5908-0.
10. Попков Ю.С., Дубнов Ю.А. Энтропийно-робастное рандомизированное прогнозирование при малых объемах ретроспективных данных // Автоматика и телемеханика. 2016. № 5. С. 109–127.
11. Попков А.Ю. Рандомизированное машинное обучение нелинейных моделей с применением к прогнозированию развития эпидемического процесса // Автоматика и телемеханика. 2021. № 6. С. 149–168. https://doi.org/10.31857/S0005231021060064.
12. Popkov Y.S., Dubnov Y.A., Popkov A.Y. Introduction to the Theory of Randomized Machine Learning // Learning Systems: From Theory to Practice / ed. by Sgurev V., Piuri V., Jotsov V. Cham: Springer International Publishing, 2018. P. 199–220. ISBN: 978-3-319-75181-8. https://doi.org/10.1007/978-3-319-75181-8_10.
13. Попков Ю.С., Попков А.Ю., Дубнов Ю.А. Элементы рандомизированного прогнозирования и его применение для предсказания суточной электрической нагрузки энергетической системы // Автоматика и телемеханика. 2020. С. 148–172. https://doi.org/10.1134/S0005231019070107.
14. Kermack W.O., McKendrick A.G. Contributions to the Mathematical Theory of Epidemics // Proceedings of the Royal Society. 1927. Vol. 115A. P. 700–721.
15. Muller G.R. Zeitschrift f¨ur allgemeine Mikrobiologie / In: The Population Dynamics of Infectious Diseases: Theory and Applications. 368 S., 135 Abb., 104 Tab. London-New York, Chapman and Hall, 1984, Vol. 24, no. 2. pp. 76–76. https://doi.org/10.1002/jobm.19840240203.
16. Hethcote H.W. Three Basic Epidemiological Models // Applied Mathematical Ecology. Springer Berlin Heidelberg, 1989. pp. 119–144. https://doi.org/10.1007/978-3-642-61317-3_5.
17. Peng L., Yang W., Zhang D., Zhuge C., Hong L. Epidemic analysis of COVID-19 in China by dynamical modeling // arXiv, 2020. 10.48550/ARXIV.2002.06563.
18. Yang W., Zhang D., Peng L., Zhuge C., Hong L. Rational evaluation of various epidemic models based on the COVID-19 data of China // Epidemics, 2021. Vol. 37. p. 100501. https://doi.org/10.1016/j.epidem.2021.100501.
19. Cheng C., Zhang D., Dang D., Geng J., Zhu P., Yuan M., Liang R., Yang H., Jin Y., Xie J., Chen S., Duan G. The incubation period of COVID-19: a global meta-analysis of 53 studies and a Chinese observation study of 11 545 patients // Infectious Diseases of Poverty, 2021. Vol. 10, no. 1. https://doi.org/10.1186/s40249-021-00901-9.
20. Huang S., Li J., Dai C., Tie Z., Xu J., Xiong X., Hao X., Wang Z., Lu C. Incubation period of coronavirus disease 2019: New implications for intervention and control // International Journal of Environmental Health Research, 2021. P. 1–9. https://doi.org/10. 1080/09603123.2021.1905781.
21. Li Q. et al. Early Transmission Dynamics in Wuhan, China, of Novel Coronavirus — Infected Pneumonia // New England Journal of Medicine, 2020. Vol. 382, no. 13. P. 1199–1207. https://doi.org/10.1056/nejmoa2001316.
22. Nie X. et al. Epidemiological Characteristics and Incubation Period of 7015 Confirmed Cases With Coronavirus Disease 2019 Outside Hubei Province in China // The Journal of Infectious Diseases, 2020. Vol. 222, no. 1. pp. 26–33. https://doi.org/10.1093/infdis/jiaa211.
23. Guidotti E., Ardia D. COVID-19 Data Hub // Journal of Open Source Software. 2020. Vol. 5, no. 51. P. 2376. https://doi.org/10.21105/joss.02376.
24. COVID-19 Data Hub. https://www.covid19datahub.io. 2021. Accessed: 2022-06-20.
25. Флах П. Наука и искусство построения алгоритмов, которые извлекают знания из данных. ДМК Пресс, 2015.
26. Rubinstein R.Y., Kroese D.P. Simulation and the Monte Carlo method. John Wiley & Sons, 2007. Vol. 707.
Опубликован
Как цитировать
Раздел
Copyright (c) Попков Алексей Юрьевич
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями: Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале. Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале. Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).