Индуктивный метод восстановления временных рядов геомагнитных данных
Ключевые слова:
геомагнитные данные, временные ряды, пропущенные значения, машинное обучение, обучение по прецедентам, импутация временных рядовАннотация
В настоящее время интенсивное развитие систем и технологий регистрации параметров магнитного поля Земли способствует экспоненциальному росту объемов геомагнитных данных, основным источником которых выступают постоянные магнитные станции. Несовершенство применяемой аппаратуры и задействованных каналов передачи информации обуславливает наличие пропусков во временных рядах зарегистрированных данных, что вместе с пространственной анизотропией создает серьезное препятствие для обработки геомагнитных данных при решении прикладных задач. Российские и зарубежные научные организации восстанавливают пропущенные геомагнитные данные методом линейной интерполяции, что обеспечивает приемлемые результаты в условиях спокойной магнитосферы, но значительно искажает временные ряды при изменении окружающей магнитной обстановки. В этой связи возникает актуальная научно-техническая задача разработки подхода к восстановлению геомагнитных данных в условиях возбужденной магнитосферы, обеспечивающего оптимальные метрики качества импутации временных рядов. Авторами предложен метод восстановления временных рядов, основанный на индуктивном методе обучения алгоритмов. Согласно предлагаемому подходу, каждая магнитная станция оперирует собственной базой знаний, формируемой в ходе регистрации параметров геомагнитного поля и его вариаций. Комбинация значений ряда, предшествующих и следующих за пропуском, является признаковым описанием, применяемым для поиска прецедента в базе знаний магнитной станции. Результат содержит искомый фрагмент временного ряда и заменяет пропущенные значения его уровней. Сложность характера информационного сигнала, обусловленная неспокойной магнитной обстановкой, повышает точность поиска по прецедентам, эффективность которого тем выше, чем большей базой знаний располагает магнитная станция. Проведенный анализ результатов восстановления пропусков временных рядов геомагнитных данных, зарегистрированных в условиях возбужденной магнитосферы, показал, что предложенный индуктивный метод импутации позволяет повысить точность восстановления пропущенных значений в среднем на 79.54 % по сравнению с используемыми в настоящее время методами, что позволит повысить эффективность обработки геомагнитных данных при решении прикладных задач.Литература
1. Мандрикова О. В., Жижикина Е. А. Автоматический способ оценки состояния геомагнитного поля // Компьютерная оптика. 2015. Т. 39, № 3. С. 420–428.
2. INTERMAGNET technical reference manual. Version 4.6 / Ed. by S.-L. Benoît. Ed-inburgh : INTERMAGNET, BGS, 2012. 100 p.
3. Love J .J., Chulliat A. An international network of magnetic observatories // Eos Trans. AGU. 2013. no. 94(42). pp. 373–374.
4. Macmillan S., Olsen N. Observatory data and the Swarm mission // Earth, Planets and Space. 2013. vol. 65. no. 11. pp. 1355–1362.
5. Гвишиани А. Д., Лукьянова Р. Ю. Геоинформатика и наблюдения магнитного поля Земли: российский сегмент // Физика Земли. 2015. № 2. С. 3–20.
6. Mandea M., Korte M. Geomagnetic Observations and Models. Springer, 2011. 343 p.
7. Интерполяция данных обсерваторских измерений и визуализация полной напряженности магнитного поля Земли / А. И. Рыбкина [и др.] // Вестник Отде-ления наук о Земле РАН. 2013. Т. 5, № 3002. С. 1–4.
8. Survey of geomagnetic observations made in the northern sector of Russia and new methods for analysing them / A. Gvishiani [et al.] // Surveys in Geophysics. 2014. vol. 35(5). pp. 1123–1154.
9. Mathematical tools for geomagnetic data monitoring and the INTERMAGNET Rus-sian segment / A. Soloviev [et al.] // Data Science Journal. 2013. V. 12. P. WDS114-WDS119.
10. Damodar N. Gujarati. Basic Econometrics. The McGraw-Hill Companies, 2004. 1002 p.
11. Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс. М.: Дело, 2007. 504 с.
12. Лукашин Ю. П. Адаптивные методы краткосрочного прогнозирования времен-ных рядов // М.: Финансы и статистика, 2003. 416 с.
13. Vorobev A. V., Vorobeva G. R. Web-oriented 2D/3D-visualization of geomagnetic field and its variations parameters // Scientific visualization. 2017. vol. 9, no.2. pp. 94–101.
14. Gooijer J. Elements of nonlinear time series analysis and forecasting. Cham, Switzer-land : Springer, 2017.
15. Jain E., Mallick D. A Study of time series models ARIMA and ETS // International Journal of Modern Education and Computer Science (IJMECS). 2017. vol. 9, no.4. pp. 57–63.
16. Pfaff B. Analysis of integrated and cointegrated time series with R. New York : Springer, 2008. 190 p.
17. Чучуева И. А. Модель прогнозирования временных рядов по выборке максимального подобия: диссертация… канд. тех. наук / Московский государственный технический университет им. Н.Э. Баумана // М., 2012.
18. Time series analysis: forecasting and control / G. Box [et al.] // New York: John Wiley & Sons, 2017. 712 p.
19. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. 403 с.
20. Langford J. Quantitatively tight sample complexity bounds // Carnegie Mellon Thesis. 2002.
21. Moritz S., Sard´a A., Bartz-Beielstein T. Comparison of different Methods for Uni-variate Time Series Imputation in R. ArXiv e-prints, Oct. 2015
22. Литтл Р.Дж.А., Рубин Д.Б. Статистический анализ данных с пропусками. М., 1990.
23. Злоба Е., Яцкив И. Статистические методы восстановления пропущенных данных. Рига : Институт транспорта и связи, 2002 г.
2. INTERMAGNET technical reference manual. Version 4.6 / Ed. by S.-L. Benoît. Ed-inburgh : INTERMAGNET, BGS, 2012. 100 p.
3. Love J .J., Chulliat A. An international network of magnetic observatories // Eos Trans. AGU. 2013. no. 94(42). pp. 373–374.
4. Macmillan S., Olsen N. Observatory data and the Swarm mission // Earth, Planets and Space. 2013. vol. 65. no. 11. pp. 1355–1362.
5. Гвишиани А. Д., Лукьянова Р. Ю. Геоинформатика и наблюдения магнитного поля Земли: российский сегмент // Физика Земли. 2015. № 2. С. 3–20.
6. Mandea M., Korte M. Geomagnetic Observations and Models. Springer, 2011. 343 p.
7. Интерполяция данных обсерваторских измерений и визуализация полной напряженности магнитного поля Земли / А. И. Рыбкина [и др.] // Вестник Отде-ления наук о Земле РАН. 2013. Т. 5, № 3002. С. 1–4.
8. Survey of geomagnetic observations made in the northern sector of Russia and new methods for analysing them / A. Gvishiani [et al.] // Surveys in Geophysics. 2014. vol. 35(5). pp. 1123–1154.
9. Mathematical tools for geomagnetic data monitoring and the INTERMAGNET Rus-sian segment / A. Soloviev [et al.] // Data Science Journal. 2013. V. 12. P. WDS114-WDS119.
10. Damodar N. Gujarati. Basic Econometrics. The McGraw-Hill Companies, 2004. 1002 p.
11. Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс. М.: Дело, 2007. 504 с.
12. Лукашин Ю. П. Адаптивные методы краткосрочного прогнозирования времен-ных рядов // М.: Финансы и статистика, 2003. 416 с.
13. Vorobev A. V., Vorobeva G. R. Web-oriented 2D/3D-visualization of geomagnetic field and its variations parameters // Scientific visualization. 2017. vol. 9, no.2. pp. 94–101.
14. Gooijer J. Elements of nonlinear time series analysis and forecasting. Cham, Switzer-land : Springer, 2017.
15. Jain E., Mallick D. A Study of time series models ARIMA and ETS // International Journal of Modern Education and Computer Science (IJMECS). 2017. vol. 9, no.4. pp. 57–63.
16. Pfaff B. Analysis of integrated and cointegrated time series with R. New York : Springer, 2008. 190 p.
17. Чучуева И. А. Модель прогнозирования временных рядов по выборке максимального подобия: диссертация… канд. тех. наук / Московский государственный технический университет им. Н.Э. Баумана // М., 2012.
18. Time series analysis: forecasting and control / G. Box [et al.] // New York: John Wiley & Sons, 2017. 712 p.
19. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. 403 с.
20. Langford J. Quantitatively tight sample complexity bounds // Carnegie Mellon Thesis. 2002.
21. Moritz S., Sard´a A., Bartz-Beielstein T. Comparison of different Methods for Uni-variate Time Series Imputation in R. ArXiv e-prints, Oct. 2015
22. Литтл Р.Дж.А., Рубин Д.Б. Статистический анализ данных с пропусками. М., 1990.
23. Злоба Е., Яцкив И. Статистические методы восстановления пропущенных данных. Рига : Институт транспорта и связи, 2002 г.
Опубликован
2018-03-30
Как цитировать
Воробьев, А. В., & Воробьева, Г. Р. (2018). Индуктивный метод восстановления временных рядов геомагнитных данных. Труды СПИИРАН, 2(57), 104-133. https://doi.org/10.15622/sp.57.5
Раздел
Искусственный интеллект, инженерия данных и знаний
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями:
Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале.
Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале.
Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).