Идентификация нейросетевой модели робота для решения задачи оптимального управления
Ключевые слова:
оптимальное управление, идентификация, нейронная сеть, Gazebo, дифференциальный роботАннотация
Для расчета оптимального управления требуется достоверная математическая модель объекта управления. В дальнейшем при реализации расчетных управлений на реальном объекте эта же модель может быть использована в навигации робота для прогнозирования его положения и корректировки показаний сенсоров, поэтому важно, чтобы модель достаточно адекватно отражала динамику объекта. Вывод модели часто требует значительного времени и иногда даже невозможен с использованием традиционных методов. Ввиду все большего разнообразия и чрезвычайно сложной природы объектов управления, включая разнообразие современных робототехнических систем, все большую актуальность приобретает задача идентификации, которая позволяет построить математическую модель объекта управления, имея входные и выходные данные о системе. Идентификация нелинейной системы представляет особый интерес, так как большинство реальных систем имеют нелинейную динамику. И если раньше идентификация модели системы заключалась в подборе оптимальных параметров для выбранной структуры, то появление современных методов машинного обучения открывает более широкие перспективы и позволяет автоматизировать сам процесс идентификации. В настоящей работе в качестве объекта управления рассматривается колесный робот с дифференциальным приводом в симуляционной среде Gazebo, которая на сегодняшний день является наиболее популярным программным пакетом при разработке и моделировании робототехнических систем. Математическая модель робота заранее неизвестна. Основная проблема заключается в том, что существующие математические модели не соответствуют реальной динамике робота в симуляторе. В работе рассматривается решение задачи идентификации математической модели объекта управления с помощью машинного обучения на основе нейронной сети. Представлен новый смешанный подход, основанный на использовании известных простых моделей объектов и идентификации неучтенных динамических свойств объекта с помощью нейронной сети на основе обучающей выборки. Для формирования обучающих данных был написан программный пакет, автоматизирующий процесс сбора с помощью двух ROS-узлов. Для обучения нейросети использовался фреймворк PyTorch и был создан программный пакет с открытым исходным кодом. Далее идентифицированная модель объекта используется для расчета оптимального управления. Результаты вычислительного эксперимента демонстрируют адекватность и работоспособность полученной модели. Представленный подход на основе комбинации известной математической модели и дополнительной идентифицированной нейросетевой модели позволяет использовать преимущества накопленного физико-математического аппарата и повысить его эффективность и точность за счет использования современных средств машинного обучения.
Литература
2. Gazebo simulation environment tutorial: https://www.gazebosim.org/tutorials?tut=ros_overview
3. Ljung L. System Identification: Theory for the User (second ed.). - Upper Saddle River,New Jersey: Prentice-Hall, 1999.
4. Dastangoo P., Ramirez-Serrano A. Non-linear Parameter Identification for HumanoidRobot Components // The 7th International Conference of Control, Dynamic Systems,and Robotics. 2020. 10.11159/cdsr20.148.
5. Алексеев А.А., Кораблев Ю.А., Шестопалов М.Ю. Идентификация и диагностика систем: учеб. для студ. высш. учеб. заведений – М.: Издательский центр «Академия»,2009.
6. Cox P., Toth R. Linear parameter-varying subspace identification: A unified framework // Automatica. 2021. 123. 109296. 10.1016/j.automatica.2020.109296.
7. Sj ̈oberg J., Zhang Q., Ljung L., Benveniste A., Delyon B., Glorennec P., Hjalmarsson H.,Juditsky A. Nonlinear black-box modeling in system identification: a unified overview // Automatica, 1995, 31(12), 1691–1724.
8. Nelles O. Classical Polynomial Approaches. // In: Nonlinear System Identification. Springer, Berlin, Heidelberg, 2001.
9. Fakhrizadeh Esfahani A., Dreesen P., Tiels K., No ̈el J.-P., Schoukens J. Parameterreduction in nonlinear state-space identification of hysteresis. // Mechanical Systems andSignal Processing, 2017. 104. 10.1016/j.ymssp.2017.10.017.
10. Liu G. P. Nonlinear identification and control: a neural network approach. – SpringerScience & Business Media, 2012.
11. Werbos P. J. (n.d.). Neural networks for control and system identification. // Proceedingsof the 28th IEEE Conference on Decision and Control, 1989. doi:10.1109/cdc.1989.70114
12. Fu Z. J. et al. Nonlinear systems identification and control via dynamic multitime scalesneural networks // IEEE Transactions on neural networks and learning systems. 2013,V.24, No.11. p. 1814-1823.
13. Dang T.P., Diveev A.I., Kazaryan D.E., Sofronova E.A. Identification Control SynthesisBy The Network Operator Method. // Proceedings 2015 IEEE 10th Conference onIndustrial Electronics and Applications (ICIEA), June, 2015. pp. 1559–1564.
14. Дивеев А.И., Софронова Е.А., Шмалько Е.Ю. Метод идентификационного синтеза управления и его применение к мобильному роботу // Информационные и математические технологии в науке и управлении. 2016. No 2. С. 53-61.
15. Gautam P. System identification of nonlinear Inverted Pendulum using artificial neuralnetwork // 2016 International Conference on Recent Advances and Innovations inEngineering (ICRAIE), 2016. 1-5. 10.1109/ICRAIE.2016.7939522.
16. Zheng D.D., Xie W. F., Luo C. Robust identification for singularly perturbed nonlinearsystems using multi-time-scale dynamic neural network // 2017 IEEE 56th AnnualConference on Decision and Control (CDC). 2017, p. 6487-6492.
17. Mohajerin N., Waslander S. L. Multistep prediction of dynamic systems with recurrentneural networks // IEEE transactions on neural networks and learning systems, 2019, V.30, No.11, p. 3370-3383.
18. Khodabandehlou H., Fadali M. S. Nonlinear System Identification using Neural Networksand Trajectory-Based Optimization // arXiv preprint arXiv:1804.10346. – 2018.
19. Williams G. et al. Aggressive driving with model predictive path integral control // 2016IEEE International Conference on Robotics and Automation (ICRA), 2016, p. 1433-1440.
20. Williams G. et al. Autonomous racing with autorally vehicles and differential games //arXiv preprint arXiv:1707.04540. – 2017.
21. Samal, M. K., Anavatti, S., Garratt, M. Neural Network Based System Identificationfor Autonomous Flight of an Eagle Helicopter. // IFAC Proceedings Volumes, 41(2),7421–7426, 2008. doi:10.3182/20080706-5-kr-1001.01254
22. Yu Wang. A new concept using LSTM Neural Networks for dynamic system identification.// American Control Conference (ACC), 2017. doi:10.23919/acc.2017.7963782
23. Brunton S.L., Proctor J.L., Kutz J.N. Discovering governing equations from data: Sparseidentification of nonlinear dynamical systems, 2015. doi:10.1073/pnas.1517384113
24. Kaiser E., Kutz J. N., Brunton S. L. Sparse identification of nonlinear dynamics formodel predictive control in the low-data limit // Proceedings of the Royal Society A. 2018,V.474, No. 2219. p. 20180335.
25. Jian’an X., Mingjun Z., Jian Z. Kinematic model identification of autonomous mobilerobot using dynamical recurrent neural networks // IEEE International ConferenceMechatronics and Automation, 2005. V.3, p. 1447-1450.
26. Roy T., Barai R.K. and Dey R. Identification of Differentially Driven Wheeled MobileRobot using Neural Networks // International Journal of Electrical, Electronics andComputer Engineering 2(2): 38-45 (2013).
27. Lavrenov R., Magid E., Matsuno F., Svinin M., Suthakorn J. Development andImplementation of Spline-based Path Planning Algorithm in ROS/Gazebo Environment // SPIIRAS Proceedings, 2019. 18. 57-84. 10.15622/sp.18.1.57-84.
28. Zhang B., Liu P. Control and benchmarking of a 7-DOF robotic arm using Gazebo andROS // PeerJ Computer Science. 2021. 7. 10.7717/peerj-cs.383.
29. https://github.com/husarion/rosbot_description
30. ˇSuster P. , Jadlovsk ́a A. Tracking Trajectory of the Mobile Robot Khepera II UsingApproaches of Artificial Intelligence // Acta Electrotechnica et Informatica, 2011, V. 11.doi:10.2478/v10198-011-0006-y
31. Программный пакет для сбора данных для обучения сети в симуляторе Gazebo https://github.com/urock/rosbot
32. Программный пакет для обучения нейросетевой модели https://github.com/FastSense/robot_model_training
33. Kennedy J., Eberhart R. Particle swarm optimization // Proceedings of ICNN’95-international conference on neural networks, IEEE, 1995, V.4, p. 1942-1948.
34. Diveev A., Shmalko E. Evolutionary Computation for Synthesis of Control System forGroup of Robots and Optimum Choice of Trajectories for their Movement // In: Yu. G.Evtushenko, M. Yu. Khachay, O. V. Khamisov, Yu. A. Kochetov, V.U. Malkova, M.A.Posypkin (eds.): Proceedings of the OPTIMA-2017 Conference, Petrovac, Montenegro, 02 Oct 2017, pp. 158-165.
35. Дивеев А.И., Константинов С.В. Исследование практической сходимости эволюционных алгоритмов оптимального программного управления колесным роботом //Известия РАН. Теория и системы управления, 2018, No 4, том 57, С. 80-106.
Опубликован
Как цитировать
Раздел
Copyright (c) Елизавета Юрьевна Шмалько, Юрий Андреевич Румянцев, Байназаров Рысбекович Руслан, Константин Леонидович Ямшанов
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями: Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале. Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале. Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).