Идентификация нейросетевой модели робота для решения задачи оптимального управления

Елизавета Юрьевна Шмалько; Юрий Андреевич Румянцев; Руслан Рысбекович Байназаров; Константин Леонидович Ямшанов

doi:10.15622/ia.20.6.3

Елизавета Юрьевна Шмалько ФИЦ ИУ РАН
Юрий Андреевич Румянцев ФИЦ ИУ РАН
Руслан Рысбекович Байназаров ООО Фаст Сенс Студия
Константин Леонидович Ямшанов Новосибирский государственный технический университет (НГТУ)

DOI:

https://doi.org/10.15622/ia.20.6.3

Ключевые слова:

оптимальное управление, идентификация, нейронная сеть, Gazebo, дифференциальный робот

Аннотация

Для расчета оптимального управления требуется достоверная математическая модель объекта управления. В дальнейшем при реализации расчетных управлений на реальном объекте эта же модель может быть использована в навигации робота для прогнозирования его положения и корректировки показаний сенсоров, поэтому важно, чтобы модель достаточно адекватно отражала динамику объекта. Вывод модели часто требует значительного времени и иногда даже невозможен с использованием традиционных методов. Ввиду все большего разнообразия и чрезвычайно сложной природы объектов управления, включая разнообразие современных робототехнических систем, все большую актуальность приобретает задача идентификации, которая позволяет построить математическую модель объекта управления, имея входные и выходные данные о системе. Идентификация нелинейной системы представляет особый интерес, так как большинство реальных систем имеют нелинейную динамику. И если раньше идентификация модели системы заключалась в подборе оптимальных параметров для выбранной структуры, то появление современных методов машинного обучения открывает более широкие перспективы и позволяет автоматизировать сам процесс идентификации. В настоящей работе в качестве объекта управления рассматривается колесный робот с дифференциальным приводом в симуляционной среде Gazebo, которая на сегодняшний день является наиболее популярным программным пакетом при разработке и моделировании робототехнических систем. Математическая модель робота заранее неизвестна. Основная проблема заключается в том, что существующие математические модели не соответствуют реальной динамике робота в симуляторе. В работе рассматривается решение задачи идентификации математической модели объекта управления с помощью машинного обучения на основе нейронной сети. Представлен новый смешанный подход, основанный на использовании известных простых моделей объектов и идентификации неучтенных динамических свойств объекта с помощью нейронной сети на основе обучающей выборки. Для формирования обучающих данных был написан программный пакет, автоматизирующий процесс сбора с помощью двух ROS-узлов. Для обучения нейросети использовался фреймворк PyTorch и был создан программный пакет с открытым исходным кодом. Далее идентифицированная модель объекта используется для расчета оптимального управления. Результаты вычислительного эксперимента демонстрируют адекватность и работоспособность полученной модели. Представленный подход на основе комбинации известной математической модели и дополнительной идентифицированной нейросетевой модели позволяет использовать преимущества накопленного физико-математического аппарата и повысить его эффективность и точность за счет использования современных средств машинного обучения.

Литература

1. Зенкевич С.Л., Назарова А.В. Система управления мобильного колесного робота // Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2006. No 3, с.31-51.
2. Gazebo simulation environment tutorial: https://www.gazebosim.org/tutorials?tut=ros_overview
3. Ljung L. System Identification: Theory for the User (second ed.). - Upper Saddle River,New Jersey: Prentice-Hall, 1999.
4. Dastangoo P., Ramirez-Serrano A. Non-linear Parameter Identification for HumanoidRobot Components // The 7th International Conference of Control, Dynamic Systems,and Robotics. 2020. 10.11159/cdsr20.148.
5. Алексеев А.А., Кораблев Ю.А., Шестопалов М.Ю. Идентификация и диагностика систем: учеб. для студ. высш. учеб. заведений – М.: Издательский центр «Академия»,2009.
6. Cox P., Toth R. Linear parameter-varying subspace identification: A unified framework // Automatica. 2021. 123. 109296. 10.1016/j.automatica.2020.109296.
7. Sj ̈oberg J., Zhang Q., Ljung L., Benveniste A., Delyon B., Glorennec P., Hjalmarsson H.,Juditsky A. Nonlinear black-box modeling in system identification: a unified overview // Automatica, 1995, 31(12), 1691–1724.
8. Nelles O. Classical Polynomial Approaches. // In: Nonlinear System Identification. Springer, Berlin, Heidelberg, 2001.
9. Fakhrizadeh Esfahani A., Dreesen P., Tiels K., No ̈el J.-P., Schoukens J. Parameterreduction in nonlinear state-space identification of hysteresis. // Mechanical Systems andSignal Processing, 2017. 104. 10.1016/j.ymssp.2017.10.017.
10. Liu G. P. Nonlinear identification and control: a neural network approach. – SpringerScience & Business Media, 2012.
11. Werbos P. J. (n.d.). Neural networks for control and system identification. // Proceedingsof the 28th IEEE Conference on Decision and Control, 1989. doi:10.1109/cdc.1989.70114
12. Fu Z. J. et al. Nonlinear systems identification and control via dynamic multitime scalesneural networks // IEEE Transactions on neural networks and learning systems. 2013,V.24, No.11. p. 1814-1823.
13. Dang T.P., Diveev A.I., Kazaryan D.E., Sofronova E.A. Identification Control SynthesisBy The Network Operator Method. // Proceedings 2015 IEEE 10th Conference onIndustrial Electronics and Applications (ICIEA), June, 2015. pp. 1559–1564.
14. Дивеев А.И., Софронова Е.А., Шмалько Е.Ю. Метод идентификационного синтеза управления и его применение к мобильному роботу // Информационные и математические технологии в науке и управлении. 2016. No 2. С. 53-61.
15. Gautam P. System identification of nonlinear Inverted Pendulum using artificial neuralnetwork // 2016 International Conference on Recent Advances and Innovations inEngineering (ICRAIE), 2016. 1-5. 10.1109/ICRAIE.2016.7939522.
16. Zheng D.D., Xie W. F., Luo C. Robust identification for singularly perturbed nonlinearsystems using multi-time-scale dynamic neural network // 2017 IEEE 56th AnnualConference on Decision and Control (CDC). 2017, p. 6487-6492.
17. Mohajerin N., Waslander S. L. Multistep prediction of dynamic systems with recurrentneural networks // IEEE transactions on neural networks and learning systems, 2019, V.30, No.11, p. 3370-3383.
18. Khodabandehlou H., Fadali M. S. Nonlinear System Identification using Neural Networksand Trajectory-Based Optimization // arXiv preprint arXiv:1804.10346. – 2018.
19. Williams G. et al. Aggressive driving with model predictive path integral control // 2016IEEE International Conference on Robotics and Automation (ICRA), 2016, p. 1433-1440.
20. Williams G. et al. Autonomous racing with autorally vehicles and differential games //arXiv preprint arXiv:1707.04540. – 2017.
21. Samal, M. K., Anavatti, S., Garratt, M. Neural Network Based System Identificationfor Autonomous Flight of an Eagle Helicopter. // IFAC Proceedings Volumes, 41(2),7421–7426, 2008. doi:10.3182/20080706-5-kr-1001.01254
22. Yu Wang. A new concept using LSTM Neural Networks for dynamic system identification.// American Control Conference (ACC), 2017. doi:10.23919/acc.2017.7963782
23. Brunton S.L., Proctor J.L., Kutz J.N. Discovering governing equations from data: Sparseidentification of nonlinear dynamical systems, 2015. doi:10.1073/pnas.1517384113
24. Kaiser E., Kutz J. N., Brunton S. L. Sparse identification of nonlinear dynamics formodel predictive control in the low-data limit // Proceedings of the Royal Society A. 2018,V.474, No. 2219. p. 20180335.
25. Jian’an X., Mingjun Z., Jian Z. Kinematic model identification of autonomous mobilerobot using dynamical recurrent neural networks // IEEE International ConferenceMechatronics and Automation, 2005. V.3, p. 1447-1450.
26. Roy T., Barai R.K. and Dey R. Identification of Differentially Driven Wheeled MobileRobot using Neural Networks // International Journal of Electrical, Electronics andComputer Engineering 2(2): 38-45 (2013).
27. Lavrenov R., Magid E., Matsuno F., Svinin M., Suthakorn J. Development andImplementation of Spline-based Path Planning Algorithm in ROS/Gazebo Environment // SPIIRAS Proceedings, 2019. 18. 57-84. 10.15622/sp.18.1.57-84.
28. Zhang B., Liu P. Control and benchmarking of a 7-DOF robotic arm using Gazebo andROS // PeerJ Computer Science. 2021. 7. 10.7717/peerj-cs.383.
29. https://github.com/husarion/rosbot_description
30. ˇSuster P. , Jadlovsk ́a A. Tracking Trajectory of the Mobile Robot Khepera II UsingApproaches of Artificial Intelligence // Acta Electrotechnica et Informatica, 2011, V. 11.doi:10.2478/v10198-011-0006-y
31. Программный пакет для сбора данных для обучения сети в симуляторе Gazebo https://github.com/urock/rosbot
32. Программный пакет для обучения нейросетевой модели https://github.com/FastSense/robot_model_training
33. Kennedy J., Eberhart R. Particle swarm optimization // Proceedings of ICNN’95-international conference on neural networks, IEEE, 1995, V.4, p. 1942-1948.
34. Diveev A., Shmalko E. Evolutionary Computation for Synthesis of Control System forGroup of Robots and Optimum Choice of Trajectories for their Movement // In: Yu. G.Evtushenko, M. Yu. Khachay, O. V. Khamisov, Yu. A. Kochetov, V.U. Malkova, M.A.Posypkin (eds.): Proceedings of the OPTIMA-2017 Conference, Petrovac, Montenegro, 02 Oct 2017, pp. 158-165.
35. Дивеев А.И., Константинов С.В. Исследование практической сходимости эволюционных алгоритмов оптимального программного управления колесным роботом //Известия РАН. Теория и системы управления, 2018, No 4, том 57, С. 80-106.

Просмотры	1698
Скачивания	1082

Робототехника, автоматизация и системы управления

Идентификация нейросетевой модели робота для решения задачи оптимального управления

DOI:

Ключевые слова:

Аннотация

Литература

Опубликован

Статистика

Как цитировать

Выпуск

Раздел

Импакт-фактор

Разделы

Мы в сети

Обратная связь