Формальный язык описания навигационного поведения мобильных роботов
Ключевые слова:
интерпретирующая навигация, когнитивное представление пространства, когнитивная карта, семантически сегментированное изображение, большая языковая модельАннотация
Статья содержит результаты исследований в области формализации навигационного поведения мобильных роботов на основе когнитивного подхода к представлению пространства. Авторами предложен новый формальный язык LRNB (Language of Robot Navigation Behavior), предназначенный для описания информационно-двигательных действий, сценариев и миссий роботов в рамках интерпретирующей навигации. Ключевой особенностью когнитивного подхода является отказ от декартовой системы координат в пользу ориентированного графа – когнитивной карты, вершины которой соответствуют семантическим ориентирам, а рёбра – последовательностям действий, задаваемых на LRNB. Язык строится на универсальной структуре команды, обеспечивая возможность описания широкого спектра поведенческих паттернов: от простого движения вдоль объекта до сложных миссий с динамическими целями и логическими условиями. В работе представлены три метода построения когнитивных карт: на основе семантически сегментированных изображений, в процессе автономного исследования среды роботом, а также с использованием больших языковых моделей (БЯМ) для трансляции естественно-языковых инструкций в формальные команды LRNB. В качестве наиболее удобной иллюстрации для демонстрации возможностей LRNB проведена экспериментальная оценка возможностей БЯМ в автоматической генерации команд LRNB по текстовым описаниям. Показано, что на уровне отдельных информационно-двигательных действий модель демонстрирует высокую точность (95 % корректных преобразований), однако при переходе к формированию сложных составных сценариев эффективность критически снижается. Тем не менее, сделан вывод о практической применимости языка LRNB. Предложенный формальный язык LRNB демонстрирует высокую гибкость и выразительность, что делает его эффективным инструментом для описания сложного навигационного поведения мобильных роботов в разнообразных сценариях.
Литература
2. Спасский Б.А. К вопросу об автономной навигации сельскохозяйственных роботов // Робототехника и техническая кибернетика. 2025. Т. 13. №2. С. 85–90.
3. Zhu Z., et al. Visual-Inertial RGB-D SLAM With Encoders for a Differential Wheeled Robot // IEEE Sensors Journal. 2022. vol. 22. no. 6. pp. 5360–5371. DOI: 10.1109/JSEN.2021.3101370.
4. Slowak P., Kaniewski P. Stratified Particle Filter Monocular SLAM // Remote Sensing. 2021. vol. 13. no. 16. 3233 p. DOI: 10.3390/rs13163233.
5. Teixeira B., et al. Deep Learning for Underwater Visual Odometry Estimation // IEEE Access. 2020. vol. 8. pp. 44687–44701. DOI: 10.1109/ACCESS.2020.2978406.
6. Bala J.A., Adeshina S.A., Aibinu A.M. Advances in Visual Simultaneous Localisation and Mapping Techniques for Autonomous Vehicles: A Review // Sensors. 2022. vol. 22. no. 22. 8943 p. DOI: 10.3390/s22228943.
7. Li C., et al. Bridging the Gap Between Visual Servoing and Visual SLAM: A Novel Integrated Interactive Framework // IEEE Transactions on Automation Science and Engineering. 2022. vol. 19. no. 3. pp. 2245–2255. DOI: 10.1109/TASE.2021.3067792.
8. Yang S., et al. Visual SLAM Based on Semantic Segmentation and Geometric Constraints for Dynamic Indoor Environments // IEEE Access. 2022. vol. 10. pp. 69636–69649. DOI: 10.1109/ACCESS.2022.3185766.
9. Chen K., et al. Semantic Visual Simultaneous Localization and Mapping: A Survey // IEEE Transactions on Intelligent Transportation Systems. 2025. vol. 26. no. 6. pp. 7426–7449. DOI: 10.1109/TITS.2025.3556928.
10. Zhang T., et al. Endotaxis: A neuromorphic algorithm for mapping, goal-learning, navigation, and patrolling // eLife. 2024. vol. 12. DOI: 10.7554/eLife.84141.3.
11. Lobov S.A., et al. Spatial Memory in a Spiking Neural Network with Robot Embodiment // Sensors. 2021. vol. 21. no. 8. 2678 p. DOI: 10.3390/s21082678.
12. Babichev A., et al. Topological Schemas of Cognitive Maps and Spatial Learning // Frontiers in Computational Neuroscience. 2016. vol. 10. DOI: 10.3389/fncom.2016.00018.
13. Gupta S., et al. Cognitive Mapping and Planning for Visual Navigation // Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2017. pp. 2616–2625.
14. Zeng F., et al. Large Language Models for Robotics: A Survey // arXiv preprint arXiv:2311.07226. 2023.
15. Driess D., et al. PaLM-E: An Embodied Multimodal Language Model // arXiv preprint arXiv:2303.03378. 2023.
16. Wang F., et al. Object-Based Reliable Visual Navigation for Mobile Robot // Sensors. 2022. vol. 22. no. 6. 2387 p. DOI: 10.3390/s22062387.
17. Смирнова Е.Ю., Спасский Б.А. Организация супервизорного управления в сценариях экстремальной робототехники // Робототехника и техническая кибернетика. 2020. Т. 8. №4. С. 245–258. DOI: 10.31776/RTCJ.8401.
18. Hussain M. YOLO-v1 to YOLO-v8, the Rise of YOLO and Its Complementary Nature toward Digital Manufacturing and Industrial Defect Detection // Machines. 2023. vol. 11. no. 7. 677 p. DOI: 10.3390/machines11070677.
19. Du Y., et al. StrongSORT: Make DeepSORT Great Again // IEEE Transactions on Multimedia. 2023. vol. 25. pp. 8725–8737. DOI: 10.1109/TMM.2023.3240881.
20. Матвеев В.Д., Архипов А.Е., Фомин И.С. Разработка модели семантической сегментации RTC-SAM для определения препятствий на пути мобильного робота // Известия ЮФУ. Технические науки. 2025. №2. С. 212–220. DOI: 10.18522/2311-3103-2025-2-212-220.
21. Add support for SAM3 // GitHub. URL: https://github.com/opengeos/segment-geospatial/pull/430 (дата обращения: 29.12.2025).
Опубликован
Как цитировать
Раздел
Copyright (c) Антон Михайлович Корсаков, Виктория Владимировна Иванова, Сергей Анатольевич Половко

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями: Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале. Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале. Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).