1. Тан И., Герман Ю.О. Улучшенное Q-обучение для навигации по сетке, использующее априорные приоритеты направлений, выбор маршрутов методом отжига и оптимизацию вознаграждений на основе потенциальной достижимости цели // Информатика и автоматизация. 2026. № 4 (25). C. 1235-1259.