Весь выпуск
Статьи
-
Данный тематический выпуск – Том 24 № 6 2025 г. посвящен памяти выдающегося ученого в области информатики, информационных технологий и теории управления, основателя и руководителя научных школ по теоретическим основам информатизации общества и по теории чувствительности сложных информационно-управляющих систем, руководителя научного направления Санкт-Петербургского института информатики и автоматизации Российской академии наук (СПИИРАН) – СПБ ФИЦ РАН, директора СПИИРАН (1991-2018 гг.), доктора технических наук, члена-корреспондента РАН, заслуженного деятеля науки и техники Российской Федерации Юсупова Рафаэля Мидхатовича.
Математическое моделирование и прикладная математика
-
В работе изложен метод обратной статистической линеаризации – метод нелинейной фильтрации для оценивания состояний линейно-гауссовских дифференциальных систем с неизвестной интенсивностью шума в наблюдениях. Предложенный метод основан на нелинейном преобразовании разностной ошибки с сохранением коэффициента передачи, используемого в фильтре Калмана-Бьюси. В результате нелинейный фильтр описывается системой дифференциальных уравнений того же порядка, что и вектор состояния без использования уравнений на ковариационную матрицу ошибки. Уравнения нелинейного фильтра найдены в аналитическом виде для модели одномерного движения, в которой только на старшую производную действует возмущение в виде белого шума, а наблюдению доступно лишь положение с белошумной аддитивной помехой неизвестной интенсивности. Проведен анализ соответствующей разностной схемы нелинейной фильтрации: обоснована несмещенность оценок и получено уравнение на ковариационную матрицу ее ошибок в стационарном режиме. Теоретические результаты подтверждены численным экспериментом, в котором сравнивалась точность оценок оптимального и нелинейного фильтров.
-
В настоящей работе предложен метод коррекции траектории камеры в задаче монокулярной визуальной одометрии на основе фильтра Калмана. Рассмотрен подход, в котором неоднозначность масштаба разрешается не через восстановление трёхмерной структуры сцены, а через последовательное использование относительных смещений между текущим и несколькими предыдущими положениями камеры. Такой подход снижает зависимость от долговременного отслеживания одних и тех же ключевых точек и делает метод применимым в условиях ограниченного параллакса, повторяющихся текстур и частичных окклюзий. Подобное представление повышает чувствительность метода к шумам. Для компенсации этого недостатка применяется фильтр Калмана, который предотвращает накопление ошибок при последовательных оценках и обеспечивает корректность работы даже при отсутствии сведений о движении камеры, а также позволяет учитывать качество измерений и их достоверность. В рамках работы представлены модель состояния и модель наблюдений, позволяющие уточнять положение камеры, используя только данные последовательных наблюдений. Состояние формируется в виде скользящего окна из текущего и нескольких предыдущих положений камеры, а наблюдения строятся из направлений относительных смещений, оцениваемых по паре или набору кадров, без восстановления трёхмерной структуры сцены. В отличие от распространённых фильтров Калмана с ограничениями на множественные состояния системы (MSCKF), которые обычно интегрируют данные от инерциальных датчиков, предложенный метод использует исключительно информацию, извлекаемую из последовательности кадров. Эффективность метода подтверждена на синтетических данных в различных сценариях движения.
Искусственный интеллект, инженерия данных и знаний
-
В работе рассматривается проблема автоматизации горно-экологического мониторинга объектов минерально-сырьевого комплекса с использованием данных дистанционного зондирования Земли. Обработка и анализ этих данных выполняется с целью оценки влияния процессов добычи на состояние природной среды в местах размещения горнодобывающих предприятий и прилегающих территорий. Представлен макет информационной системы, включающий модули управления данными, обработки и анализа спутниковых снимков. Для автоматизации выделения интересующих объектов горнопромышленного комплекса применяются сверточные и трансформерные модели нейронных сетей. Модели сегментации дражных отвалов, карьеров, хвостохранилищ и угольного пылевого загрязнения были обучены на подготовленных выборках, включающих размеченные спутниковые снимки исследуемых объектов в семи субъектах Российской Федерации. Предложены методы оценки влияния угольного пылевого загрязнения на растительность на основе вегетационных индексов; картирования типов леса с использованием полносвязной нейронной сети; расчета объемов дражных отвалов на основе цифровых моделей рельефа, центральной линии полигона и алгоритма построения диаграммы Вороного; и содержания тяжелых металлов в почве на основе анализа проб, отобранных за многолетний период, методами математической статистики. Сделан корреляционных анализ данных о содержании элементов в образцах почвогрунтов и воде в зоне воздействия добычи полиметаллических руд. Проведена апробация предлагаемых методов на территориях горнодобывающих предприятий Хабаровского края. Совместный анализ накопленных результатов многолетних наблюдений и актуальных данных о современном состоянии объектов природной среды позволяет прогнозировать развитие исследуемых природно-технических систем на среднесрочную перспективу.
-
Актуальность исследования определяется важностью и сложностью выполнения оперативных обобщений постоянно возрастающего массива пользовательских сообщений в социальных сетях. Предлагается уменьшить сложность решаемой задачи за счет использования роботизированных алгоритмов и их автоматизированной интеллектуальной фокусировки на целевые платформы, доступность данных и их объемы. Рассматривается способность больших языковых моделей (LLMs) генерировать высококачественные, связные и контекстно-зависимые аннотации (рефераты), подходящие для динамической природы неструктурированных, «зашумленных» данных социальных сетей. Представлены особенности технологии RAG LLM при реферировании публикаций социальных сетей. Основным недостатком языковых моделей является нестабильность и сложность прослеживания результатов для подтверждения фактической точности. Авторами предложен гибридный метод для обобщения сообщений в социальных сетях за определенный период времени. Метод заключается в комплексном и вариативном сочетании классических способов извлечений данных из их хранилищ, а также реферативных и генеративных возможностей больших языковых моделей. Большие языковые модели использованы для векторизации анализируемых данных. Применение алгоритмов кластеризации к полученным векторным представлениям позволило повысить стабильность и качество результатов. В рамках технологии RAG возможности больших языковых моделей расширены средствами интеллектуального поиска в используемой для хранения исходных данных базе MongoDB. В работе представлены три конвейера, каждый из которых является вариантом реализации метода и обладает преимуществами и недостатками в различных условиях применения. Приведены используемые для оценки конвейеров метрики и произведен сравнительный анализ. В целом, метод позволяет уменьшить конфабуляции большой языковой модели и получать обобщения публикаций за разные временные периоды в режиме реального времени. Предложенный метод применяется на практике в разработанной авторами системе мониторинга открытых данных социальных медиа.
-
Интеллектуальная нейросетевая обработка различных сигналов с непрерывным обучением представляет большой как научный, так и практический интерес. Для такой обработки наряду с другими решениями применяют потоковые импульсные рекуррентные нейронные сети (РНС) с расширенными функциональными возможностями. Однако для этих РНС во многом не исследованы вопросы обеспечения их устойчивого функционирования. Преследуется цель повышения устойчивости потоковых импульсных РНС за счет разработки новых методов интеллектуальной обработки сигналов с непрерывным обучением. В интересах этого уточняются возможности этих РНС и анализируются подходы к обеспечению их устойчивости при обучении и генерации сигналов. Осуществлена формализация потоковой РНС в виде относительно конечного операционного автомата. Предложен новый метод устойчивой интеллектуальной обработки сигналов усовершенствованной РНС с непрерывным обучением. Рассмотрены схемы решения различных интеллектуальных задач анализа и синтеза предлагаемым методом. Приведены результаты моделирования, подтверждающие работоспособность предложенного метода и возможности повышения устойчивости РНС при непрерывном обучении и генерировании сигналов. Показана достижимость устойчивого баланса между запоминаемой и постепенно забываемой информацией в РНС с оперативной адаптацией к изменяющимся внешним условиям.
-
В течение последнего десятилетия наблюдается рост количества публикаций научно-технической и медицинской направленности, посвящённых автоматическому определению на основании речевого и визуального материала таких когнитивных нарушений людей, которые возникают при таких нейродегенеративных заболеваниях, как деменция, болезнь Альцгеймера, болезнь Паркинсона и другие нарушения. Хотя данные заболевания имеют высокую степень распространения и являются одной из основных причин смертности и ранней инвалидизации людей, способов их эффективного лечения на данном этапе развития медицины отсутствуют или ограничены. В связи с этим ранняя диагностика симптомов и их облегчение вызывают значительный интерес исследователей. В фокусе современных исследований находится задача разработки автоматизированных и автоматических систем, основанных на количественных объективных методах, нейросетевых подходах, использующих различные модальности и их объединение, а также на методах интерпретируемого искусственного интеллекта. В статье представлен обзор и анализ основных исследований c 2022 года, посвящённых автоматическому одно- и многомодальному определению когнитивных нарушений людей. Представлены наиболее часто применяющиеся многомодальные корпусы, применяемые в данной задаче, такие как ADReSS, ADReSSo, TAUKADIAL и др. Описаны современные методы, используемые для выявления когнитивных нарушений на основе данных различных модальностей, представленные на международном соревновании TAUKADIAL-2024, и вне соревнований. По результатам соревнований, лучшими методами распознавания когнитивных нарушений являются ансамбли вероятностных моделей, обученные на интерпретируемых экспертных признаках и нейросетевых признаках текстов и аудио. Рассмотрены многомодальные подходы, использующие визуальную модальность для обучения глубоких нейросетевых моделей. Рассмотрено новое направление, изучающее применимость больших языковых моделей к анализу медицинских текстов и интерпретируемому предсказанию заболевания. Проведена систематизация методов извлечения информативных признаков и применяемых классификаторов. По результатам проведенного обзора сформулированы требования к системам автоматизированного определения когнитивных нарушений.
-
В статье представлена методология разработки эталонного теста для оценки навыков числового мышления в больших языковых моделях (Large Language Models, LLM). Под числовым мышлением в контексте LLM понимается способность модели корректно интерпретировать, обрабатывать и использовать числовую информацию в тексте – включая понимание значений чисел, их соотношений, выполнение арифметических операций, а также корректную генерацию числительных в ответах. Предложенная методология основана на декомпозиции прикладных задач и позволяет оценивать отдельные аспекты числового мышления на примере задач с числительными. Особое внимание уделяется способу представления чисел в текстовых инструкциях к LLM, поскольку это напрямую влияет на качество итогового ответа. Необходимость точной оценки числового мышления LLM обусловлена тем, что эта способность критически важна для широкого спектра прикладных задач работы с текстами, в том числе для автоматизированного составления кратких изложений, генерации аналитических отчётов, извлечения и интерпретации количественных данных, а также для диалоговых систем, работающих с финансовой, научной или технической информацией. На основе анализа современных подходов к оценке LLM сформулированы основные принципы построения эталонных тестов с упором на универсальность и применимость в реальных сценариях. В соответствии с предложенной методологией разработан эталонный тест MUE (Math Understanding Evaluation), включающий пять наборов тестовых заданий, каждый из которых предназначен для оценки отдельного аспекта числового мышления LLM. Проведена сравнительная оценка качества популярных LLM, определены лидеры, а также выявлены сильные и слабые стороны их числового мышления. Полученные результаты могут использоваться разработчиками LLM для улучшения архитектур и стратегий обучения, а также конечными пользователями и интеграторами для выбора оптимальной модели в прикладных проектах.
Информационная безопасность
-
Системы на основе машинного обучения в настоящее время являются привлекательными мишенями для злоумышленников, поскольку нарушение работы таких систем может иметь серьезные последствия для объектов критической инфраструктуры, в частности, энергетических систем. В связи с этим количество различных типов кибератак на системы машинного обучения, которые называются состязательными атаками, постоянно растёт, и эти атаки являются предметом изучения многих исследователей. Соответственно, ежегодно появляется множество публикаций, посвящённых обзорам состязательных атак и методов защиты от них. Многие виды состязательных атак и методы защиты в этих обзорных статьях пересекаются. Однако в более поздних исследованиях содержится информация о новых типах атак и методах защиты. Цель данной статьи – проанализировать исследования, проведённые за последние шесть лет и опубликованные в высокорейтинговых журналах, с акцентом на обзорные работы. Результатом исследования является уточнённая классификация состязательных атак, характеристика наиболее распространённых атак, а также уточнённая классификация и характеристика методов защиты от этих атак. Основное внимание в анализе уделяется состязательным атакам, нацеленным на энергетические системы. В заключительной части статьи рассматриваются преимущества и недостатки различных методов противодействия состязательным атакам.
-
В области постквантовой двухключевой криптографии значительный интерес представляет разработка практичных алгебраических схем электронной цифровой подписи (ЭЦП) с секретной группой, стойкость которых базируется на вычислительной сложности решения систем степенных уравнений с многими неизвестными. В качестве алгебраического носителя в таких криптосхемах используются ассоциативные некоммутативные конечные алгебры (АНКА). Специфическим моментом, связанным с обеспечением стойкости к атакам на основе известных подписей при разработке схем ЭЦП данного типа, является наличие проблемы совершенствования механизма рандомизации подгоночного элемента цифровой подписи, представляющего собой вектор S, многократно входящий в уравнение верификации в качестве множителя. Известное решение этой проблемы на основе вычисления S в зависимости от двух векторов, выбираемых случайным образом из двух коммутативных секретных групп, таких, что элементы одной из них некоммутативны с элементами другой, при использовании в проверочном уравнении значения хеш-функции от S приводит к увеличению размера ЭЦП, обусловленного необходимостью задания двух вспомогательных подгоночных элементов подписи. В статье предлагается новый механизм рандомизации подписи, отличающийся вычислением значения S в зависимости от двух векторов, выбираемых случайным образом из одной коммутативной секретной группы. Предложенный механизм обеспечивает приемлемый уровень стойкости к атакам на основе известных подписей и может быть положен в основу разработки схем ЭЦП с одним уравнением верификации и одним вспомогательным подгоночным элементом подписи. Разработан новый алгебраический алгоритм ЭЦП, представляющий интерес как прототип практичного постквантового стандарта ЭЦП. Даны оценки его параметров при реализации на четырехмерных АНКА и на алгебре матриц 3×3, заданных над простым конечным полем.
Робототехника, автоматизация и системы управления
-
В работе рассматривается задача построения безопасных маршрутов группы беспилотных летательных аппаратов в ограниченном воздушном пространстве над сельскохозяйственным участком. Актуальность исследования обусловлена растущим применением групп БпЛА в агропромышленном комплексе для мониторинга, картографирования и обработки полей, что требует обеспечения безопасности полётов в условиях высокой плотности воздушного движения, ограниченной связи, а также воздействия внешних факторов. Особую сложность представляет необходимость автономного выполнения миссий при наличии навигационных погрешностей и природных воздействий. Предлагается метод планирования маршрутов, основанный на представлении траектории каждого аппарата в виде капсульного воздушного коридора – трёхмерного объёма фиксированного радиуса, сформированного вдоль отрезков траектории. Пространственное резервирование обеспечивает безопасное разнесение траекторий на этапе планирования, исключая конфликты при последующем автономном выполнении полётов без необходимости непрерывной координации между агентами. Радиус капсулы включает запас на возможные отклонения от запланированной траектории, что обеспечивает устойчивость к навигационным ошибкам. В основе метода лежит последовательное формирование маршрутов для каждого аппарата по четырёхфазной схеме, включающей вертикальный подъём от точки старта до рабочей высоты, горизонтальный переход к входу в зону обработки, возврат от выхода из зоны к точке начала снижения и вертикальный спуск к исходной позиции. Каждый новый маршрут строится с учётом уже зарезервированных воздушных коридоров через аналитическую проверку геометрических пересечений между капсулами различных траекторий и выпуклыми многогранниками зон обработки. Для повышения вычислительной эффективности применяется иерархическая пространственная фильтрация на основе ограничивающих параллелепипедов, позволяющая на предварительном этапе быстро отсекать заведомо непересекающиеся объекты и выполнять точную геометрическую проверку только для потенциально конфликтующих сегментов маршрутов. Численные эксперименты проводились для групп от 2 до 32 аппаратов на типовом сельскохозяйственном участке площадью один квадратный километр. Установлено нелинейное возрастание времени планирования и количества итераций с увеличением числа агентов, что обусловлено необходимостью построения каждого последующего маршрута в уже частично занятом пространстве с возрастающим числом пространственных ограничений. Длина маршрутов демонстрирует тенденцию к росту, особенно выраженную на начальных этапах масштабирования, что связано с необходимостью обхода уже зарезервированных воздушных коридоров.
-
Цифровизация здравоохранения предполагает широкое внедрение технологий информатизации и автоматизации процессов мониторинга состояния человека, ориентированных на сохранение, укрепление и восстановление его здоровья. Для адаптации существующих решений в области электронного здравоохранения к медицинской инфраструктуре выполнено моделирование расширяемых программных компонентов автоматизированного киберфизического мониторинга состояния пациентов в умных палатах. Представлена математическая модель процессов киберфизического мониторинга состояния пациента, описывающая медицинский алгоритм как эстафету с альтернативными маршрутами с помощью аппарата параллельных полумарковских процессов. Охарактеризованы особенности программных компонентов киберфизического мониторинга состояния пациента как гибкого, расширяемого интегрируемого элемента умной медицинской палаты, позволяющего персонифицировать и оптимизировать лечебно-диагностические процедуры с помощью целевой функции, характеризующей отклонение показателей текущего состояния пациента от показателей его целевого состояния. Продемонстрированы потенциальные возможности автоматизации медицинских процессов при реализации методик диагностики и рискометрии здоровья, основанных на использовании балльных шкал. Результаты моделирования показали, что использование программных компонентов автоматизированного киберфизического мониторинга состояния пациентов в умных палатах позволяет не только ускорить расчёты, но и сократить время получения данных благодаря их автоматической загрузке из информационных систем и автоматизированному снятию показателей с медицинских устройств, открывая новые возможности персонифицированного управления оказанием стационарной медицинской помощи.