Весь выпуск
Статьи
-
В январе 2026 г. доктор технических наук, профессор Соколов Борис Владимирович отмечает 75-летний юбилей. Профессор Соколов Б.В. является широко известным в нашей стране и за ее пределами ученым, Заслуженным деятелем науки Российской Федерации, дважды Лауреатом премии Правительства РФ в области науки и техники, Лауреатом премии Правительства Санкт-Петербурга, Лауреатом Стипендии Президента РФ «За выдающиеся заслуги в области вооружения, военной и специальной техники», руководителем – главным научным сотрудником лаборатории информационных технологий в системном анализе и моделировании Санкт-Петербургского Федерального исследовательского центра Российской академии наук.
Робототехника, автоматизация и системы управления
-
Развитие интеллектуальных транспортных систем и внедрение архитектуры Vehicle-to-Everything (V2X) предъявляют высокие требования к характеристикам сетевого взаимодействия, таким как минимальная задержка, высокая надёжность и энергоэффективность. При этом снижение одного из параметров влечет за собой увеличение другого, что делает задачу их сбалансированной настройки актуальной и практически значимой. Особенно важно учитывать не только общую задержку (задержка сети связи и вычислительная задержка) и энергопотребление, но и ожидаемое время прибытия мобильного вычислительного узла на базе транспортного средства – интегрального показателя качества обслуживания в динамически меняющейся среде. В настоящей работе предлагается математическая модель многопараметрической оптимизации параметров функционирования V2X-системы, учитывающая три взаимосвязанных показателя: общую задержку, энергопотребление и ожидаемое время прибытия. Модель формализует структуру транспортной системы в виде ориентированного графа, с заданными маршрутами движения, размещением стационарных и мобильных вычислительных узлов транспортной инфраструктуры, а также параметрами обмена видеоданными между ними и терминальными устройствами. Модель представлена в виде задачи оптимизации и позволяет настраивать систему в соответствии с внешними условиями и прикладными целями. В качестве исследовательского инструмента использованы методы имитационного моделирования с реалистичными сценариями движения транспортных средств и переменной нагрузкой сети связи. Результаты проведённых численных экспериментов позволяют показать, что использование предложенной модели позволит достичь более сбалансированных режимов работы системы, снижая общие задержки и энергозатраты без ухудшения параметров времени прибытия. По сравнению с традиционными подходами, основанными на однокритериальной или двухкритериальной оптимизации, предложенный метод обеспечивает большую адаптивность и устойчивость V2X-систем к изменяющимся условиям функционирования. Сформулированные выводы могут быть полезны исследователям при проектировании и внедрении энергоэффективных и надёжных распределённых архитектур в современных транспортных системах.
-
Лесные пожары являются одной из наиболее опасных и трудно прогнозируемых природных угроз, что требует постоянного мониторинга линии распространения огня в реальном времени. Традиционные средства, такие как спутниковая съемка или наземные наблюдательные посты, не обеспечивают необходимой оперативности и полноты данных. Перспективным решением становится использование роя беспилотных летательных аппаратов (БПЛА), однако их эффективная координация в условиях динамичной обстановки и ограниченных ресурсов связи и вычислений требует разработки специальных алгоритмов. В работе представлена многоуровневая стратегия управления роем БПЛА, объединяющая три механизма. Горизонтальная навигация реализуется методом искусственных потенциальных полей (Artificial Potential Field, APF), обеспечивающим притяжение к линии фронта пожара и отталкивание от препятствий и соседних аппаратов. Распределённый протокол согласования стабилизирует полет на общей опорной высоте, что гарантирует сопоставимые углы обзора. Для оптимального распределения вдоль линии фронта используется модифицированный алгоритм роя частиц (Particle Swarm Optimization, PSO), позволяющий снизить конкуренцию между дронами и уменьшить лишние манёвры. Проведена серия вычислительных экспериментов, в которых сопоставлены классический APF и гибрид APF+PSO для решения задачи оптимизации функционала эффективности движения роя БПЛА. Гибридная схема APF+PSO снижает значение функционала эффективности почти на порядок по сравнению с классическим методом APF; уменьшает вариативность поведения роя; поддерживает согласованную высоту без выраженного перерегулирования и обеспечивает корректный обход препятствий при движущемся фронте. Минимальные междроновые дистанции не опускались ниже порогового значения 5 м, что подтверждает соблюдение требований безопасности. Алгоритм демонстрирует устойчивое слежение за движущимся фронтом на протяжении всего горизонта моделирования, обеспечивая корректный обход препятствий. Разработанная стратегия сочетает вычислительную простоту с высокой надежностью. Дальнейшие исследования будут направлены на учет данных бортовых сенсоров (видео и тепловизоров), моделирование влияния ветра и рельефа, анализ задержек и потерь связи, а также расширение алгоритма на крупные группы БПЛА.
Информационная безопасность
-
Реализация концепции умного города (smart city) подразумевает переход от традиционных компьютерных сетей, имеющих четкий информационный периметр, к распределенным сетям нового поколения. Для распределенных подсистем умного города свойственны реконфигурируемая сетевая топологии, открытость, мобильность узлов и построение защиты информации на базе распределенных реестров данных, что открывает новые возможности для злоумышленников. Ситуация осложняется тем, что скорость создания новых цифровых инфраструктур превосходит скорость разработки средств защиты, отвечающих актуальным вызовам. Учитывая специфические свойства объекта защиты, динамику развития угроз безопасности и ограниченный выбор защитных механизмов, для поддержания высокого уровня защищенности систем умного города необходимо проводить непрерывную оценку эффективности защиты и ее перенастройку. В результате анализа существующих решений по оценке эффективности систем обеспечения информационной безопасности установлено, что они работают в проактивном режиме и не учитывают высокую динамику системы «угрозы-защиты» в системах умного города. В статье представлена построенная модель оценки эффективности обеспечения информационной безопасности, базирующая на нелинейной динамической модели конкуренции за влияние на функционирование информационной инфраструктуры. Для поддержания устойчивого состояния системы умного города необходимо выполнение критерия о соотношении скоростей обнаружения и развития компьютерной атаки в инфраструктуре. На разработанном экспериментальном макете эмулированы сценарии развития компьютерных атак «эксплуатация уязвимости ПО», «распределенный отказ в обслуживании», «черная дыра» и «атака большинства» на примере интеллектуальной транспортной сети VANET в инфраструктуре умного города при использовании различных конфигураций системы защиты. В ходе сравнительного эксперимента разных конфигураций системы защиты сети VANET показано, что пример комплекса, реализующего обнаружение атак с помощью сверточной нейросети, динамическую маршрутизацию на базе муравьиного алгоритма и протокол Hashgraph с внедренной моделью доверия, удовлетворяет критерию устойчивости. Применение предложенной модели оценки позволяет обоснованно контролировать и динамически регулировать конфигурацию системы защиты.
-
Обнаружение дипфейков по-прежнему представляет собой серьезную проблему, главным образом из-за ключевых ограничений существующих методов, включая зависимость от анализа отдельных кадров, уязвимость к видео низкого разрешения или сжатым видео, а также неспособность улавливать временные несоответствия. Кроме того, традиционные методы обнаружения лиц часто дают сбой в сложных условиях, таких как плохое освещение или окклюзия, а многие модели не справляются с тонкими манипуляциями из-за неадекватного извлечения признаков и переобучения на ограниченных наборах данных. Для устранения недостатков существующих подходов к обнаружению дипфейков в данном исследовании предлагается система обнаружения лиц и движений, которая объединяет как пространственную, так и временную информацию. Работа системы начинается с этапа предварительной обработки, на котором видеокадры извлекаются с фиксированной частотой для обеспечения временной согласованности. Области лица и детальные ориентиры точно определяются с помощью BlazeFace и MediaPipe Face Mesh. Затем эти признаки обрабатываются с помощью предлагаемой сети XceptionCapsule Net, которая сочетает в себе возможности извлечения пространственных признаков модели Xception с иерархическим и учитывающим ракурс представлением капсульных сетей (CapsNet), а также возможностью моделирования временных зависимостей двунаправленного слоя долгой краткосрочной памяти (BiLSTM). Архитектура включает в себя глобальный усредняющий пулинг, сглаживание и полносвязные слои с сигмоидной функцией активации для бинарной классификации. Обширные оценки на наборах данных FaceForensics++ (FF++) и Celeb-DF демонстрируют высокую производительность, достигая точности до 99,31% и площади под кривой (AUC) 99,99%. Результаты подтверждают эффективность, точность и обобщающую способность системы для видео различного качества и сценариев манипуляций.
Искусственный интеллект, инженерия данных и знаний
-
Для работы в реальных условиях от систем автоматического распознавания речи требуется обеспечивать стабильную точность распознавания при обработке входного аудиопотока произвольной длины в условиях ограниченных вычислительных ресурсов. Объединенная модель из коннекционисткой темпоральной классификации (connectionist temporal classification, CTC) и кодировщик-декодировщика с механизмом внимания (attention-based encoder-decoder, AED) обеспечивают высокое качество распознавания, но исходная версия модели не удовлетворяет данным требованиям. В данной статье предлагается алгоритм блочного декодирования с синхронизацией по входу для совместной модели CTC-AED. Алгоритм обрабатывает перекрывающиеся блоки аудио синхронно относительно входной последовательности признаков, используя CTC-выравнивание для определения соответствующего контекста на перекрывающемся участке для AED декодировщика. Фиксированная длина блока обеспечивает предсказуемое и ограниченное потребление ресурсов и позволяет избежать проблем с обобщением на длинных речевых сегментах, в то время как перекрытие блоков снижает ухудшение качества распознавания, вызванное краевыми эффектами на границах блоков. В отличие от других алгоритмов декодирования для CTC-AED, предложенный алгоритм не требует ни модификации архитектуры модели, ни специальной процедуры обучения, и, в то же время, поддерживает перекрытие блоков. В работе также исследуется производительность предложенного алгоритма с точки зрения доли словесных ошибок (word error rate, WER) в зависимости от размера блока и размера перекрытия.
-
В статье проводится анализ изменения точности распознавания личности по голосу при выделении разного количества бит на число с плавающей запятой (квантование) выходного тензора нейронной сети. Тензор характеризирует скрытое пространство нейронной сети, которое содержит скрытые признаки, используемые при решении задачи распознавания дикторов. Обычно, на каждое число выходного пространства выделяется тридцать два бита (выходной тензор, исследуемых методов содержит 512 чисел), поэтому для поддержки постоянно актуализируемой базы данных требуется большое количество памяти. Из-за этого, особый интерес представляет тип чисел с плавающей запятой – minifloat, позволяющий работать с численным представлениями, на которые выделяются восемь, шесть или четыре бита. Для обеспечения полноты результатов исследования, выбраны три нейросетевых решения, показывающие лучшие результаты распознавания на тестовой выборке: CAM++, WavLM, ReDimNet. Модели обладают уникальными архитектурными особенностями, что позволяет оценить изменение точности распознавания дикторов при уменьшении битности в зависимости от используемого типа архитектуры нейронной сети. Точность распознавания оценивается с помощью точки пересечения ошибок первого и второго рода. При проведении оценки точности распознавания используется англоязычный набор данных VoxCeleb-1, по характеристикам содержащихся аудиозаписей соответствует небольшой базе данных биометрической системы. Актуальность представленного материала обусловлена возрастающим количеством научных работ, которые предлагают использовать голос в качестве верификационного ключа. Поэтому, при работе с большим набором биометрических данных необходимо выделять большие объёмы памяти как на жёстких дисках, так и ОЗУ. Современные базы данных постоянно актуализируются и расширяются, что приводит к увеличению необходимых ресурсов на её поддержку. Одним из возможных методов решения может являться применение операции квантования к выходному тензору нейронной сети. Однако, преждевременное уменьшение количества выделяемых бит на число в выходном тензоре может привести к значительному ухудшению качества распознавания, относительно базовой версии сети. Основным направлением исследования является минимизация ресурсов для поддержки биометрической системы без дополнительного обучения нейронной сети.
-
Растущий дефицит радиочастотного спектра, вызванный взрывным ростом числа беспроводных устройств и объемов передаваемых данных, делает технологии когнитивного радио (CR) критически важными для будущего телекоммуникаций. Данное исследование направлено на решение задачи динамического управления спектром путем разработки имитационной модели когнитивной радиосистемы связи, построенной на архитектуре сети LTE. В отличие от существующих решений, предлагаемая модель обладает модульной структурой, что позволяет гибко интегрировать и оценивать различные алгоритмы прогнозирования занятости частотных ресурсов. Модель реализована в среде MatLab и включает три ключевых модуля: модуль формирования и обработки сигналов LTE, генерирующий карты радиосреды (REM); модуль обучения прогнозирующей нейросетевой модели; и модуль прогнозирования занятости частотных ресурсов. Основное внимание уделено использованию передовой архитектуры нейронной сети Колмогорова-Арнольда (KAN) для прогнозирования незанятых блоков планирования (SB) в кадре LTE. В результате имитационного моделирования, охватившего 10 000 кадров, была продемонстрирована высокая эффективность предложенного подхода. Модель KAN обеспечила точность прогнозирования свободных частотных ресурсов на уровне 92,23% для кадра длительностью 10 мс. Проведенное сравнительное тестирование показало, что архитектура KAN превосходит традиционную сеть LSTM по точности примерно на 10% при одинаковом количестве обучаемых параметров, а также быстрее достигает сходимости в процессе обучения. Практическая значимость работы заключается в предоставлении инструмента для точной оценки занятости спектра и планирования доступа вторичных пользователей, что ведет к значительному повышению спектральной эффективности и надежности перспективных беспроводных сетей.
-
Современные исследования алгоритмов принятия решений в системах multi-access edge computing (MEC) для задач распределения ресурсов зачастую основываются на упрощенных абстракциях сетевой топологии, что ограничивает применимость полученных результатов в реальных условиях эксплуатации мобильных сетей. Целью данной работы является разработка реалистичной модели сети сотовой связи с использованием методов стохастической геометрии и комплексная оценка эффективности современных алгоритмов обучения с подкреплением в задачах минимизации сетевых задержек в граничных вычислениях. Метод. Для создания математически обоснованной модели сетевой среды использовались методы стохастической геометрии в сочетании с реальными статистическими данными распределения пользователей сотовых сетей. Применение стохастической геометрии обеспечило корректное моделирование пространственного размещения базовых станций и расчет межузловых расстояний, критически важных для определения сетевых задержек. Экспериментальная оценка проводилась на базе доработанной платформы LWMECPS с расширенным Gymnasium API, поддерживающим алгоритмы PPO, TD3 и SAC. Основные результаты. Разработана модель сети связи, учитывающая реалистичное пространственное распределение сетевых элементов и временную динамику пользовательской нагрузки. На основе данной модели создано виртуализированное тестовое окружение в LWMECPS, позволяющее проводить воспроизводимые эксперименты с контролируемыми параметрами. Результаты экспериментов показали различия в характеристиках производительности различных алгоритмов: PPO обеспечил стабильное сокращение задержки до 20% со стабильной конвергенцией; SAC продемонстрировал наибольшее абсолютное улучшение (сокращение задержки на 38%), но проявил нестабильность при инициализации; TD3 показал умеренную эффективность (улучшение до 11%), но высокую чувствительность к настройке гиперпараметров. Обсуждение. Проведенный сравнительный анализ алгоритмов машинного обучения с подкреплением выявил ключевые особенности их применения в MEC-системах. Установлено, что дискретный характер задач размещения сервисов делает алгоритм PPO наиболее подходящим для практического внедрения в системы принятия решений благодаря его стабильности сходимости и естественной поддержке дискретных пространств действий. Полученные результаты предоставляют научно обоснованные рекомендации для разработчиков MEC-платформ по выбору оптимальных алгоритмических решений.