Весь выпуск
Искусственный интеллект, инженерия данных и знаний
-
В последние годы широкое применение в области финансов получили большие языковые модели (англ. Large Language Models, LLM). Прямое сравнение таких моделей может быть затруднено, так как наборы данных и сами LLM могут быть закрыты, а параметры при оценке могут отличаться. В работе для задачи заполнения неизвестных метрик предлагается использование метода матричной факторизации из рекомендательных систем, изначально созданного для прогнозирования предпочтений пользователей. Целью работы является оценка применимости матричной факторизации для предсказания метрик качества LLM на финансовых задачах, а также разработка метода ранжирования LLM на основе агрегации метрик качества. Проводится эксперимент по применению матричной факторизации на собранных из научных исследований данных о 34 LLM и 42 финансовых наборах данных. Усредненная MAE метода на всех запусках составляет 0.07 на тестовом наборе данных. Верхние позиции в рейтинге занимают модели DeepSeek R1, OpenAI GPT-4o, OpenAI o1-mini, Fin-R1, Claude 3.5 Sonnet. Двумя способами исследуется влияние ошибки прогнозирования на итоговые предсказания: при помощи MAE и метода Монте Карло. Анализируются полученные результаты, основными выводами которых являются: а) метод матричной факторизации может быть применен для прогнозирования неизвестных значений метрик моделей на наборах данных; б) ведущие большие языковые модели сблизились в оценке настолько, что невозможно выявить явного лидера; в) большие ошибки предсказания позволяют выявить специфические особенности моделей на конкретных задачах. Представленный метод ранжирования способен упростить выбор подходящей модели для финансовых задач.
-
В работе предложен метод решения задачи выбора канала связи в когнитивном радио на основе информации о текущем состоянии всех доступных каналов связи с использованием математического аппарата обучения с подкреплением. Метод заключается в формализации задачи выбора каналов связи в терминах «среда-агент» и обучении агентов с помощью алгоритмов Reinforce, SARSA и A2C. Приведён расчёт затрат памяти на решение задачи выбора каналов связи классическими методами. Оценка по памяти составляет 4×2 2 n байт для случайного состояния каналов (занят/свободен) и 4× n 2 байт – для одного свободного канала на каждом шаге при решении задачи табличным алгоритмом Q-обучения. Приведены две различные формализации вознаграждения для агента в рамках решаемой задачи при использовании обучения с подкреплением – для тривиального случая (бинарная доступность / недоступность частотного канала) и для более сложного случая – с учётом мощности (в дБ) в выбранном канале связи. Ограничение на первую формализацию состоит в том, что на каждой итерации должен быть только один свободный канал связи из всех доступных. Вторая предложенная формализация функции вознаграждения не накладывает подобных ограничений и более универсальна. Проведены вычислительные эксперименты для обеих формализаций функции вознаграждения, агенты обучающиеся с помощью алгоритмов SARSA и A2C, в среднем, достигают безошибочного решения задачи за 8000 эпизодов обучения для обеих формализаций обучения в модельной задаче для различных реализаций агентов. Алгоритм REINFORCE не позволяет достигать безошибочного решения, однако, формализация вознаграждения с учётом мощности повышает стабильность обучения алгоритмом REINFORCE. Даны теоретические оценки вычислительной сложности рассматриваемых методов, согласующиеся с вычислительными экспериментами.
-
Целью работы является разработка архитектуры цифрового двойника экосистемы водного объекта для обеспечения экологической устойчивости, включая мониторинг, прогнозирование и управление водными ресурсами в условиях антропогенного воздействия и климатических изменений. В работе предложена модульная архитектура цифрового двойника, включающая модуль сбора и слияния мультимодальных данных, цифровые модели экосистемы, экспертную систему, модуль регулирования нормативно-правовой базы, геоинформационную систему, модуль графического представления данных. Архитектура основана на интеграции данных с сенсоров, спутников, метеостанций и систем дистанционного зондирования, с применением моделей машинного обучения и больших языковых моделей для анализа нормативной документации. Разработана архитектура цифрового двойника водного объекта, позволяющая в реальном времени отслеживать параметры экосистемы, оценивать соответствие нормативам, формировать отчёты и рекомендации для субъектов природопользования и органов управления. Проведено тестирование эффективности различных моделей обработки правовых текстов, выявлены оптимальные подходы к их семантическому анализу. Обоснована возможность интеграции цифрового двойника в систему государственного регулирования природных ресурсов. Предложенная авторами архитектура цифрового двойника представляет собой комплексный инструмент устойчивого управления водными ресурсами, обеспечивающий прогнозирование состояния водных объектов, своевременное выявление рисков и формирование научно обоснованных управленческих решений, способствуя снижению экологических угроз и сохранению водных ресурсов.
-
Предлагается метод контекстно-зависимой настройки параметров авторегрессионных моделей для восстановления пропусков в нестационарных временных рядах. Ключевая особенность метода заключается в адаптивном выборе параметров модели ARIMA (p, d, q) на основе двух факторов контекста: длительности пропуска и уровня внешних возмущений в соответствующий период. В отличие от стандартных подходов автоматического подбора, ориентированных на глобальную оптимизацию для прогнозирования, разработанный алгоритм сужает пространство поиска моделей и осуществляет выбор оптимальной конфигурации с помощью локальной кросс-валидации, что позволяет учитывать специфические условия в области пропуска. Метод реализован в виде программного модуля на языке Python с модульной архитектурой, обеспечивающей вычислительную эффективность за счет кеширования и параллельных вычислений. Эффективность метода проверена в ходе эксперимента на реальных геомагнитных данных (компонента DBE_NEZ обсерватории Ловозеро). Результаты демонстрируют, что в условиях спокойной и слабовозмущенной геомагнитной обстановки (индекс SME = 50–200 нТл) метод обеспечивает высокую точность восстановления (R² = 0.71–0.85) для пропусков длиной от 5 до 120 минут. При этом показано, что точность закономерно снижается с ростом уровня возмущений, что отражает фундаментальное ограничение, связанное с возрастающей стохастичностью исходного сигнала. Предложенный подход обеспечивает интерпретируемость и адаптивность, открывая перспективы для создания инструментов восстановления данных в различных прикладных областях.
-
В эпоху стремительной цифровой трансформации и растущего распространения искусственного интеллекта обеспечение естественного, непрерывного и бесконтактного человеко-компьютерного взаимодействия приобретает первостепенное значение для различных областей. Данная работа представляет новую модель на базе глубокого обучения для управления виртуальной мышью посредством жестов, получившая название CLVM (CNN-LSTM Virtual Mouse). Разработанная система основывается на гибридной архитектуре, интегрирующей три мощных компонента: (1) MediaPipe – для высокоэффективной детекции ключевых ориентиров кисти в режиме реального времени; (2) сверточную нейронную сеть (CNN) – для извлечения пространственных признаков; (3) сеть долгой краткосрочной памяти (LSTM) – для моделирования временной динамики, что существенно повышает точность и непрерывность распознавания жестов во временной последовательности. В отличие от традиционных подходов, модель CLVM разработана для сохранения высокой производительности в условиях реальной среды, особенно при неравномерном освещении и наличии загроможденного фона. Система характеризуется низкой задержкой и высокой скоростью отклика, а также возможностью эффективного функционирования на устройствах с ограниченными ресурсами, что обуславливает ее пригодность для широкого практического применения. Результаты экспериментов демонстрируют, что CLVM достигает высокой точности (99,88%) при снижении потерь до 0,38, значительно превосходя по эффективности традиционные методы распознавания жестов. Полученные данные подчеркивают потенциал CLVM как надежного, масштабируемого и эффективного решения для организации естественного взаимодействия на основе жестов, представляя собой важный шаг вперед в разработке интеллектуальных, удобных для пользователя интерфейсов для бесконтактного управления.
-
Интеллектуальные системы стали неотъемлемым компонентом современных технологических ландшафтов. Вопрос их надежности является крайне важным, поскольку возникновение неисправностей способно катастрофически сказаться на функционировании и итоговой эффективности системы, вследствие чего обнаружение и изоляция неисправностей (FDI) становится критически значимой задачей. Реализация этой задачи осложняется присущей таким системам сложной нелинейной динамикой. В данной работе в рамках решения указанной проблемы предлагается методология интеллектуального обнаружения и изоляции неисправностей; в качестве репрезентативного примера рассматривается система инкубатора. Предлагаемый метод использует нелинейную авторегрессионную экзогенную (NARX) нейронную сеть в параллельной структуре для моделирования сложной нелинейной динамики системы. Были сравнены различные реализации модели NARX, основанные на многослойном перцептроне (MLP), сети долгой краткосрочной памяти (LSTM), вентильном рекуррентном блоке (GRU) и сети Элмана, для оценки их эффективности моделирования и определения лучшей модели. Полученные расхождения между прогнозами модели и фактическими значениями называются остаточными величинами. Для классификации неисправностей было проведено сравнительное исследование пяти методов машинного обучения (ML): многослойного перцептрона, экстремального градиентного бустинга (XGBoost), метода опорных векторов (SVM), метода k-ближайших соседей (KNN) и линейного дискриминантного анализа (LDA). Данные методы анализируют остаточные величины, чтобы идентифицировать конкретную неисправность из заранее определенного множества возможных, включая неисправности исполнительных механизмов и датчиков. Полученные результаты демонстрируют эффективность интеллектуальной методологии FDI, представленной в данной работе. Модели NARX продемонстрировали высокую эффективность моделирования, причем гибридная модель MLP-NARX показала наилучшие результаты, превзойдя остальные архитектуры. Сравнительный анализ классификаторов выявил различия в эффективности пяти рассматриваемых методов, при этом классификатор на основе многослойного перцептрона достиг наивысших показателей по всем оценочным метрикам. Это свидетельствует о его пригодности для практического применения в задачах диагностики неисправностей, что обусловлено его высокой способностью улавливать сложные нелинейные взаимосвязи в данных.
-
Мониторинг состояния дорожного покрытия является важной задачей, направленной на повышение безопасности дорожного движения и оптимизацию обслуживания транспортной инфраструктуры. В настоящей работе разработана инерциальная IoT-система, предназначенная для классификации типов дорожного покрытия в режиме реального времени, обнаружения выбоин и повышения точности оценки местоположения транспортного средства. Предложенная система включает модель XGBoost, адаптированную для развертывания на микроконтроллерах с ограниченным объемом памяти, алгоритм интерполяции GPS с использованием данных о скорости движения, а также метод обнаружения выбоин на основе индекса аномалий. Экспериментальная оценка проведена на собственном наборе данных и общедоступном наборе данных PVS. Достигнутая точность классификации составила 95.39% и 93.21% соответственно. Для анализа переносимости модель, обученная на собственном наборе данных, была применена к набору PVS без дополнительного обучения и обеспечила точность 92.45%, что подтверждает устойчивость предложенного подхода к смене источника данных. Применение процедуры интерполяции GPS позволило снизить среднюю ошибку локализации с 5.571–11.893 м до 1.835–3.563 м при скоростях движения транспортного средства от 20 до 50 км/ч. Дополнительным вкладом работы является публикация собственного набора данных, содержащего вибрационные сигнатуры типовых дорожных покрытий, что способствует дальнейшему развитию методов интеллектуальной классификации дорожного покрытия.
Математическое моделирование и прикладная математика
-
В статье рассматривается двухэшелонная модель транспортной системы, предназначенная для описания и анализа распределительных логистических процессов с промежуточными хабами и конечными потребителями. Модель учитывает совместную оптимизацию маршрутов магистрального уровня и маршрутов распределения при наличии ограничений по вместимости транспортных средств и требований по удовлетворению спроса. Рассматриваемая задача относится к классу NP-трудных, что существенно ограничивает применение точных методов оптимизации при росте размерности транспортного графа. Для решения предложенной модели используется двухэшелонная модификация алгоритма муравьиной колонии (2E-ACO), в которой процессы формирования решений для первого и второго эшелонов формализованы раздельно, но согласованы через единую целевую функцию, включающую транспортные затраты и штрафы за необслуженный спрос. Основное внимание в работе уделено вычислительному эксперименту, направленному на анализ масштабируемости и устойчивости алгоритма при увеличении мощности множества потребителей, числа хабов и сложности транспортной инфраструктуры. Эксперименты проводятся в режиме масштабируемых ресурсов, что позволяет отделить влияние алгоритмических решений от эффектов ресурсных ограничений. Для оценки воспроизводимости используются многократные независимые запуски с фиксированными силами генератора случайных чисел. Полученные результаты демонстрируют предсказуемый рост вычислительных затрат при увеличении размерности модели и устойчивость качества решений. Сравнение с намеренно простой базовой жадной эвристикой, используемой в качестве нижней оценки качества решений, показывает, что алгоритм 2E-ACO обеспечивает сопоставимый уровень обслуживания спроса при более высоких вычислительных затратах, обусловленных итерационным характером поиска. Представленные результаты подтверждают применимость предложенной модели и алгоритма для исследования крупномасштабных двухэшелонных транспортных систем.
-
В данной статье предложен новый алгоритм построения диаграммы Вороного на прямоугольных основаниях с отверстиями. Алгоритм основан на алгоритме построения диаграммы Вороного с метрикой расстояния L ∞ , разработанным Papadopoulou E. и Lee D.-T. Предложены модификации для обработки отверстий в модели диаграммы Вороного. Алгоритм обрабатывает искажения в структуре диаграммы, вызванные отверстиями, создавая слои береговой линии при построении диаграммы Вороного, названные тенями, и используя новый тип биссекторов, которые не задают ребер на диаграмме Вороного, но являются основой для структуры слоев береговой линии. Алгоритм задает новые события для заметающей прямой, сохраняя общие принципы обработки согласно базовому алгоритму. По результатам сравнения времени выполнения с предыдущим подходом определения пролетов в плите, предложенный алгоритм работает в 1.33 раза быстрее для плана с 75 опорами и в 15.17 раз быстрее для наибольшего протестированного количества опор, но медленнее для меньшего количества опор и большего числа отверстий. Предварительный корреляционный анализ показал наличие значимой линейной корреляции с коэффициентом 0.76 между площадью ячейки Вороного и требуемым количеством армирования, а также сильную и умеренную корреляцию между другими параметрами ячейки и метриками деформаций. В заключении указаны текущие ограничения модели и алгоритма, которые будут исследованы в дальнейшем.
-
Современные вычислительные системы функционируют, как правило, в условиях гетерогенности и переменной нагрузки. Важным инструментом обеспечения высоких показателей функционирования (например, производительность, надежность, устойчивость) является эффективное распределение вычислительных ресурсов. В связи с этим актуальной проблемой является разработка методов распределения задач, позволяющих улучшать несколько показателей одновременно. Предлагаемый в работе подход представляет собой расширение предсказательного метода распределения ресурсов. Это осуществляется за счет введения многокритериальной модели принятия решений, включающей прогнозное время выполнения, текущую загрузку узлов и достоверность прогноза, оцениваемую по статистике расхождений фактических и прогнозных значений. Объект исследования – вычислительные системы с неоднородными узлами, обрабатывающими потоки задач переменной сложности. Предмет исследования – модели и алгоритмы предсказательного распределения вычислительных ресурсов на основе многокритериального принятия решений. Цель исследования – повышение эффективности и устойчивости функционирования гетерогенных вычислительных систем за счет использования более обоснованного механизма выбора узла на основе совокупности критериев. Выполнен обзор существующих динамических и предсказательных методов распределения, выявлены их преимущества, недостатки и ограничения по эффективному применению. Разработана многокритериальная модель принятия решений, реализующая построение множества Парето-оптимальных решений и процедуру арбитража. Проведено программное моделирование в различных сценариях функционирования системы, включая условия со сниженной достоверностью статистики. Результаты исследования показали, что предлагаемый предсказательный метод на основе многокритериального принятия решений обеспечивает снижение среднего времени выполнения задач и повышение равномерности нагрузки узлов по сравнению с известными подходами. Полученные результаты предлагается использовать при построении гетерогенных вычислительных систем с адаптивными системами управления ресурсами.