Весь выпуск
Искусственный интеллект, инженерия данных и знаний
-
В работе предлагается подход к оцениванию параметров нелинейных динамических моделей с помощью концепции Рандомизированного машинного обучения (РМО), основанной на переходе от детерминированных моделей к случайным (со случайными параметрами) с последующим оцениванием вероятностных распределений параметров и шумов по реальным данным. Главной особенностью данного метода является его эффективность в условиях малого количества реальных данных. В работе рассматриваются модели, сформулированные в терминах обыкновенных дифференциальных уравнений, которые преобразуются к дискретному виду для постановки и решения задачи энтропийной оптимизации. Применение предлагаемого подхода демонстрируется на задаче прогнозирования общего количества инфицированных COVID-19 с помощью динамической эпидемиологической модели SIR. Для этого в работе строится рандомизированная модель SIR (R-SIR) с одним параметром, энтропийно-оптимальная оценка которого реализуется его функцией плотности распределения вероятностей, а также функциями плотности распределения вероятностей измерительных шумов в точках, в которых производится обучения. Далее применяется техника рандомизированного прогнозирования с фильтрацией шумов, основанная на генерации соответствующих распределений и построении ансамбля прогнозных траекторий с вычислением средней по ансамблю траектории. В работе реализуется вычислительный эксперимент с использованием реальных оперативных данных о заболеваемости в виде сравнительного исследования с известным методом оценивания параметров модели, основанным на методе наименьших квадратов. Полученные в эксперименте результаты демонстрируют существенное снижение средне-абсолютной процентной ошибки (MAPE) при по отношению к реальным наблюдениям на интервале прогноза, что показывают работоспособность предложенного метода и его эффективность в задачах рассматриваемого в работе типа.
-
В статье рассматриваются основные методы решения проблемы малых наборов обучающих данных для создания автоматических систем распознавания речи для так называемых малоресурсных языков. Рассматривается понятие малоресурсных языков и формулируется рабочая дефиниция на основании ряда работ по этой тематике. Определены основные трудности, связанные с применением классических схем автоматического распознавания речи к материалу малоресурсных языков, и очерчен круг основных методов, использующихся для решения обозначенных проблем. В статье подробно рассматриваются методы аугментации данных, переноса знаний и сбора речевого материала. В зависимости от конкретной задачи, выделяются методы аугментации аудиоматериала и текстовых данных, переноса знаний и мультизадачного обучения. Отдельный раздел статьи посвящен существующему информационному обеспечению, базам данных и основным принципам их организации с точки зрения работы с малоресурсными языками. Делаются выводы об оправданности методов аугментации данных и переноса знаний для языков с минимальным информационным обеспечением. В случае полного отсутствия данных для конкретного языка и родительских моделей структурно схожих языков предпочтительным вариантом является сбор новой базы данных, в том числе, при помощи краудсорсинга. Многозадачные модели переноса знаний оказываются эффективными в том случае, если исследователь располагает набольшими наборами данных. Если доступны данные по языку с достаточными ресурсами, предпочтительной является работа с языковой парой. Сделанные в результате данного обзора выводы в дальнейшем предполагается применить при работе с малоресурсным карельским языком, для которого авторы статьи создают систему автоматического распознавания речи.
-
Сельское хозяйство является одним из основных источников экономического роста в России; мировое производство яблок в 2019 году составило 87 миллионов тонн. Болезни листьев яблони являются основной причиной ежегодного сокращения производства яблок, что приводит к огромным экономическим потерям. Автоматизированные методы выявления болезней листьев яблони позволяют сократить трудоемкую работу по мониторингу яблоневых садов и раннему выявлению симптомов болезни. В этой статье предложена многослойная сверточная нейронная сеть (MCNN), которая способна классифицировать листья яблони по одной из следующих категорий: парша яблони, черная гниль и болезни яблоневой кедровой ржавчины, используя недавно созданный набор данных. В этом методе мы использовали методы аффинного преобразования и перспективного преобразования для увеличения размера набора данных. После этого операции предварительной обработки на основе метода кадрирования и выравнивания гистограммы OpenCV использовались для улучшения предлагаемого набора данных изображения. Экспериментальные результаты показывают, что система достигает точности обучения 98,40% и точности проверки 98,47% для предложенного набора данных изображения с меньшим количеством параметров обучения. Результаты предполагают более высокую точность классификации предложенной модели MCNN по сравнению с другими известными современными подходами. Эта предложенная модель может использоваться для обнаружения и классификации других типов болезней яблони из разных наборов данных изображений.
Робототехника, автоматизация и системы управления
-
Рассматривается использование различных типов эвристических алгоритмов на основе технологий мягких вычислений для распределения задач в группах мобильных роботов, выполняющих односложные операции в едином рабочем пространстве: генетические алгоритмы, муравьиные алгоритмы и искусственные нейронные сети. Показано, что данная задача является NP-сложной и ее решение прямым перебором для большого числа заданий невозможно. Исходная задача сведена к типовым NP-полным задачам: обобщенной задаче поиска оптимальной группы замкнутых маршрутов от одного депо и задаче коммивояжера. Представлены описание каждого из выбранных алгоритмов и сравнение их характеристик. Приводится пошаговый алгоритм работы с учетом выбранных генетических операторов и их параметров при заданном объеме популяции. Представлена общая структура разработанного алгоритма, позволяющего достаточно эффективно решить многокритериальную оптимизационную задачу с учетом временных затрат и интегрального критерия эффективности роботов, учитывающего энергетические затраты, функциональную насыщенность каждого агента группы и т.д. Показана возможность решения исходной задачи с использованием муравьиного алгоритма и обобщенного поиска оптимальной группы замкнутых маршрутов. Для многокритериальной оптимизации показана возможность линейной свертки полученного векторного критерия оптимальности за счет введения дополнительных параметров, характеризующих групповое управление: общее КПД функционирования всех роботов, затраты энергии на функционирование группы поддержки и энергия на размещение одного робота на рабочем поле. Для решения задачи распределения заданий с использованием нейронной сети Хопфилда произведено ее представление в виде графа, полученного в ходе перехода от обобщенной задачи поиска оптимальной группы замкнутых маршрутов от одного депо к задаче коммивояжера. Показателем качества выбран суммарный путь, пройденный каждым из роботов группы.
-
IP-геолокация – это процесс определения реального географического положения электронного устройства, подключенного к сети Интернет, по его глобальному сетевому адресу [1]. В настоящее время она нашла широкое применение в интернет-торговле, маркетинге и рекламе, информационной безопасности [2] и других направлениях человеческой деятельности. Применяются различные подходы к определению местоположения удаленного сетевого устройства, различающиеся как по типу анализируемой информации (задержка передачи пакетов, ресурсные записи DNS-серверов, контент веб-страниц), так и по выдаваемому результату (название страны или города, почтовый адрес, вероятная зона расположения или точные координаты) [3, 4]. Ошибка IP-геолокации зависит от страны расположения устройства, плотности населения, типа сетевого устройства и лежит в пределах от нескольких десятков метров до сотен километров. При этом для одних и тех же входных данных результаты разных IP-геосервисов могут различаться значительно. Объектом данного исследования выступают общедоступные IP-геосервисы, предоставляющие услуги по IP-геопривязке узлов глобальной сети на основе их IP-адресов, а именно – их точность и полнота. Выборка IP-геосервисов для тестирования были сформирована из числа наиболее популярных [5]. При проведении исследования результаты IP-геолокации сравнивались с достоверными сведениями о расположении некоторых IP-адресов, в качестве показателей точности использовались страна, город и географические координаты. На основе сравнительного анализа результатов тестирования были сделаны выводы о точности IP-геосервисов по выбранным показателям, их существенных свойствах, а также о зависимости ошибки геолокации от размера населенного пункта. Для повышения точности IP-геопривязки авторами предложен ансамблевый метод усреднения координат, полученных от нескольких IP-геосервисов.
-
В работе исследованы структурные зависимости рабочих выходов логических комбинационных схем с целью последующей идентификации вида возможных ошибок. Приведены виды возникающих ошибок и классификация рабочих выходов логических комбинационных схем. Показано, что наличие внутренней структурной связи дискретных устройств приводит к увеличению кратности возможных ошибок. Приводится условие определения функциональной зависимости выходов от проявления ошибок исследуемой кратности. Отмечено, что из множества видов ошибок, на выходах схем могут проявляться однонаправленные (монотонные) ошибки. Приведен известный метод определения монотонно зависимых рабочих выходов дискретных устройств и указан его недостаток, заключающийся в необходимости только попарного сравнения каждого выхода с остальными из целого множества. Для удобства процесса поиска подобных выходов автором статьи предложен новый метод идентификации монотонно зависимых рабочих выходов, отличающийся от известных методов тем, что данный метод применим для любого числа выходов, что требует значительно меньшего времени для поиска вышеприведенных выходов. Показано, что логические комбинационные схемы могут обладать функциональными особенностями, при которых на рабочих выходах могут проявляться только монотонные ошибки. Следовательно, предложен новый метод идентификации любого числа монотонно независимых рабочих выходов комбинационных схем. Показано, что предлагаемые в статье методы поиска монотонно зависимых и монотонно независимых выходов логических комбинационных схем требуют выполнения несложных математических вычислений. В программной среде Multisim смоделированы внутренние неисправности диагностируемых схем и зафиксированы все возможные ошибки на рабочих выходах. По результатам экспериментов также подтверждена справедливость полученных теоретических результатов.
-
Сложность современных объектов с перестраиваемой структурой приводит к необходимости учета различных факторов взаимодействия их с окружающей средой и связана с увеличением числа входящих в их состав элементов и подсистем, а также, соответственно, стремительным ростом числа внутренних связей, и проявляется в таких аспектах, как структурная сложность, сложность функционирования, сложность выбора поведения, сложность моделирования и сложность развития. Данные системы функционируют в условиях существенной неопределённости, связанной с изменением содержания целей и задач, стоящих перед объектом, воздействием возмущающих факторов со стороны внешней среды и имеющих целенаправленный и/или нецеленаправленный характер. Указанные аспекты сложности системы связаны не только с неопределенными воздействиями внешней среды, но и с множеством различных режимов (видов) функционирования, соответствующих множественности решаемых задач и множественности показателей качества их решения. Как правило, системы с фиксированной структурой, настраиваемые обычно на установившийся (какой-то заданный) режим, не обеспечивают наилучшего качества управления в других режимах. Поэтому многорежимность и неопределенность условий функционирования обуславливают необходимость решения проблемы анализа и синтеза конфигурации и реконфигурации рассматриваемых объектов, основанных на интеллектуальных подходах. При этом на этапах создания и проектирования объектов с перестраиваемой структурой должны быть синтезированы такие взаимосвязанные множества режимов функционирования и структур, а также, возможно, внесён такой уровень избыточности в указанные множества с учетом пространственно-временных, технических и технологических ограничений, при которых на этапе их применения по целевому назначению имелась бы возможность гибко реагировать на все расчётные и нерасчётные нештатные ситуации, вызывающие структурные изменения объекта. С формальной точки зрения, решение указанных задач возможно в рамках такого важнейшего класса современных научно-технических задач, как задачи многокритериального структурно-функционального синтеза конфигураций многорежимных объектов на различных этапах их жизненного цикла. В настоящей статье приведен метод решения указанных задач, основанный на предложенной авторами концепции параметрического генома сложных многорежимных объектов. Применение данной концепции позволяет в концентрированном виде хранить явные и неявные знания экспертов о взаимодействии элементов и подсистем объекта при выполнении различных вариантов реализации режимов функционирования, а также осуществлять оперативное вычисление значений оптимистических и пессимистических оценок показателей структурно-функциональной надежности однородных/неоднородных, монотонных/немонотонных, равноценных/неравноценных многорежимных объектов. Для решения задачи многокритериального выбора требуемого количества недоминируемых вариантов конфигураций многорежимного объекта, равномерно расположенных в множестве эффективных (паретовских) альтернатив, была предложена комбинация метода интервального лексикографического упорядочения (последовательных уступок) и операторного решающего правила. При этом для проведения детального анализа возможности реализации объектом совместного или раздельного задействования режимов функционирования с равноценной или неравноценной интенсивностью их применения было предложено нечетко-возможностное представление обобщенного показателя структурно-функциональной надежности в виде трапециевидного числа и определения его центра тяжести. Эффективность использования разработанного метода структурно-параметрического синтеза конфигураций многорежимного объекта с перестраиваемой структурой проиллюстрирована на примере решения задачи структурно-параметрического синтеза конфигураций системы управления движением малого космического аппарата «Аист-2Д».