Искусственный интеллект, инженерия данных и знаний. Рубрика в журнале - Информатика и автоматизация (Труды СПИИРАН)

Публикации в рубрике (107): Искусственный интеллект, инженерия данных и знаний
все рубрики
Пофонемное распознавание как задача классификации рядов на множестве последовательностей элементов сложных объектов с применением усовершенствованного trie-дерева

Пофонемное распознавание как задача классификации рядов на множестве последовательностей элементов сложных объектов с применением усовершенствованного trie-дерева

Галина Владимировна Дорохина

Статья

Последовательности, в том числе последовательности векторов, применимы в любых предметных областях. Последовательности скалярных значений или векторов (ряды) могут быть порождены последовательностями более высокого порядка, например: последовательностями состояний, элементов сложных объектов. Работа посвящена применению усовершенствованного trie-дерева в задаче классификации ряда на множестве последовательностей элементов сложных объектов методом динамического программирования. Рассмотрены сферы применения динамического программирования. Показано, что динамическое программирование приспособлено к многошаговым операциям вычисления аддитивных (мультипликативных) мер подобия / различия. Утверждается, что усовершенствованное trie-дерево применимо в задаче классификации ряда на множестве последовательностей элементов сложных объектов методом динамического программирования при использовании таких мер подобия / различия. Выполнен анализ иерархических представлений множеств последовательностей. Описаны преимущества, которые обеспечивает усовершенствованное trie-дерево по сравнению с традиционными представлениями других сильноветвящихся деревьев. Разработано формальное описание усовершенствованного trie-дерева. Дано пояснение ранее полученным данным о существенном приросте скорости операций добавления и удаления последовательностей в усовершенствованном trie-дереве относительно использования массива с индексной таблицей (24 и 380 раз, соответственно). Выполнена постановка задачи пофонемного распознавания речевых команд как задачи классификации ряда на множестве последовательностей элементов сложных объектов и изложен метод её решения. Разработан метод классификации ряда на множестве последовательностей элементов сложных объектов с применением усовершенствованного trie-дерева. Он исследован на примере пофонемного распознавания с иерархическим представлением словаря классов речевых команд. В этом методе распознавание речевых команд выполняют в процессе обхода усовершенствованного trie-дерева, хранящего множество транскрипций речевых команд – последовательностей транскрипционных символов, которые обозначают классы звуков. Численные исследования показали, что классификация ряда как последовательности элементов сложных объектов повышает частоту правильной классификации по сравнению с классификацией ряда на множестве рядов, а применение усовершенствованного trie-дерева сокращает затраты времени на классификацию.

Бесплатно

Применение многоуровневых моделей в задачах классификации и регрессионного анализа

Применение многоуровневых моделей в задачах классификации и регрессионного анализа

Илья Сергеевич Лебедев

Статья

Применение моделей машинного обучения обуславливает необходимость создания методов, направленных на повышение качественных показателей обработки информации. В большинстве практических случаев диапазоны значений целевых переменных и предикторов формируются под воздействием внешних и внутренних факторов. Такие явления, как дрейф концепций, приводят к тому, что модель со временем понижает показатели полноты и точности результатов. Целью работы является повышение качества анализа выборок и информационных последовательностей на основе многоуровневых моделей для задач классификации и регрессии. Предлагается двухуровневая архитектура обработки данных. На нижнем уровне происходит анализ поступающих на вход информационных потоков и последовательностей, осуществляется решение задач классификации или регрессии. На верхнем уровне выполняется разделения выборок на сегменты, определяются текущие свойства данных в подвыборках и назначаются наиболее подходящие по достигаемым качественным показателям модели нижнего уровня. Приведено формальное описание двухуровневой архитектуры. В целях повышения показателей качества решения задач классификации и регрессии производится предварительная обработка выборки данных, вычисляются качественные показатели моделей, определяются классификаторы, имеющие лучшие результаты. Предложенное решение позволяет реализовывать постоянно обучающиеся системы обработки данных. Оно направлено на снижение затрат на переобучение моделей в случае трансформации свойств данных. Проведены экспериментальные исследования на ряде наборов данных. Численные эксперименты показали, что предложенное решение позволяет повысить качественные показатели обработки. Модель может быть рассмотрена как совершенствование ансамблевых методов обработки информационных потоков и выборок данных. Обучение отдельного классификатора, а не группы сложных классификационных моделей дает возможность уменьшить вычислительные затраты.

Бесплатно

Применение предварительно обученных многоязычных моделей для распознавания карельской речи

Применение предварительно обученных многоязычных моделей для распознавания карельской речи

Ирина Сергеевна Кипяткова, Ильдар Амирович Кагиров, Михаил Дмитриевич Долгушин

Статья

В настоящей статье описывается экспериментальное исследование, направленное на решение проблемы обучения моделей для распознавания речи в условиях малого объема обучающих речевых и текстовых данных. Подробно рассматриваются существующие подходы к решению данной проблемы, в частности, использование преодобученных многоязычных моделей и аугментация данных. В работе проведена адаптация многоязычных моделей на базе Wav2Vec и Whisper к ливвиковскому наречию карельского языка и проведено исследование применения внешней языковой модели для повышения точности распознавания интегральной системы. Кроме того, в статье описаны специально собранная и подготовленная речевая база данных и базовая система распознавания, созданная на основе тулкита Kaldi. Приведены количественные результаты тестирования, которые подтверждают эффективность выбранных методов: так, использование моделей на архитектуре Трансформер, в частности, Wav2Vec, позволило достичь более высоких показателей, чем у базовых моделей, обученных с помощью программных средств Kaldi. Дообучение моделей Wav2Vec снизило количество неправильно распознанных слов до 24,73% на валидационной и до 25,25% на тестовой выборках, а использование модели Wav2Vec-BERT 2.0 с внешней языковой моделью дополнительно уменьшило количество неправильно распознанных слов до 17,12% и 17,72% соответственно. Статья адресована, в первую очередь, специалистам, занимающимся разработкой систем автоматического распознавания речи для малоресурсных языков и распознаванием речи на прибалтийско-финских языках, в частности, результаты этой работы могут найти практическое применение в полевых исследованиях, при записи текстов на карельском.

Бесплатно

Применение сегментной спайковой модели нейрона со структурной адаптацией для решения задач классификации

Применение сегментной спайковой модели нейрона со структурной адаптацией для решения задач классификации

Антон Михайлович Корсаков, Любовь Алексеевна Астапова, Александр Валерьевич Бахшиев

Статья

Рассматриваются варианты применения сегментной спайковой модели нейрона с возможностью структурной адаптации для решения задач классификации. Проводится анализ современного состояния спайковых нейронных сетей. Делается вывод о крайне низком количестве работ по исследованию сегментных моделей нейрона. В качестве модели нейрона для данной работы обосновывается выбор сегментной спайковой модели. Приводится краткое описание такой модели, отмечены её основные особенности, позволяющие производить её структурное реконфигурирование. Описывается способ структурной адаптации модели ко входному паттерну импульсов. Приводится общая схема организации сегментных спайковых нейронов в сеть для решения задачи классификации. В качестве кодирования числовой информации в паттерны импульсов выбирается временное кодирование. Приводятся краткие результаты экспериментов по решению задачи классификации на общедоступных наборах данных (Iris, MNIST). Делается вывод о сопоставимости полученных результатов с результатами, полученными классическими методами. Кроме того, приводится подробное пошаговое описание экспериментов по определению состояния телеуправляемого необитаемого подводного аппарата: определение расстояния такого аппарата до дна и определение характера его движения. Показано соответствие полученных результатов реальному состоянию телеуправляемого необитаемого подводного аппарата. Сделан вывод о перспективности применения спайковых сегментных моделей нейрона с возможностью структурной адаптации при решении задач классификации. Рассмотрены дальнейшие перспективные продолжения исследований основанных на сегментных спайковых моделях нейрона.

Бесплатно

Программное обеспечение для автоматизированного распознавания и оцифровки архивных данных оптических наблюдений полярных сияний

Программное обеспечение для автоматизированного распознавания и оцифровки архивных данных оптических наблюдений полярных сияний

Андрей Владимирович Воробьев, Александр Николаевич Лапин, Гульнара Равилевна Воробьева

Статья

Одним из основных инструментов регистрации полярных сияний является оптическое наблюдение небосвода в автоматическом режиме с помощью камер всего неба. Результаты наблюдений фиксируются в специальных мнемонических таблицах, аскаплотах. Аскаплоты предоставляют суточную информацию о наличии или отсутствии облачного покрова и полярных сияний в различных частях небосвода и традиционно используются для исследования суточного распределения полярных сияний в заданном регионе, а также для расчета вероятности их наблюдения в других регионах в соответствии с уровнем геомагнитной активности. Обработка аскаплотов в настоящее время осуществляется вручную, что сопряжено с существенными временными затратами и высокой долей ошибок, возникающих по причине человеческого фактора. Для повышения эффективности обработки аскаплотов авторами предложен подход, обеспечивающий автоматизацию распознавания и оцифровки данных оптических наблюдений полярных сияний. Предложена формализация структуры аскаплота, применяемая для обработки его изображения, а также извлечение соответствующих результатов наблюдений и формирование результирующего набора данных. Подход предусматривает использование алгоритмов машинного зрения (в частности, в данном случае имеет место применение алгоритма классификации по правилам) и применение специализированной маски – отладочного изображения для оцифровки, представляющего собой цветное изображение, в котором задано общее положения ячеек аскаплотов. Предложенный подход и соответствующие алгоритмы реализованы в форме программного обеспечения для распознавания и оцифровки архивных данных оптических наблюдений полярных сияний. Решение представляет собой однопользовательское настольное программное обеспечение, позволяющее пользователю в пакетном режиме выполнять преобразование изображений аскаплотов в таблицы, доступные для последующей обработки и анализа. Результаты проведенных вычислительных экспериментов показали, что применение предложенного программного обеспечения позволит избежать ошибок при оцифровке аскаплотов, с одной стороны, и существенно повысить скорость соответствующих вычислительных операций, с другой. В совокупности это позволит повысить эффективность обработки аскаплотов и проведения исследований в соответствующей области.

Бесплатно

Рандомизированное машинное обучение и прогнозирование нелинейных динамических моделей c применением к эпидемиологической модели SIR

Рандомизированное машинное обучение и прогнозирование нелинейных динамических моделей c применением к эпидемиологической модели SIR

Алексей Юрьевич Попков, Юрий Андреевич Дубнов, Юрий Соломонович Попков

Статья

В работе предлагается подход к оцениванию параметров нелинейных динамических моделей с помощью концепции Рандомизированного машинного обучения (РМО), основанной на переходе от детерминированных моделей к случайным (со случайными параметрами) с последующим оцениванием вероятностных распределений параметров и шумов по реальным данным. Главной особенностью данного метода является его эффективность в условиях малого количества реальных данных. В работе рассматриваются модели, сформулированные в терминах обыкновенных дифференциальных уравнений, которые преобразуются к дискретному виду для постановки и решения задачи энтропийной оптимизации. Применение предлагаемого подхода демонстрируется на задаче прогнозирования общего количества инфицированных COVID-19 с помощью динамической эпидемиологической модели SIR. Для этого в работе строится рандомизированная модель SIR (R-SIR) с одним параметром, энтропийно-оптимальная оценка которого реализуется его функцией плотности распределения вероятностей, а также функциями плотности распределения вероятностей измерительных шумов в точках, в которых производится обучения. Далее применяется техника рандомизированного прогнозирования с фильтрацией шумов, основанная на генерации соответствующих распределений и построении ансамбля прогнозных траекторий с вычислением средней по ансамблю траектории. В работе реализуется вычислительный эксперимент с использованием реальных оперативных данных о заболеваемости в виде сравнительного исследования с известным методом оценивания параметров модели, основанным на методе наименьших квадратов. Полученные в эксперименте результаты демонстрируют существенное снижение средне-абсолютной процентной ошибки (MAPE) при по отношению к реальным наблюдениям на интервале прогноза, что показывают работоспособность предложенного метода и его эффективность в задачах рассматриваемого в работе типа.

Бесплатно

Распознавание действий человека в системах видеонаблюдения с использованием методов глубокого обучения – обзор

Распознавание действий человека в системах видеонаблюдения с использованием методов глубокого обучения – обзор

Нукала Суджата Гупта, К. Рут Рамья, Рамеш Карнати

Статья

Несмотря на широкое применение во многих областях, точная и эффективная идентификация деятельности человека продолжает оставаться интересной исследовательской проблемой в области компьютерного зрения. В настоящее время проводится много исследований по таким темам, как распознавание активности пешеходов и способы распознавания движений людей с использованием данных глубины, трехмерных скелетных данных, данных неподвижных изображений или стратегий, использующих пространственно-временные точки интереса. Это исследование направлено на изучение и оценку подходов DL для обнаружения человеческой активности на видео. Основное внимание было уделено нескольким структурам для обнаружения действий человека, которые используют DL в качестве своей основной стратегии. В зависимости от приложения, включая идентификацию лиц, идентификацию эмоций, идентификацию действий и идентификацию аномалий, прогнозы появления людей разделены на четыре различные подкатегории. В литературе было проведено несколько исследований, основанных на этих распознаваниях для прогнозирования поведения и активности человека в приложениях видеонаблюдения. Сравнивается современное состояние методов DL для четырех различных приложений. В этой статье также представлены области применения, научные проблемы и потенциальные цели в области распознавания человеческого поведения и активности на основе DL.

Бесплатно

Распознавание объектов по составляющим их примитивам и отношениям между ними

Распознавание объектов по составляющим их примитивам и отношениям между ними

Павел Александрович Сливницин, Леонид Александрович Мыльников

Статья

Целью работы является разработка способа и алгоритма распознавания объектов окружающего пространства, качество работы которого не будет зависеть от числа типов объектов реального мира, которые он может распознавать. Для этого поставлены и решены задачи распознавания множества элементарных геометрических объектов (признаков-примитивов), определения отношений между ними и поиска соответствий между найденными признаками-примитивами и отношениями и заданными шаблонами–описаниями сложносоставных и простых объектов реального мира. Для распознавания элементарных геометрических фигур применена нейронная сеть свёрточного типа. Для её обучения использовались искусственно сгенерированные изображения с элементарными геометрическими фигурами (3D примитивами), которые располагались на сцене случайным образом с различными свойствами их поверхностей и текстурами. В результате обучения была получена нейронная сеть, способная распознавать объекты примитивы. Сформировано множество отношений, необходимое для распознавания объектов, которые могут быть представлены как составные из признаков-примитивов. В предложенном способе распознавания количество классов для поиска ограничивается набором признаков-примитивов. Проверка на фотографиях реальных объектов показала способность распознавать объекты реального мира в независимости от их типа (в случаях, когда возможны их разные модели и модификации) и материала изготовления, а также способность успешно решать задачи поиска объектов в условиях частичного перекрытия объектов и их ограниченной видимости и частичной деформации. В работе рассмотрен пример с распознаванием светильника уличного освещения. Пример показывает способность алгоритма не только выявлять объект на изображении, но и определять ориентацию положения его составляющих. Предложенное решение может быть использовано в задачах манипуляции объектами внешнего мира робототехническими системами.

Бесплатно

Распознавание оттенка цветовой метки на основе нечёткой кластеризации

Распознавание оттенка цветовой метки на основе нечёткой кластеризации

Максим Владимирович Бобырь, Александр Евгеньевич Архипов, Алексей Сергеевич Якушев

Статья

Рассматривается задача определения текущего положения пневматических исполнительных механизмов. Решение поставленной задачи достигается введением системы технического зрения, позволяющей на основе метода нечеткой кластеризации определять в режиме реального времени координаты центра цветовой метки, установленной на исполнительных механизмах мехатронного комплекса и позицию её смещения. Целью работы является повышение точности распознавания цветовой метки для прецизионного позиционирования исполнительных механизмов мехатронного комплекса и повышение быстродействия дефаззификатора за счет распараллеливания вычислительных процедур в нем. Интеллектуализация процесса распознавания цветового оттенка производится на основе нечёткой кластеризации. Сначала строится нечеткая модель, позволяющая в зависимости от входных параметров интенсивности цвета по каждому из каналов RGB и составляющей цветового тона выделять на изображении заданный цвет. Затем осуществляется бинаризация цветного изображения и подавление шумов. При моделировании нечеткой системы авторами были применены две модели дефаззификации: на основе метода центра тяжести и на основе отношения площадей. Модель, реализованная на основе метода отношения площадей, позволяет убрать зоны нечувствительности, которые присутствуют в модели центра тяжести. Метод на основе отношения площадей определяет принадлежность пикселей к заданному цветовому тону, и после этого расположение цветовой метки в кадре изображения определяется на основе определения центра тяжести распознанных пикселей цветовой метки. В последующем, при перемещении исполнительного механизма в продольном направлении, система технического зрения определяет расположение цветовой метки в новом кадре. Разность положений цветовой метки на исходном и текущем изображениях позволяет определить расстояние смещения цветовой метки. С целью исследования влияния шума на точность распознавания были использованы цифровые фильтры: медианный, Гауссовский, матричный и биноминальный. Анализ точности данных фильтров показал, что лучший результат получен при использовании Гауссовского фильтра. Оценка производилась на основе показателя сигнал-шум. Реализация математической модели распознавания цветовой метки выполнена в среде Matlab/Simulink. Экспериментальные исследования работоспособности системы технического зрения с предложенной нечёткой моделью кластеризации проводились на пневматическом мехатронном комплексе. В ходе экспериментов на корпусе цилиндра закреплялась цветовая метка, после чего цилиндр перемещался по направляющим в продольном направлении. В процессе перемещения выполнялась видеофиксация и распознавание изображений. Для определения точности распознавания цветовой метки рассчитаны коэффициенты PSNR и RMSE, которые составили 38,21 и 3,14 соответственно. Точность определения смещения на основе разработанной модели распознавания цветовых меток достигла 99,7%. Быстродействие дефаззификатора увеличилось до 590 нс.

Бесплатно

Реализация поведенческих функций на спайковых нейронных сетях

Реализация поведенческих функций на спайковых нейронных сетях

Антон Михайлович Корсаков, Александр Валерьевич Бахшиев, Любовь Алексеевна Астапова, Лев Александрович Станкевич

Статья

Рассматривается вопрос моделирования поведенческих функций животных, в частности, моделирование и реализация условного рефлекса. Производится анализ современного состояния нейронных сетей с возможностью структурного реконфигурирования. Моделирование осуществляется посредством нейронных сетей, которые строятся на основе сегментной спайковой модели нейрона с возможностью структурной адаптации к входному паттерну импульсов. Сегментная спайковая модель нейрона способна изменять свою структуру (размер тела клетки, количество и длина дендритов, количество синапсов) в зависимости от поступающего на её входы паттерна импульсов. Приведено краткое описание сегментной спайковой модели нейрона, отмечены её основные особенности с точки зрения возможности её структурного реконфигурирования. Описывается способ структурной адаптации сегментной спайковой модели нейрона к входному паттерну импульсов. Для исследования работы предложенной модели нейрона в сети, в качестве примера обосновывается выбор условного рефлекса, как частного случая формирования ассоциативных связей. Приведено описание структурной схемы и алгоритма формирования условного рефлекса как с положительным, так и с отрицательным подкреплением. Представлено пошаговое описание экспериментов по формированию ассоциативных связей вообще и условного рефлекса (как с положительным, так и с отрицательным подкреплением), в частности. Сделан вывод о перспективности применения спайковых сегментных моделей нейронов для повышения эффективности реализации поведенческих функций в нейроморфных системах управления. Рассмотрены дальнейшие перспективные направления развития нейроморфных систем, основанных на спайковых сегментных моделях нейрона.

Бесплатно

Рекуррентные нейронные сети с непрерывным обучением в задачах многофункциональной обработки новостных потоков

Рекуррентные нейронные сети с непрерывным обучением в задачах многофункциональной обработки новостных потоков

Василий Юрьевич Осипов, Сергей Викторович Кулешов, Дмитрий Игоревич Милосердов, Александра Алексеевна Зайцева, Алексей Юрьевич Аксенов

Статья

Главной задачей использования нейронных сетей является оперативное и точное решение различных творческих задач, таких как анализ и синтез новостных потоков при сохранении непрерывности обучения. Результатом такой обработки могут быть дайджесты, новостные потоки, прошедшие фильтрацию, а также прогнозы событий, позволяющих обеспечивать проактивность в управленческих решениях Известные методы обработки новостей нейронными сетями и реализующие их технические решения не в полной мере обеспечивают решение возникающих в этой области задач. Необходимо расширить их функциональные возможности, совершенствовать пространственно-временное связывание сигналов в рекуррентных нейронных сетях. При обработке новостных потоков одновременно с непрерывным обучением рекуррентных нейронных сетей следует осуществлять селекцию, распознавание, восстановление, прогнозирование и синтез новостей. Для снижения остроты проблемы предлагается перспективный метод многофункциональной обработки новостных потоков с применением рекуррентных нейронных сетей с логической организацией слоев и непрерывным обучением. Метод основан на развитии ассоциативной обработки текстовой информации в потоковых рекуррентных нейронных сетях с управляемыми элементами. Ключевыми особенностями этого метода являются многофункциональная обработка информационных потоков с изменяющимися законами появления новостей. Метод предусматривает оперативный отбор, распознавание, восстановление, прогнозирование и синтез новостей на основе глубокой ассоциативной непрерывной обработки связей между текстовыми элементами. Реализующая предлагаемый метод нейросетевая система отличается от известных решений новыми элементами, связями между ними, а также выполняемыми функциями. По результатам экспериментов подтверждена расширенная функциональность метода. Выявлены новые особенности обработки новостных текстов потоковыми РНС. Предлагаемые решения могут найти применение при создании интеллектуальных систем нового поколения не только для обработки текстов, но и других видов информации.

Бесплатно

Сбалансированная система обнаружения вторжений для беспроводных сенсорных сетей в среде больших данных с использованием модели CNN-SVM

Сбалансированная система обнаружения вторжений для беспроводных сенсорных сетей в среде больших данных с использованием модели CNN-SVM

Кураганти Пхани Рама Кришна, Рамакришна Тирумуру

Статья

Беспроводные сенсорные сети (WSN) подвергались нескольким различным проблемам безопасности и атакам, связанным со сбором и отправкой данных. В этом сценарии одной из наиболее распространенных атак WSN, которая может быть нацелена на любой уровень стека протоколов, является атака типа «отказ в обслуживании» (DoS). Текущее исследование предлагает различные стратегии обнаружения атаки в сети. Однако у него есть проблемы с классификацией. Поэтому в этом исследовании для решения этой проблемы была предложена эффективная система обнаружения вторжений на основе ансамблевого глубокого обучения для выявления атак в сети WSN. Предварительная обработка данных включает преобразование качественных данных в числовые с использованием метода One-Hot Encoding. После этого был проведен процесс нормализации. Затем предлагается выбрать лучшее подмножество функций с помощью Manta-Ray Foraging Optimization. Затем метод передискретизации синтетического меньшинства (SMOTE) создает новую выборку меньшинства для балансировки обработанного набора данных. Наконец, предлагается классификатор CNN-SVM для классификации видов атак. Метрики Точность, F-мера, Прецизионность и Отзыв использовались для оценки результатов 99,75%, 99,21%, 100% и 99,6% соответственно. По сравнению с существующими подходами предложенный метод оказался чрезвычайно эффективным при обнаружении DoS-атак в WSN.

Бесплатно

Система SLAM, основанная на скрытых марковских моделях

Система SLAM, основанная на скрытых марковских моделях

Оскар Фуэнтес, Хесус Саваж, Луи Контрерас

Статья

Методы одновременной локализации и картографирования (SLAM) являются решением проблемы навигации сервисных роботов. Мы представляем графовую систему SLAM, основанную на скрытых марковских моделях (HMM), где показания датчиков представлены различными символами с использованием ряда методов кластеризации; затем символы объединяются в один для повышения точности с использованием двойных HMM. Универсальность нашей системы позволяет работать с датчиками разных типов или комбинировать датчики, а также реализовать активную или пассивную графовую систему SLAM. В подходе Graph-SLAM, предложенном Karto Robotics International в Cartographer, узлы представляют положение робота, а ребра представляют ограничения между ними. Узлы обычно задаются по непрерывным узлам, за исключением случаев обнаружения замыкания цикла, когда вводятся ограничения на несмежные узлы, что корректирует весь граф. Обнаружение цикливания не является тривиальным; в реализации ROS сопоставление сканирования выполняется с использованием регулировки положения разреженности (SPA). Картограф использует карту занятости, чтобы оценить положение, в котором карта отображается с помощью Gmapping. Робот Toyota HSR (Human Support Robot) использовался для создания набора данных как в реальных, так и в смоделированных условиях соревнований. В нашем представлении SLAM есть оценка одометрии колес в соответствии с начальным положением робота, 2D-лидарное сканирование Hokuyo для наблюдений, а также контроль сигналов и оценка карты окружающего пространства. Мы протестировали нашу систему в задаче о похищенном роботе, обучили начальную модель, затем улучшили ее в онлайн режиме и, наконец, решили задачу SLAM.

Бесплатно

Система анализа тональности текста на телугу на основе нового пассивно-агрессивного классификатора с нечетким взвешиванием

Система анализа тональности текста на телугу на основе нового пассивно-агрессивного классификатора с нечетким взвешиванием

Дж Джанардана Найду, M Сешашаяи

Статья

Обработка естественного языка (NLP) — это разновидность искусственного интеллекта, демонстрирующая, как алгоритмы могут взаимодействовать с людьми на их уникальных языках. Кроме того, анализ настроений в NLP лучше проводится во многих программах, включая оценку настроений на телугу. Для обнаружения текста на телугу используются несколько неконтролируемых алгоритмов машинного обучения, таких как кластеризация k-средних с поиском с кукушкой. Однако эти методы с трудом справляются с кластеризацией данных с переменными размерами и плотностью кластеров, низкой скоростью поиска и плохой точностью сходимости. В ходе этого исследования была разработана уникальная система анализа настроений на основе машинного обучения для текста на телугу, позволяющая устранить указанные недостатки. Первоначально, на этапе предварительной обработки, предлагаемый алгоритм линейного преследования (LPA) удаляет слова в пробелах, знаках препинания и остановках. Затем для маркировки POS в этом исследовании было предложено условное случайное поле с лексическим взвешиванием; После этого предлагается надуманный пассивно-агрессивный классификатор с нечетким взвешиванием (CPSC-FWC) для классификации настроений в тексте на телугу. Следовательно, предлагаемый нами метод дает эффективные результаты с точки зрения точности, воспроизводимости и показателя f1.

Бесплатно

Система поддержки принятия факторинговых решений на основе оптимизированных квантовых алгоритмов QMC

Система поддержки принятия факторинговых решений на основе оптимизированных квантовых алгоритмов QMC

Александр Владимирович Чуваков, Родион Олегович Боряев

Статья

Непрерывный рост финансовых рынков диктует необходимость для его участников искать новые подходы к финансовому анализу для получения конкурентных преимуществ, в том числе за счет использования новых подходов в области вычислений. Квантовые вычисления могут быть использованы в качестве инструмента по получению данных преимуществ перед конкурентами. В частности моделирование Монте-Карло применяется широко в управлении финансовыми рисками, в то же время, требует значительных вычислительных ресурсов из-за использования большого количества сценариев, необходимых для получения более точного результата. Для оптимизации данного подхода применяются алгоритмы квантовой оценки амплитуды, которые ускоряют данный процесс, если использовать предварительно вычисленные распределения вероятностей для инициализации входных квантовых состояний. Но при отсутствии данных распределений в имеющихся подходах по данной тематике они генерируются численно с использованием классических вычислений, что полностью нивелирует преимущество квантового подхода. В данной статье предлагается решение указанной проблемы путём использования квантовых вычислений, в том числе для генерации распределений вероятностей. Была рассмотрена реализация квантовых схем для моделирования эволюции факторов риска во времени для движения капитала, процентных ставок и кредитных рисков, а также представлено объединение этих моделей с алгоритмами квантовой оценки амплитуды в качестве примера использования полученных алгоритмов для управления кредитными рисками. В завершении статьи проанализирована возможность использования полученных схем в финансовом анализе.

Бесплатно

Систематическое исследование методов обнаружения опухолей головного мозга на основе искусственного интеллекта

Систематическое исследование методов обнаружения опухолей головного мозга на основе искусственного интеллекта

Санджит Кумар, Урмила Пилания, Неха Нандал

Статья

Мозг считается одним из наиболее эффективных органов, контролирующих организм. Развитие технологий сделало возможным раннее и точное обнаружение опухолей головного мозга, что существенно влияет на их лечение. Применение искусственного интеллекта значительно возросло в области неврологии. В этом систематическом обзоре сравниваются последние методы глубокого обучения (DL), машинного обучения (ML) и гибридные методы для обнаружения рака мозга. В статье дается оценка 36 недавних статей, посвященных этим методам, с учетом наборов данных, методологии, используемых инструментов, достоинств и ограничений. Статьи содержат понятные графики и таблицы. Обнаружение опухолей головного мозга в значительной степени опирается на методы машинного обучения, такие как метод опорных векторов (SVM) и метод нечетких C-средних (FCM). Рекуррентные сверточные нейронные сети (RCNN), плотная сверточная нейронная сеть (DenseNet), сверточные нейронные сети (CNN), остаточная нейронная сеть (ResNet) и глубокие нейронные сети (DNN) — это методы DL, используемые для более эффективного обнаружения опухолей головного мозга. Методы DL и ML объединяются для разработки гибридных методов. Кроме того, приводится краткое описание различных этапов обработки изображений. Систематический обзор выявляет нерешенные проблемы и будущие цели для методов на основе DL и ML для обнаружения опухолей головного мозга. С помощью систематического обзора можно определить наиболее эффективный метод обнаружения опухолей головного мозга и использовать его для улучшения.

Бесплатно

Случайный лес выживаемости и регрессия Надарая-Уотсона

Случайный лес выживаемости и регрессия Надарая-Уотсона

Лев Владимирович Уткин, Андрей Владимирович Константинов

Статья

В статье представлен случайный лес выживаемости на основе модели внимания (Att-RSF). Первая идея, лежащая в основе леса, состоит в том, чтобы адаптировать ядерную регрессию Надарая-Уотсона к случайному лесу выживаемости таким образом, чтобы веса регрессии или ядра можно было рассматривать как обучаемые веса внимания при важном условии, что предсказания случайного леса выживаемости представлены в виде функций времени, например, функции выживания или кумулятивной функции риска. Каждый обучаемый вес, присвоенный дереву и примеру из обучающей или тестовой выборки, определяется двумя факторами: способностью соответствующего дерева предсказывать и особенностью примера, попадающего в лист дерева. Вторая идея Att-RSF состоит в том, чтобы применить модель загрязнения Хьюбера для представления весов внимания как линейной функции обучаемых параметров внимания. C-индекс Харрелла (индекс конкордации) как показатель качества предсказания случайного леса выживаемости используется при формировании функции потерь для обучения весов внимания. Использование C-индекса вместе с моделью загрязнения приводит к стандартной задаче квадратичной оптимизации для вычисления весов, которая имеет целый ряд простых алгоритмов решения. Численные эксперименты с реальными наборами данных, содержащими данные о выживаемости, иллюстрируют предлагаемую модель Att-RSF.

Бесплатно

Создание прогнозирующих моделей запахов для сред виртуальной реальности

Создание прогнозирующих моделей запахов для сред виртуальной реальности

Нгуен Вьет Хунг, Нгуен Ань Куан, Нгуен Тан, Тран Триеу Хай, Данг Тхань Чунг, Ле Май Нам, Буй Тхань Лоан, Нгуен Тхи Туй Нга

Статья

In a sensory-rich environment, human experiences are shaped by the complex interplay of multiple senses. However, digital interactions predominantly engage visual and auditory modalities, leaving other sensory channels, such as olfaction, largely unutilized. Virtual Reality (VR) technology holds significant potential for addressing this limitation by incorporating a wider range of sensory inputs to create more immersive experiences. This study introduces a novel approach for integrating olfactory stimuli into VR environments through the development of predictive odor models, termed SPRF (Sensory Predictive Response Framework). The objective is to enhance the sensory dimension of VR by tailoring scent stimuli to specific content and context with the collection of information about the location of scent sources and their identification through features to serve to reproduce them in the space of the VR environment, thereby enriching user engagement and immersion. Additionally, the research investigates the influence of various scent-related factors on user perception and behavior in VR, aiming to develop predictive models optimized for olfactory integration. Empirical evaluations demonstrate that the SPRF model achieves superior performance, with an accuracy of 98.13%, significantly outperforming conventional models such as Convolutional Neural Networks (CNN, 79.46%), Long Short-Term Memory (LSTM, 80.37%), and Support Vector Machines (SVM, 85.24%). Additionally, SPRF delivers notable improvements in F1-scores (13.05%-21.38%) and accuracy (12.89%-18.67%) compared to these alternatives. These findings highlight the efficacy of SPRF in advancing olfactory integration within VR, offering actionable insights for the design of multisensory digital environments.

Бесплатно

Сравнение двух методов классификации объектов с использованием скрытых марковских моделей и сверточных нейронных сетей

Сравнение двух методов классификации объектов с использованием скрытых марковских моделей и сверточных нейронных сетей

Карлос Сармьенто, Хесус Саваж

Статья

Представлено сравнение дискретных скрытых марковских моделей и свёрточных нейронных сетей для классификации изображений. После разбивки изображений на части целесообразно получить векторы, которые представляют локальные визуальные структуры, одновременно определяющие изображения глобально через пространственную последовательность. С использованием методов кластеризации создается алфавит из указанных векторов, а затем конструируются последовательности символов, которые описывают статистические модели, соответствующие классам изображений. Скрытые марковские модели в сочетании с методами квантования могут обрабатывать шум и искажения в наблюдениях для решения проблем компьютерного зрения, таких как классификация изображений с изменением освещения и перспективы. Протестированы архитектуры, основанные на трех, шести и девяти скрытых состояниях, в пользу скорости обнаружения и низкого использования памяти. Также были протестированы два типа ансамблевых моделей. Точность предлагаемого метода была оценена с помощью общедоступных данных; полученные результаты оказались сравнимы с известными оценками при использовании тонко настроенных свёрточных нейронных сетей, но требовали значительно меньших вычислительных ресурсов. Результат представляет интерес при разработке мобильных роботов с вычислительными устройствами, имеющими ограниченное время автономной работы, но требующими способности обнаруживать и добавлять новые объекты в свои системы классификации.

Бесплатно

Улучшенная повторная идентификация людей в системах видеонаблюдения с использованием глубокого обучения: структура для реальных приложений

Улучшенная повторная идентификация людей в системах видеонаблюдения с использованием глубокого обучения: структура для реальных приложений

Моссааб Идрисси Алами, Абдеррахман Эз-захут, Фузия Омари

Статья

Повторная идентификация людей (ReID) играет ключевую роль в современном видеонаблюдении, обеспечивая непрерывное отслеживание людей по различным камерам видеонаблюдения и повышая эффективность систем общественной безопасности. Однако повторная идентификация людей на реальных записях камер видеонаблюдения сопряжена с определенными трудностями, включая изменения углов обзора камеры, вариации освещения, частичные окклюзии и схожий внешний вид людей. В этой статье мы предлагаем надежную структуру глубокого обучения, которая использует сверточные нейронные сети (CNNs) с настраиваемой функцией потери триплетов для преодоления этих препятствий и повышения точности повторной идентификации. Система разработана таким образом, чтобы генерировать уникальные векторные представления признаков для отдельных людей, что позволяет точно различать их даже в сложных условиях окружающей среды. Чтобы подтвердить правильность нашего подхода, мы проводим обширные оценки на эталонных наборах данных ReID, достигая передовых результатов как по точности, так и по скорости обработки. Эффективность нашей модели оценивается с использованием ключевых метрик, включая кумулятивную характеристику соответствия (CMC) и среднюю точность (mAP), что демонстрирует ее надежность в различных сценариях наблюдения. По сравнению с существующими методами, наш подход неизменно превосходит их как по точности, так и по масштабируемости, что делает его пригодным для интеграции в крупномасштабные системы видеонаблюдения. Кроме того, мы обсуждаем практические аспекты по внедрению моделей ReID на основе ИИ в инфраструктуру видеонаблюдения, включая масштабируемость системы, возможности работы в режиме реального времени и вопросы конфиденциальности. Совершенствуя методы повторной идентификации людей, эта работа не только вносит вклад в область интеллектуального наблюдения, но и обеспечивает основу для повышения общественной безопасности в реальных приложениях с помощью автоматизированных и надежных возможностей отслеживания.

Бесплатно

Журнал