Искусственный интеллект, инженерия данных и знаний. Рубрика в журнале - Информатика и автоматизация (Труды СПИИРАН)

Публикации в рубрике (91): Искусственный интеллект, инженерия данных и знаний

Оценка методов скелетизации двумерных бинарных изображений

Шади Ибрагим Абудальфа

Статья

В сфере современной обработки изображений упор часто делается на инженерные подходы, а не на научные решения разнообразных практических задач. Одна из распространенных задач в этой области включает скелетирование бинарных изображений. Скелетонизация — это мощный процесс извлечения скелета объектов, находящихся в цифровом бинарном изображении. Этот процесс широко используется для автоматизации многих задач в различных областях, таких как распознавание образов, техническое зрение, анимация и анализ изображений. Существующие методы скелетизации в принципе основаны на трех подходах: эрозии границ, дистанционном кодировании и диаграмме Вороного для идентификации приблизительного скелета. В работе представлены результаты эмпирического оценивания набора хорошо известных методов. Затем выполнен расчет скелетов в двумерном бинарном изображении c выбором различных подходов и оценкой их эффективности. Визуальная оценка – это основной метод, используемый для демонстрации производительности выбранных алгоритмов скелетирования. Из-за отсутствия окончательного определения «истинного» скелета цифрового объекта точная оценка эффективности алгоритмов скелетирования представляет собой серьезную исследовательскую задачу. Были попытки проведения количественной оценки, однако применяемые меры обычно адаптировали для конкретных областей. Экспериментальные результаты, показанные в этой работе, иллюстрируют эффективность трех основных подходов к скелетизации изображений в различных перспективных приложениях.

Бесплатно

Оценка области просмотра с использованием обучения с подкреплением для потоковой передачи видео в формате 360 градусов

Нгуен Вьет Хунг, Фам Тянь Дат, Нгуен Тан, Нгуен Ань Куан, Ле Тхи Хуэйен Транг, Ле Май Нам

Статья

Видеоконтент в формате 360 градусов стал ключевым компонентом в средах виртуальной реальности, предлагая зрителям захватывающий и увлекательный опыт. Однако потоковая передача такого комплексного видеоконтента сопряжена со значительными трудностями, обусловленными существенными размерами файлов и переменчивыми сетевыми условиями. Для решения этих проблем в качестве перспективного решения, направленного на снижение нагрузки на пропускную способность сети, появилась адаптивная потоковая передача просмотра. Эта технология предполагает передачу видео более низкого качества для периферийных зон просмотра, а высококачественный контент – для конкретной зоны просмотра, на которую активно смотрит пользователь. По сути, это требует точного прогнозирования направления просмотра пользователя и повышения качества этого конкретного сегмента, что подчеркивает значимость адаптивной потоковой передачи просмотра (VAS). Наше исследование углубляется в применение методов пошагового обучения для прогнозирования оценок, требуемых системой VAS. Таким образом, мы стремимся оптимизировать процесс потоковой передачи, обеспечивая высокое качество отображения наиболее важных фрагментов видео. Кроме того, наш подход дополняется тщательным анализом поведения движений головы и лица человека. Используя эти данные, мы разработали модель обучения с подкреплением, специально предназначенную для прогнозирования направлений взгляда пользователя и повышения качества изображения в целевых областях. Эффективность предлагаемого нами метода подтверждается нашими экспериментальными результатами, которые показывают значительные улучшения по сравнению с существующими эталонными методами. В частности, наш подход повышает метрику прецизионности на значения в диапазоне от 0,011 до 0,022. Кроме того, он снижает среднеквадратичную ошибку (RMSE) в диапазоне от 0,008 до 0,013, среднюю абсолютную ошибку (MAE) – от 0,012 до 0,018 и оценку F1 – от 0,017 до 0,028. Кроме того, мы наблюдаем увеличение общей точности с 2,79 до 16,98. Эти улучшения подчеркивают потенциал нашей модели для значительного улучшения качества просмотра в средах виртуальной реальности, делая потоковую передачу видео на 360 градусов более эффективной и удобной для пользователя.

Бесплатно

Оценка рисков информационной безопасности в отраслевой информационной системе на основе теории нечетких множеств и искусственной нейронной сети

Амануэль Эстифанос Асфха, Абхишек Вайш

Статья

Оценка рисков информационной безопасности является важнейшим компонентом методов промышленного менеджмента, который помогает выявлять, количественно определять и оценивать риски в сравнении с критериями принятия рисков и целями, относящимися к организации. Благодаря своей способности комбинировать несколько параметров для определения общего риска традиционный метод оценки рисков, основанный на нечетких правилах, используется во многих отраслях промышленности. Этот метод имеет недостаток, поскольку он используется в ситуациях, когда необходимо оценить несколько параметров, и каждый параметр выражается различным набором лингвистических фраз. В этой статье представлены теория нечетких множеств и модель прогнозирования рисков с использованием искусственной нейронной сети (ANN), которые могут решить рассматриваемую проблему. Также разработан алгоритм, который может изменять факторы, связанные с риском, и общий уровень риска с нечеткого свойства на атрибут с четким значением. Система была обучена с использованием двенадцати выборок, представляющих 70%, 15% и 15% набора данных для обучения, тестирования и валидации соответственно. Кроме того, также была разработана пошаговая регрессионная модель, и ее результаты сравниваются с результатами ANN. С точки зрения общей эффективности, модель ANN (R2= 0,99981, RMSE=0,00288 и MSE=0,00001) показала лучшую производительность, хотя обе модели достаточно удовлетворительны. Делается вывод, что модель ANN, прогнозирующая риск, может давать точные результаты до тех пор, пока обучающие данные учитывают все мыслимые условия.

Бесплатно

Перформативная платформа и ее применение для высокотехнологичного образовательного сообщества

Нектариос Мамуцис, Яннис Сифакис, Ставрос Христодулакис, Десислава Панева-Маринова, Лилия Павлова

Статья

В этой статье используется всеохватывающая концепция сообществ для выражения социальных контекстов, в которых осуществляется человеческое творчество и происходит обучение. С появлением цифровых технологий эти социальные контексты, сообщества, в которых мы задействованы, радикально меняются. Новый ландшафт, созданный цифровыми технологиями, характеризуется новыми качествами, новыми возможностями для действий сообществ. Термин onlife заимствован из Манифеста Onlife и используется для обозначения сообществ нового типа, созданных современными цифровыми технологиями - сообществ onlife. Представлены принципы проектирования, направленные на развитие таких сообществ и поддержку их членов. Эти принципы составляют основу, которая подчеркивает концепцию перформативности, то есть то, что знания основаны на деятельности человека и действиях, выполняемых в определенных социальных контекстах, а не на развитии концептуальных представлений. Чтобы продемонстрировать использование структуры и соответствующих принципов, в статье представлено, как их можно использовать для анализа, оценки и переформулирования конкретной системы, относя ее к творчеству и обучению в области культурного наследия (преподавание и изучение истории). Одним из наиболее значительных результатов является принятие принципов, которые облегчают вовлечение студентов в учебный процесс, переходя от роли конечного пользователя к роли эксперта-пользователя при поддержке так называемых maieuta-дизайнеров. Результатом этого процесса является использование изученного программного обеспечения не только для потребления готового контента, но и для создания нового, сгенерированного студентами контента, предлагающего студентам новые возможности для обучения. Как показывает оценка, эти новые возможности обучения позволяют студентам развивать более глубокое понимание изучаемых тем.

Бесплатно

Подход к априорному оцениванию нечетких классификационных моделей в задачах мониторинга

Александр Александрович Потюпкин, Сергей Владимирович Пилькевич, Всеволод Владимирович Зайцев

Статья

Статья посвящена проблемам применения средств автоматизации при решении задач мониторинга и управления в части, касающейся оценки качества нечетких классификационных моделей, для которых порядок классификации реализуется на основании знаний (правил) в условиях отсутствия обучающей выборки. Предложен подход к получению априорных оценок качества классификации на основе исследования чувствительности используемой модели к изменению значений внутренних параметров в ходе соответствующего моделирования. Получена интерпретация результатов моделирования в виде оценки рисков, вызванных несовершенством самих классификационных моделей. В статье приведен пример нечеткой классификационной модели, в основе которой лежит сравнение текущего состояния объекта мониторинга, описываемого с использованием нечетких признаков, с набором заранее заданных типовых состояний, формирующих соответствующие нечетко равные между собой (близкие) состояния (ситуации мониторинга). Сравнение осуществляется с использованием операции нечеткой импликации при условии соблюдения требуемой достоверности. На примере данной модели показано, каким образом вид операции импликации, а также внутренние особенности модели влияют на результаты классификации, предложены соответствующие показатели, которые являются как интерпретацией общепринятых показателей оценки качества классификации, так и уникальными, присущими именно рассмотренной модели. Проведены вычислительные эксперименты, которые позволили получить графики изменения показателей оценки качества классификации для рассматриваемой модели и ее модификации, наглядно отобразить влияние внутренних параметров модели на результаты ее применения. Предложены ряд показателей, позволяющих провести априорную оценку рисков, возникающих вследствие применения модели, до ее фактического применения.

Бесплатно

Подход к интеграции разнородных источников медицинских данных на основе микросервисной архитектуры

Нафиса Исламовна Юсупова, Гульнара Равилевна Воробьева, Рустэм Халитович Зулкарнеев

Статья

Задача обработки медицинской информации в настоящее время в нашей стране и за рубежом решается посредством разнородных медицинских информационных систем, преимущественно локального и регионального уровней. Постоянно возрастающий объем и сложность накапливаемой информации наряду с необходимостью обеспечения прозрачности и преемственности обработки медицинских данных (в частности, к примеру, по бронхолегочным заболеваниям) в различных организациях требует разработки нового подхода к интеграции их разнородных источников. При этом важным требованием к решению поставленной задачи является возможность веб-ориентированной реализации, что позволит сделать соответствующие приложения доступными широкому кругу пользователей без высоких требований к их аппаратно-программным возможностям. В работе рассматривается подход к интеграции разнородных источников медицинской информации, который основан на принципах построения микросервисных веб-архитектур. Каждый модуль обработки данных может быть использован независимо от других программных модулей, предоставляя универсальную точку входа и результирующий набор данных в соответствии с принятой схемой данных. Последовательное выполнение этапов обработки предполагает передачу управления соответствующим программным модулям в фоновом режиме по принципу Cron. В схеме декларируется два вида схем данных – локальная (от медицинских информационных систем) и глобальная (для единой системы хранения), между которыми предусмотрены соответствующие параметры отображения по принципу построения XSLT-таблиц. Важной отличительной особенностью предлагаемого подхода представляется модернизация системы хранения медицинской информации, заключающейся в создании зеркальных копий основного сервера с периодической репликацией соответствующей информации. При этом взаимодействие между клиентами и серверами хранилищ данных осуществляется по типу систем доставки контента с созданием сеанса соединения между конечными точками по принципу ближайшего расстояния между ними, рассчитанного по формуле гаверсинусов. Проведенные вычислительные эксперименты над тестовыми данными по бронхолегочным заболеваниям показали эффективность предложенного подхода как для загрузки данных, так и для их получения отдельными пользователями и программными системами. В целом показатель реактивности соответствующим веб-ориентированных приложений был улучшен на 40% при стабильном соединении.

Бесплатно

Подходы к оцениванию кумулятивных характеристик поведения в группах разнородных индивидов: точность и применимость в условиях ограниченных наблюдений

Валерия Фуатовна Столярова, Татьяна Валентиновна Тулупьева, Артем Андреевич Вяткин

Статья

В ряде социоориентированных областей знаний возникает задача оценки кумулятивных характеристик поведения индивидов, таких как частота, которые реализуются в группах индивидов, причем поступающие данные сопряжены с неопределенностью. Нередки ситуации ограниченных данных, когда для небольшого числа наблюдаемых объектов известны лишь несколько эпизодов. Существуют несколько подходов, позволяющих строить оценки искомой кумулятивной характеристики в условиях ограниченных ресурсов: классический подход регрессии Кокса, оценка параметра копулы, апостериорный вывод в байесовских сетях доверия, классических и гибридных, однако до сих пор не были проанализированы возможности применимости имеющихся методов. Целью работы является анализ особенностей применения существующих методов косвенного оценивания интенсивности рискованного поведения индивидов на основе ограниченных данных об эпизодах для определения рекомендаций по их применению: определение точности оценок, получаемых с помощью перечисленных подходов, на основе расстояния Канторовича–Рубинштейна от истинного распределения искомой частоты, а также выявление требований к данным, которые предъявляются для построения оценок. Было показано, что подход на основе копул дает самые точные оценки и обладает наименьшими требованиями к количеству наблюдаемых объектов, однако не может учитывать внешние факторы, которые могут оказывать влияние на реализацию эпизодов поведения. Среди моделей, позволяющих учитывать коварианты процесса, наибольшей точностью обладают оценки, опирающиеся на апостериорный вывод в гибридных байесовских сетях доверия. Полученные результаты являются новыми, они нацелены на применение в автоматизированных системах обработки информации о поведении индивидов. Практической значимостью обладают рекомендации по применению имеющихся подходов в зависимости от имеющихся данных.

Бесплатно

Полиномиальные аппроксимации некоторых функций активации нейронных сетей

Григорий Борисович Маршалко, Юлия Анатольевна Труфанова

Статья

Активное внедрение систем машинного обучения ставит актуальную задачу обеспечения их защиты от различных типов атак, направленных на нарушение свойств конфиденциальности, целостности и доступности как обрабатываемых данных, так и обучаемых моделей. Одним из перспективных направлений защиты является разработка конфиденциальных систем машинного обучения, использующих гомоморфные схемы шифрования для защиты моделей и данных. Однако такие схемы могут обрабатывать только полиномиальные функции, что в свою очередь ставит задачу построения полиномиальных аппроксимаций используемых в нейросетевых моделях нелинейных функций. Целью настоящей работы является построение наиболее точных аппроксимаций некоторых широко используемых функций активаций нейронных сетей, а именно ReLU, логистического сигмоида и гиперблолического тангенса, при ограничениях на степень аппроксимирующего полинома, а также оценка влияния точности такой аппроксимации на результат работы нейронной сети в целом. В отличие от опубликованных ранее работ рассматриваются и сравниваются различные способы построения аппроксимирующих полиномов, вводятся метрики точности приближения, приводится конкретный вид аппроксимирующих полиномов, а также соответствующие значения точности приближения. Проводится сравнение с аппроксимациями, приведенными в опубликованных ранее работах. В заключение для простейшей нейронной сети экспериментально оценено влияние точности приближения аппроксимирующего полинома на величину отклонения значений выходных нейронов такой сети от соответствующих значений выходных нейронов исходной сети. Результаты показывают, что для функции ReLU наилучшее приближение может быть получено с помощью численного метода, а для логистического сигмоида и гиперболического тангенса – с помощью полиномов Чебышева. При этом наилучшее приближение из трех рассмотренных функций получено для функции ReLU. Полученные результаты в дальнейшем могут быть использованы при построении аппроксимаций функций активации в конфиденциальных системах машинного обучения.

Бесплатно

Построение модели онлайн-обучения с помощью видео по распознаванию танцев, основанного на глубоком обучении

Нгуен Вьет Хунг, Тханг Куанг Лои, Нгуен Хай Бинь, Нгуен Тхи Туй Нга, Труонг Ту Хыонг, Дук Лич Луу

Статья

Распознавание движений при прыжках с помощью видео является значительным вкладом, поскольку оно значительно влияет на интеллектуальные приложения и будет широко применяться в жизни. Этот метод может быть использован для обучения будущих танцоров с использованием инновационных технологий. Сложные позы будут повторяться и совершенствоваться с течением времени, что снизит нагрузку на инструктора при многократном выполнении. Танцоров также можно воссоздать, удалив элементы из их изображений. Распознавать движения танцоров, проверять и корректировать их позы, и еще одним важным аспектом является то, что наша модель может извлекать когнитивные функции для эффективной оценки и классификации, а глубокое обучение в настоящее время является одним из лучших способов сделать это для возможностей коротких видеороликов. Кроме того, при оценке качества видеозаписи выступления точность выполнения каждого танцевального шага является сложной проблемой, когда глаза судей не могут на 100% сфокусироваться на танце на сцене. Более того, танцы на видео сегодня представляют большой интерес для ученых, поскольку технологии все больше развиваются и становятся полезными для замены людей. Основываясь на реальных условиях и потребностях Вьетнама. В этой статье мы предлагаем метод, заменяющий ручную оценку, и наш подход используется для оценки танца с помощью коротких видеороликов. Кроме того, мы проводим танцевальный анализ с помощью коротких видеороликов, применяя таким образом такие методы, как глубокое обучение, для оценки и сбора данных, на основе которых можно делать точные выводы. Эксперименты показывают, что наша оценка является относительно точной, когда рассчитываются значения точности и F1-балла. Точность составляет более 92,38% и 91,18% F1-балла соответственно. Это демонстрирует, что наш метод хорошо и точно работает при анализе оценки танца.

Бесплатно

Пофонемное распознавание как задача классификации рядов на множестве последовательностей элементов сложных объектов с применением усовершенствованного trie-дерева

Галина Владимировна Дорохина

Статья

Последовательности, в том числе последовательности векторов, применимы в любых предметных областях. Последовательности скалярных значений или векторов (ряды) могут быть порождены последовательностями более высокого порядка, например: последовательностями состояний, элементов сложных объектов. Работа посвящена применению усовершенствованного trie-дерева в задаче классификации ряда на множестве последовательностей элементов сложных объектов методом динамического программирования. Рассмотрены сферы применения динамического программирования. Показано, что динамическое программирование приспособлено к многошаговым операциям вычисления аддитивных (мультипликативных) мер подобия / различия. Утверждается, что усовершенствованное trie-дерево применимо в задаче классификации ряда на множестве последовательностей элементов сложных объектов методом динамического программирования при использовании таких мер подобия / различия. Выполнен анализ иерархических представлений множеств последовательностей. Описаны преимущества, которые обеспечивает усовершенствованное trie-дерево по сравнению с традиционными представлениями других сильноветвящихся деревьев. Разработано формальное описание усовершенствованного trie-дерева. Дано пояснение ранее полученным данным о существенном приросте скорости операций добавления и удаления последовательностей в усовершенствованном trie-дереве относительно использования массива с индексной таблицей (24 и 380 раз, соответственно). Выполнена постановка задачи пофонемного распознавания речевых команд как задачи классификации ряда на множестве последовательностей элементов сложных объектов и изложен метод её решения. Разработан метод классификации ряда на множестве последовательностей элементов сложных объектов с применением усовершенствованного trie-дерева. Он исследован на примере пофонемного распознавания с иерархическим представлением словаря классов речевых команд. В этом методе распознавание речевых команд выполняют в процессе обхода усовершенствованного trie-дерева, хранящего множество транскрипций речевых команд – последовательностей транскрипционных символов, которые обозначают классы звуков. Численные исследования показали, что классификация ряда как последовательности элементов сложных объектов повышает частоту правильной классификации по сравнению с классификацией ряда на множестве рядов, а применение усовершенствованного trie-дерева сокращает затраты времени на классификацию.

Бесплатно

Применение многоуровневых моделей в задачах классификации и регрессионного анализа

Илья Сергеевич Лебедев

Статья

Применение моделей машинного обучения обуславливает необходимость создания методов, направленных на повышение качественных показателей обработки информации. В большинстве практических случаев диапазоны значений целевых переменных и предикторов формируются под воздействием внешних и внутренних факторов. Такие явления, как дрейф концепций, приводят к тому, что модель со временем понижает показатели полноты и точности результатов. Целью работы является повышение качества анализа выборок и информационных последовательностей на основе многоуровневых моделей для задач классификации и регрессии. Предлагается двухуровневая архитектура обработки данных. На нижнем уровне происходит анализ поступающих на вход информационных потоков и последовательностей, осуществляется решение задач классификации или регрессии. На верхнем уровне выполняется разделения выборок на сегменты, определяются текущие свойства данных в подвыборках и назначаются наиболее подходящие по достигаемым качественным показателям модели нижнего уровня. Приведено формальное описание двухуровневой архитектуры. В целях повышения показателей качества решения задач классификации и регрессии производится предварительная обработка выборки данных, вычисляются качественные показатели моделей, определяются классификаторы, имеющие лучшие результаты. Предложенное решение позволяет реализовывать постоянно обучающиеся системы обработки данных. Оно направлено на снижение затрат на переобучение моделей в случае трансформации свойств данных. Проведены экспериментальные исследования на ряде наборов данных. Численные эксперименты показали, что предложенное решение позволяет повысить качественные показатели обработки. Модель может быть рассмотрена как совершенствование ансамблевых методов обработки информационных потоков и выборок данных. Обучение отдельного классификатора, а не группы сложных классификационных моделей дает возможность уменьшить вычислительные затраты.

Бесплатно

Применение сегментной спайковой модели нейрона со структурной адаптацией для решения задач классификации

Антон Михайлович Корсаков, Любовь Алексеевна Астапова, Александр Валерьевич Бахшиев

Статья

Рассматриваются варианты применения сегментной спайковой модели нейрона с возможностью структурной адаптации для решения задач классификации. Проводится анализ современного состояния спайковых нейронных сетей. Делается вывод о крайне низком количестве работ по исследованию сегментных моделей нейрона. В качестве модели нейрона для данной работы обосновывается выбор сегментной спайковой модели. Приводится краткое описание такой модели, отмечены её основные особенности, позволяющие производить её структурное реконфигурирование. Описывается способ структурной адаптации модели ко входному паттерну импульсов. Приводится общая схема организации сегментных спайковых нейронов в сеть для решения задачи классификации. В качестве кодирования числовой информации в паттерны импульсов выбирается временное кодирование. Приводятся краткие результаты экспериментов по решению задачи классификации на общедоступных наборах данных (Iris, MNIST). Делается вывод о сопоставимости полученных результатов с результатами, полученными классическими методами. Кроме того, приводится подробное пошаговое описание экспериментов по определению состояния телеуправляемого необитаемого подводного аппарата: определение расстояния такого аппарата до дна и определение характера его движения. Показано соответствие полученных результатов реальному состоянию телеуправляемого необитаемого подводного аппарата. Сделан вывод о перспективности применения спайковых сегментных моделей нейрона с возможностью структурной адаптации при решении задач классификации. Рассмотрены дальнейшие перспективные продолжения исследований основанных на сегментных спайковых моделях нейрона.

Бесплатно

Программное обеспечение для автоматизированного распознавания и оцифровки архивных данных оптических наблюдений полярных сияний

Андрей Владимирович Воробьев, Александр Николаевич Лапин, Гульнара Равилевна Воробьева

Статья

Одним из основных инструментов регистрации полярных сияний является оптическое наблюдение небосвода в автоматическом режиме с помощью камер всего неба. Результаты наблюдений фиксируются в специальных мнемонических таблицах, аскаплотах. Аскаплоты предоставляют суточную информацию о наличии или отсутствии облачного покрова и полярных сияний в различных частях небосвода и традиционно используются для исследования суточного распределения полярных сияний в заданном регионе, а также для расчета вероятности их наблюдения в других регионах в соответствии с уровнем геомагнитной активности. Обработка аскаплотов в настоящее время осуществляется вручную, что сопряжено с существенными временными затратами и высокой долей ошибок, возникающих по причине человеческого фактора. Для повышения эффективности обработки аскаплотов авторами предложен подход, обеспечивающий автоматизацию распознавания и оцифровки данных оптических наблюдений полярных сияний. Предложена формализация структуры аскаплота, применяемая для обработки его изображения, а также извлечение соответствующих результатов наблюдений и формирование результирующего набора данных. Подход предусматривает использование алгоритмов машинного зрения (в частности, в данном случае имеет место применение алгоритма классификации по правилам) и применение специализированной маски – отладочного изображения для оцифровки, представляющего собой цветное изображение, в котором задано общее положения ячеек аскаплотов. Предложенный подход и соответствующие алгоритмы реализованы в форме программного обеспечения для распознавания и оцифровки архивных данных оптических наблюдений полярных сияний. Решение представляет собой однопользовательское настольное программное обеспечение, позволяющее пользователю в пакетном режиме выполнять преобразование изображений аскаплотов в таблицы, доступные для последующей обработки и анализа. Результаты проведенных вычислительных экспериментов показали, что применение предложенного программного обеспечения позволит избежать ошибок при оцифровке аскаплотов, с одной стороны, и существенно повысить скорость соответствующих вычислительных операций, с другой. В совокупности это позволит повысить эффективность обработки аскаплотов и проведения исследований в соответствующей области.

Бесплатно

Рандомизированное машинное обучение и прогнозирование нелинейных динамических моделей c применением к эпидемиологической модели SIR

Алексей Юрьевич Попков, Юрий Андреевич Дубнов, Юрий Соломонович Попков

Статья

В работе предлагается подход к оцениванию параметров нелинейных динамических моделей с помощью концепции Рандомизированного машинного обучения (РМО), основанной на переходе от детерминированных моделей к случайным (со случайными параметрами) с последующим оцениванием вероятностных распределений параметров и шумов по реальным данным. Главной особенностью данного метода является его эффективность в условиях малого количества реальных данных. В работе рассматриваются модели, сформулированные в терминах обыкновенных дифференциальных уравнений, которые преобразуются к дискретному виду для постановки и решения задачи энтропийной оптимизации. Применение предлагаемого подхода демонстрируется на задаче прогнозирования общего количества инфицированных COVID-19 с помощью динамической эпидемиологической модели SIR. Для этого в работе строится рандомизированная модель SIR (R-SIR) с одним параметром, энтропийно-оптимальная оценка которого реализуется его функцией плотности распределения вероятностей, а также функциями плотности распределения вероятностей измерительных шумов в точках, в которых производится обучения. Далее применяется техника рандомизированного прогнозирования с фильтрацией шумов, основанная на генерации соответствующих распределений и построении ансамбля прогнозных траекторий с вычислением средней по ансамблю траектории. В работе реализуется вычислительный эксперимент с использованием реальных оперативных данных о заболеваемости в виде сравнительного исследования с известным методом оценивания параметров модели, основанным на методе наименьших квадратов. Полученные в эксперименте результаты демонстрируют существенное снижение средне-абсолютной процентной ошибки (MAPE) при по отношению к реальным наблюдениям на интервале прогноза, что показывают работоспособность предложенного метода и его эффективность в задачах рассматриваемого в работе типа.

Бесплатно

Распознавание действий человека в системах видеонаблюдения с использованием методов глубокого обучения – обзор

Нукала Суджата Гупта, К. Рут Рамья, Рамеш Карнати

Статья

Несмотря на широкое применение во многих областях, точная и эффективная идентификация деятельности человека продолжает оставаться интересной исследовательской проблемой в области компьютерного зрения. В настоящее время проводится много исследований по таким темам, как распознавание активности пешеходов и способы распознавания движений людей с использованием данных глубины, трехмерных скелетных данных, данных неподвижных изображений или стратегий, использующих пространственно-временные точки интереса. Это исследование направлено на изучение и оценку подходов DL для обнаружения человеческой активности на видео. Основное внимание было уделено нескольким структурам для обнаружения действий человека, которые используют DL в качестве своей основной стратегии. В зависимости от приложения, включая идентификацию лиц, идентификацию эмоций, идентификацию действий и идентификацию аномалий, прогнозы появления людей разделены на четыре различные подкатегории. В литературе было проведено несколько исследований, основанных на этих распознаваниях для прогнозирования поведения и активности человека в приложениях видеонаблюдения. Сравнивается современное состояние методов DL для четырех различных приложений. В этой статье также представлены области применения, научные проблемы и потенциальные цели в области распознавания человеческого поведения и активности на основе DL.

Бесплатно

Распознавание объектов по составляющим их примитивам и отношениям между ними

Павел Александрович Сливницин, Леонид Александрович Мыльников

Статья

Целью работы является разработка способа и алгоритма распознавания объектов окружающего пространства, качество работы которого не будет зависеть от числа типов объектов реального мира, которые он может распознавать. Для этого поставлены и решены задачи распознавания множества элементарных геометрических объектов (признаков-примитивов), определения отношений между ними и поиска соответствий между найденными признаками-примитивами и отношениями и заданными шаблонами–описаниями сложносоставных и простых объектов реального мира. Для распознавания элементарных геометрических фигур применена нейронная сеть свёрточного типа. Для её обучения использовались искусственно сгенерированные изображения с элементарными геометрическими фигурами (3D примитивами), которые располагались на сцене случайным образом с различными свойствами их поверхностей и текстурами. В результате обучения была получена нейронная сеть, способная распознавать объекты примитивы. Сформировано множество отношений, необходимое для распознавания объектов, которые могут быть представлены как составные из признаков-примитивов. В предложенном способе распознавания количество классов для поиска ограничивается набором признаков-примитивов. Проверка на фотографиях реальных объектов показала способность распознавать объекты реального мира в независимости от их типа (в случаях, когда возможны их разные модели и модификации) и материала изготовления, а также способность успешно решать задачи поиска объектов в условиях частичного перекрытия объектов и их ограниченной видимости и частичной деформации. В работе рассмотрен пример с распознаванием светильника уличного освещения. Пример показывает способность алгоритма не только выявлять объект на изображении, но и определять ориентацию положения его составляющих. Предложенное решение может быть использовано в задачах манипуляции объектами внешнего мира робототехническими системами.

Бесплатно

Распознавание оттенка цветовой метки на основе нечёткой кластеризации

Максим Владимирович Бобырь, Александр Евгеньевич Архипов, Алексей Сергеевич Якушев

Статья

Рассматривается задача определения текущего положения пневматических исполнительных механизмов. Решение поставленной задачи достигается введением системы технического зрения, позволяющей на основе метода нечеткой кластеризации определять в режиме реального времени координаты центра цветовой метки, установленной на исполнительных механизмах мехатронного комплекса и позицию её смещения. Целью работы является повышение точности распознавания цветовой метки для прецизионного позиционирования исполнительных механизмов мехатронного комплекса и повышение быстродействия дефаззификатора за счет распараллеливания вычислительных процедур в нем. Интеллектуализация процесса распознавания цветового оттенка производится на основе нечёткой кластеризации. Сначала строится нечеткая модель, позволяющая в зависимости от входных параметров интенсивности цвета по каждому из каналов RGB и составляющей цветового тона выделять на изображении заданный цвет. Затем осуществляется бинаризация цветного изображения и подавление шумов. При моделировании нечеткой системы авторами были применены две модели дефаззификации: на основе метода центра тяжести и на основе отношения площадей. Модель, реализованная на основе метода отношения площадей, позволяет убрать зоны нечувствительности, которые присутствуют в модели центра тяжести. Метод на основе отношения площадей определяет принадлежность пикселей к заданному цветовому тону, и после этого расположение цветовой метки в кадре изображения определяется на основе определения центра тяжести распознанных пикселей цветовой метки. В последующем, при перемещении исполнительного механизма в продольном направлении, система технического зрения определяет расположение цветовой метки в новом кадре. Разность положений цветовой метки на исходном и текущем изображениях позволяет определить расстояние смещения цветовой метки. С целью исследования влияния шума на точность распознавания были использованы цифровые фильтры: медианный, Гауссовский, матричный и биноминальный. Анализ точности данных фильтров показал, что лучший результат получен при использовании Гауссовского фильтра. Оценка производилась на основе показателя сигнал-шум. Реализация математической модели распознавания цветовой метки выполнена в среде Matlab/Simulink. Экспериментальные исследования работоспособности системы технического зрения с предложенной нечёткой моделью кластеризации проводились на пневматическом мехатронном комплексе. В ходе экспериментов на корпусе цилиндра закреплялась цветовая метка, после чего цилиндр перемещался по направляющим в продольном направлении. В процессе перемещения выполнялась видеофиксация и распознавание изображений. Для определения точности распознавания цветовой метки рассчитаны коэффициенты PSNR и RMSE, которые составили 38,21 и 3,14 соответственно. Точность определения смещения на основе разработанной модели распознавания цветовых меток достигла 99,7%. Быстродействие дефаззификатора увеличилось до 590 нс.

Бесплатно

Реализация поведенческих функций на спайковых нейронных сетях

Антон Михайлович Корсаков, Александр Валерьевич Бахшиев, Любовь Алексеевна Астапова, Лев Александрович Станкевич

Статья

Рассматривается вопрос моделирования поведенческих функций животных, в частности, моделирование и реализация условного рефлекса. Производится анализ современного состояния нейронных сетей с возможностью структурного реконфигурирования. Моделирование осуществляется посредством нейронных сетей, которые строятся на основе сегментной спайковой модели нейрона с возможностью структурной адаптации к входному паттерну импульсов. Сегментная спайковая модель нейрона способна изменять свою структуру (размер тела клетки, количество и длина дендритов, количество синапсов) в зависимости от поступающего на её входы паттерна импульсов. Приведено краткое описание сегментной спайковой модели нейрона, отмечены её основные особенности с точки зрения возможности её структурного реконфигурирования. Описывается способ структурной адаптации сегментной спайковой модели нейрона к входному паттерну импульсов. Для исследования работы предложенной модели нейрона в сети, в качестве примера обосновывается выбор условного рефлекса, как частного случая формирования ассоциативных связей. Приведено описание структурной схемы и алгоритма формирования условного рефлекса как с положительным, так и с отрицательным подкреплением. Представлено пошаговое описание экспериментов по формированию ассоциативных связей вообще и условного рефлекса (как с положительным, так и с отрицательным подкреплением), в частности. Сделан вывод о перспективности применения спайковых сегментных моделей нейронов для повышения эффективности реализации поведенческих функций в нейроморфных системах управления. Рассмотрены дальнейшие перспективные направления развития нейроморфных систем, основанных на спайковых сегментных моделях нейрона.

Бесплатно

Рекуррентные нейронные сети с непрерывным обучением в задачах многофункциональной обработки новостных потоков

Василий Юрьевич Осипов, Сергей Викторович Кулешов, Дмитрий Игоревич Милосердов, Александра Алексеевна Зайцева, Алексей Юрьевич Аксенов

Статья

Главной задачей использования нейронных сетей является оперативное и точное решение различных творческих задач, таких как анализ и синтез новостных потоков при сохранении непрерывности обучения. Результатом такой обработки могут быть дайджесты, новостные потоки, прошедшие фильтрацию, а также прогнозы событий, позволяющих обеспечивать проактивность в управленческих решениях Известные методы обработки новостей нейронными сетями и реализующие их технические решения не в полной мере обеспечивают решение возникающих в этой области задач. Необходимо расширить их функциональные возможности, совершенствовать пространственно-временное связывание сигналов в рекуррентных нейронных сетях. При обработке новостных потоков одновременно с непрерывным обучением рекуррентных нейронных сетей следует осуществлять селекцию, распознавание, восстановление, прогнозирование и синтез новостей. Для снижения остроты проблемы предлагается перспективный метод многофункциональной обработки новостных потоков с применением рекуррентных нейронных сетей с логической организацией слоев и непрерывным обучением. Метод основан на развитии ассоциативной обработки текстовой информации в потоковых рекуррентных нейронных сетях с управляемыми элементами. Ключевыми особенностями этого метода являются многофункциональная обработка информационных потоков с изменяющимися законами появления новостей. Метод предусматривает оперативный отбор, распознавание, восстановление, прогнозирование и синтез новостей на основе глубокой ассоциативной непрерывной обработки связей между текстовыми элементами. Реализующая предлагаемый метод нейросетевая система отличается от известных решений новыми элементами, связями между ними, а также выполняемыми функциями. По результатам экспериментов подтверждена расширенная функциональность метода. Выявлены новые особенности обработки новостных текстов потоковыми РНС. Предлагаемые решения могут найти применение при создании интеллектуальных систем нового поколения не только для обработки текстов, но и других видов информации.

Бесплатно

Сбалансированная система обнаружения вторжений для беспроводных сенсорных сетей в среде больших данных с использованием модели CNN-SVM

Кураганти Пхани Рама Кришна, Рамакришна Тирумуру

Статья

Беспроводные сенсорные сети (WSN) подвергались нескольким различным проблемам безопасности и атакам, связанным со сбором и отправкой данных. В этом сценарии одной из наиболее распространенных атак WSN, которая может быть нацелена на любой уровень стека протоколов, является атака типа «отказ в обслуживании» (DoS). Текущее исследование предлагает различные стратегии обнаружения атаки в сети. Однако у него есть проблемы с классификацией. Поэтому в этом исследовании для решения этой проблемы была предложена эффективная система обнаружения вторжений на основе ансамблевого глубокого обучения для выявления атак в сети WSN. Предварительная обработка данных включает преобразование качественных данных в числовые с использованием метода One-Hot Encoding. После этого был проведен процесс нормализации. Затем предлагается выбрать лучшее подмножество функций с помощью Manta-Ray Foraging Optimization. Затем метод передискретизации синтетического меньшинства (SMOTE) создает новую выборку меньшинства для балансировки обработанного набора данных. Наконец, предлагается классификатор CNN-SVM для классификации видов атак. Метрики Точность, F-мера, Прецизионность и Отзыв использовались для оценки результатов 99,75%, 99,21%, 100% и 99,6% соответственно. По сравнению с существующими подходами предложенный метод оказался чрезвычайно эффективным при обнаружении DoS-атак в WSN.

Бесплатно

Журнал