Искусственный интеллект, инженерия данных и знаний. Рубрика в журнале - Информатика и автоматизация (Труды СПИИРАН)
Восстановление аэрофотоснимков сверхвысокого разрешения с учетом семантических особенностей
Статья
В настоящее время происходит активное развитие технологий обработки изображений дистанционного зондирования, включающих как спутниковые снимки, так и аэрофотоснимки, полученные от видеокамер беспилотных летательных аппаратов. Зачастую такие снимки имеют артефакты, связанные с низким разрешением, размытостью фрагментов изображения, наличием шумов и т.д. Одним из способов преодоления таких ограничений является применение современных технологий для восстановления снимков сверхвысокого разрешения на основе методов глубокого обучения. Особенностью аэрофотоснимков является представление текстуры и структурных элементов более высокого разрешения, чем на спутниковых снимках, что объективно способствует лучшим результатам восстановления. В статье приводится классификация методов сверхвысокого разрешения с учетом основных архитектур глубоких нейронных сетей, а именно сверточных нейронных сетей, визуальных трансформеров и генеративно-состязательных сетей. В статье предлагается метод восстановления аэрофотоснимков сверхвысокого разрешения с учетом семантических особенностей SemESRGAN за счет использования на этапе обучения дополнительной глубокой сети для семантической сегментации. При этом минимизируется общая функция потерь, включающая состязательные потери, потери на уровне пикселов и потери воспирятия (сходства признаков). Для экспериментов использовались шесть наборов аннотированных аэрофотоснимков и спутниковых снимков CLCD, DOTA, LEVIR-CD, UAVid, AAD и AID. Было выполнено сравнение результатов восстановления изображений предложенным методом SemESRGAN с базовыми архитектурами сверточных нейронных сетей, визуальных трансформеров и генеративно-состязательных сетей. Получены сравнительные результаты восстановления изображений с применением объективных метрик PSNR и SSIM, что позволило оценить качество восстановления с использованием различных моделей глубоких сетей.
Бесплатно
Статья
В области рекрутинга и менеджмента персонала существует задача автоматизации процесса оценки характеристик человеческого капитала, учитывающего в том числе особенности личности сотрудника. Статья посвящена вопросу выявления характеристик индивидуального человеческого капитала, имеющих наибольший вклад в некоторые показатели эффективности сотрудника организации, таких как карьерный успех, по данным их самоотчетов о профессиональных навыках и ответов на вопросы–утверждения о различных психологических аспектах личности. Предлагается общая структура опросного инструментария, опирающегося на самоотчеты сотрудников, а также формализация предполагаемых методов анализа таких вопросов. Для выявления групп респондентов, обладающих схожими профессиональными навыками, было предложено использовать кластерный анализ, который позволяет сохранить сложную структуру их взаимосвязи. Для выявления личностных особенностей сотрудников из вопросов–утверждений предлагается формировать шкалы и посредством методов современной теории тестирования получить оценки латентной переменной, отражающей личностные особенности. На завершающем этапе исследования предполагается использование аппарата регрессии для оценивания взаимосвязи выявленных кластеров и латентных характеристик личности с тем или иным индикатором успешности сотрудника. Предлагаемый подход представляет собой структуру пилотного исследования, позволяющего выделить характеристики человеческого капитала (профессиональные навыки и особенности личности), обладающие наибольшим вкладом в показатели эффективности сотрудника или организации, и направлен на снижение трудозатрат на последующих этапах более подробного и прицельного исследования. Возможности предложенного подхода продемонстрированы на примере данных, собранных среди государственных гражданских служащих различных структур Российской Федерации. В качестве индикатора эффективности сотрудника рассматривается наиболее доступный к наблюдению аспект карьерного успеха, выраженный фактом наличия руководящей должности.
Бесплатно
Геометрический кусочно-кубический интерполяционный многочлен Безье с непрерывностью C2
Статья
Кривая Безье – это параметрический полином, который применяется для получения хороших методов кусочной интерполяции с большим преимуществом перед другими кусочными полиномами. Следовательно, критически важно построить кривые Безье, которые были бы гладкими и могли бы повысить точность решений. Большинство известных стратегий определения внутренних контрольных точек для кусочных кривых Безье обеспечивают только частичную гладкость, удовлетворяющую первому порядку непрерывности. Некоторые решения позволяют строить интерполяционные полиномы с гладкостью по ширине вдоль аппроксимирующей кривой. Однако они все еще не могут обрабатывать расположение внутренних контрольных точек. Частичная гладкость и неконтролирующее расположение внутренних контрольных точек могут повлиять на точность приблизительной кривой набора данных. Чтобы улучшить гладкость и точность предыдущих стратегий, предлагается новый кусочно-кубический многочлен Безье второго порядка непрерывности C2 для оценки пропущенных значений. Предлагаемый метод использует геометрическое построение для поиска внутренних контрольных точек для каждого смежного подынтервала указанного набора данных. Не только предлагаемый метод сохраняет стабильность и гладкость, анализ ошибок численных результатов также показывает, что результирующий интерполирующий полином более точен, чем те, которые получены с помощью существующих методов.
Бесплатно
Гибридные сетевые структуры и их использование при диагностировании сложных технических систем
Статья
Предложен подход к техническому диагностированию сложных технических систем по результатам обработки телеметрической информации внешней системой контроля и диагностирования с использованием гибридных сетевых структур. Рассмотрен принцип построения диагностических комплексов сложных технических систем, обеспечивающий автоматизацию процесса технического диагностирования и основанный на использовании при обработке телеметрической информации моделей в виде гибридных сетевых структур, включающих многослойные нейронные сети и дискретные байесовские сети со стохастическим обучением. Разработаны модель изменения параметров технического состояния сложных технических систем на основе многослойных нейронных сетей, позволяющая сформировать вероятностную оценку отнесения текущей ситуации функционирования сложной технической системы к множеству рассмотренных ситуаций функционирования по отдельным телеметрируемым параметрам, и многоуровневая иерархическая модель технического диагностирования сложных технических систем на основе дискретной байесовской сети со стохастическим обучением, позволяющая агрегировать полученную от нейросетевых моделей информацию и распознавать текущую ситуацию функционирования сложной технической системы. В условиях нештатных ситуаций функционирования сложной технической системы по результатам обработки телеметрической информации локализуются неисправные функциональные узлы и формируется объяснение причины возникновения нештатной ситуации. Детализированы этапы реализации технического диагностирования сложных технических систем с использованием предложенных гибридных сетевых структур при обработке телеметрической информации. Представлен пример использования разработанного подхода к решению задач технического диагностирования бортовой системы космического аппарата. Показаны преимущества предлагаемого подхода к техническому диагностированию сложных технических систем в сравнении с традиционным подходом, основанном на анализе принадлежности значений телеметрируемых параметров заданным допускам.
Бесплатно
Гибридный метод обучения сверточных нейронных сетей
Статья
Предложен гибридный метод обучения сверточных нейронных сетей. Метод заключается в объединении методов второго и первого порядка для разных элементов архитектуры сверточной нейронной сети. Гибридный метод обучения сверточных нейронных сетей позволяет добиваться значительно лучшей сходимости по сравнению с методом обучения сверточных нейронных сетей «Adam» и требует меньше вычислительных операций для реализации. Рассматриваемый метод применим для обучения сетей, на которых происходит паралич обучения при использовании методов первого порядка. Более того, предложенный метод обладает способностью подстраивать свою вычислительную сложность под аппаратные средства, на которых производится вычисление, вместе с тем гибридный метод позволяет использовать подход обучения мини-пакетов. Приведен анализ соотношения вычислений между сверточными нейронными сетями и полносвязными искусственными нейронными сетями. Рассмотрен математический аппарат оптимизации ошибки искусственных нейронных сетей, включающий в себя метод обратного распространения ошибки, алгоритм Левенберга-Марквардта. Проанализированы основные ограничения данных методов, возникающие при обучении сверточной нейронной сети. Проведен анализ устойчивости предлагаемого метода при изменении инициализирующих параметров. Приведены результаты применимости метода в различных задачах.
Бесплатно
Статья
Алгоритмы глубокого обучения сыграли важную роль в решении многих комплексных задач, за счет автоматического изучения правил (алгоритмов) на основе выборочных данных, которые затем сопоставляют входные данные с соответствующими выходными данными. Цель работы: выполнить классификацию земных покровов (LULC) спутниковых снимков Московской области на основе обучающих данных и сравнить точность классификации, полученной с применением ряда моделей глубокого обучения. Методы: точность, достигаемая при классификации земных покровов с использованием алгоритмов глубокого обучения и данных космической съёмки, зависит как от конкретной модели глубокого обучения, так и от используемой обучающей выборки. Мы использовали наиболее современные модели глубокого обучения и обучения с подкреплением вкупе с релевантным набором обучающих данных. Для тонкой корректировки параметров моделей и подготовки обучающего набора данных применялись разливные методы, в том числе аугментация данных. Результаты: Применены четыре модели глубокого обучения на основе архитектур Residual Network (ResNet) и Visual Geometry Group (VGG) на основе обучения с подкреплением: ResNet50, ResNet152, VGG16 и VGG19. Последующее до-обучение моделей выполнялось с использованием обучающих данных, собранных спутником ДЗЗ Sentinel-2 на территории Московской области. На основе оценки результатов, архитектура ResNet50 дала наиболее высокую точность классификации земных покровов на территории выбранного региона. Практическая значимость: авторы разработали алгоритм обучения четырёх моделей глубокого обучения с последующей классификацией фрагментов входного космического снимка с присвоением одного из 10 классов (однолетние культуры, лесной покров, травянистая растительность, автодороги и шоссе, промышленная застройка, пастбища, многолетние культуры, жилая застройка, реки и озера).
Бесплатно
Идентификация сельскохозяйственных культур с использованием радарных изображений
Статья
Одной из наиболее важных задач в практической сельскохозяйственной деятельности является идентификация сельскохозяйственных культур, произрастающих на отдельных полях в данный момент и ранее. Для снижения трудоемкости процесса идентификации в последние годы используются данные дистанционного зондирования Земли (ДЗЗ), в том числе значения индексов, рассчитываемые по ходу периода вегетации. При этом обработка оптических спутниковых снимков и получение достоверных значений индексов зачастую бывает затруднено из-за облачности во время съемки. Для решения этой проблемы в статье предложено использовать в качестве основного показателя, характеризующего сельскохозяйственную культуру, кривую сезонного хода радарного вегетационного индекса с двойной поляризацией (DpRVI). В период 2017-2020 гг. для идентификации культур на опытных полях Дальневосточного научно-исследовательского института сельского хозяйства (ДВ НИИСХ) было получено и обработано 48 радарных снимков Хабаровского муниципального района Хабаровского края со спутника Sentinel-1 (разрешение 22 м, интервал съемки − 12 дней). В качестве основных идентифицируемых культур выступали соя и овес. Также были добавлены пиксели полей, не занятых данными культурами (кормовые травы, заброшенные поля). Были получены ряды значений DpRVI как для отдельных пикселей и полей, так и аппроксимированные ряды для трех классов. Аппроксимация проводилась с использованием функции Гаусса, двойной логистической функции, квадратного и кубического полиномов. Установлено, что оптимальным алгоритмом аппроксимации является использование двойной логистической функции (средняя ошибка составила 4,6%). В среднем, ошибка аппроксимации индекса вегетации для сои не превышала 5%, для многолетних трав – 8,5%, а для овса – 11%. Для опытных полей общей площадью 303 га с известным севооборотом была проведена классификация взвешенным методом k ближайших соседей (обучающая выборка сформирована по данным 2017-2019 гг, тестовая -2020 г.). В результате верно идентифицировано 90% полей. Общая точность классификации по пикселям составила 73%, что позволило выявить несоответствие реальных границ полей заявленным, определить заброшенные и заболоченные участки. Таким образом, установлено, что индекс DpRVI может быть использован для идентификации сельскохозяйственных культур юга Дальнего Востока и служить основой для автоматического классифицирования пахотных земель.
Бесплатно
Извлечение семантической информации из графических схем
Статья
Рассматривается задача извлечения семантической информации из электронного документа, заданного в формате векторной графики и содержащего графическую модель (схему), построенную с помощью графического редактора. Задача состоит в программном извлечении определенных структурных и параметрических свойств схемы и занесении их в базу данных для последующего использования. На основе проведенного анализа возможностей графических редакторов сделан вывод об актуальности этой задачи для универсальных редакторов, не привязанных к конкретным графическим нотациям и использующих открытые графические форматы документов, что допускает программную обработку. Предлагаемый подход рассматривает графические документы на трёх уровнях абстракции: концептуальном (семантические свойства схемы), логическом (представление семантических свойств на внутреннем уровне документа) и физическом (внутренняя организация графического документа). Решение задачи основано на построении концептуально-логического отображения, то есть отображения концептуальной модели схемы в логическую модель графического документа с учетом его физической модели. В рамках подхода разработан алгоритм построения указанного отображения, представленный в виде объектно-ориентированного псевдокода. Исследование внутренней разметки в открытых графических форматах позволило построить модели идентификации элементов схемы и их соединений между собой, что необходимо для конкретного применения алгоритма. Получены выражения для адресации элементов схемы и доступа к их свойствам. Предложенный подход реализован на основе ситуационно-ориентированной парадигмы, в рамках которой процесс извлечения управляется иерархической ситуационной моделью. Обрабатываемые данные задаются в ситуационной модели в виде виртуальных документов, отображаемых на разнородные внешние источники данных. Для решаемой задачи рассматривается отображение на два варианта форматов векторной графики: на «плоский» файл разметки и на набор таких файлов в электронном архиве. Практическое использование результатов иллюстрируется на примере извлечения семантической информации из графических моделей, разрабатываемых на различных этапах проектирования баз данных.
Бесплатно
Статья
Облачные вычисления (CC) являются известной технологией, которая позволяет пользователям и организациям получать доступ к сервисам в соответствии с их требованиями. Этот метод вычислений предлагает хранилище, платформы развертывания и подходящий доступ к веб-сервисам через интернет. Балансировка нагрузки является важным фактором оптимизации вычислительных ресурсов и хранения. Она направлена на разумное распределение рабочей нагрузки между каждой виртуальной машиной. Было разработано несколько традиционных методов балансировки нагрузки, которые доступны в литературе. Однако достижение эффективной балансировки нагрузки с минимальным временем завершения и улучшенной пропускной способностью остается сложной задачей. Для повышения эффективности балансировки нагрузки был разработан новый метод, известный как индексированный регулируемый метод Ружички балансировки нагрузки глубокого нейронного обучения (RITLBDNL). Основная цель RITLBDNL состоит в том, чтобы повысить пропускную способность и минимизировать время выполнения работы в облаке. В методе RITLBDNL модель глубокого нейронного анализа включает входной слой, два скрытых слоя и выходной слой для улучшения производительности балансировки нагрузки. На входном слое собираются задачи пользователей облака и отправляются на скрытый слой 1. На этом слое балансировщик нагрузки в облачном сервере анализирует состояние ресурсов виртуальной машины в зависимости от энергии, пропускной способности, объема памяти и ЦПУ с использованием индекса сходства Ружички. Затем виртуальные машины классифицируются как перегруженные, слабо загруженные или сбалансированные. Результаты анализа передаются на скрытый слой 2, где выполняется регулируемая балансировка нагрузки для распределения нагрузки с сильно загруженных виртуальных машин на минимально загруженные. Облачный сервер эффективно распределяет рабочую нагрузку между виртуальными машинами с более высокой пропускной способностью и меньшим временем отклика для обработки огромного количества входящих задач. Для оценки результатов экспериментов предложенный метод сравнивается с другими существующими методами балансировки нагрузки. Результат показывает, что предложенный метод RITLBDNL обеспечивает эффективность балансировки нагрузки с увеличением на 7%, пропускной способностью на 46%, уменьшением времени завершения на 41% и времени отклика на 28% по сравнению с традиционными методами.
Бесплатно
Интеллектуальная нейросетевая машина с функциями мышления
Статья
В последние годы существенно вырос интерес к искусственному интеллекту на основе нейросетевых подходов. Получен ряд значимых научных результатов, которые нашли широкое применение на практике. Большое внимание привлекли генеративно – состязательные нейросетевые модели, нейросетевые трансформеры и другие решения. Достигнут очевидный прогресс в нейросетевом распознавании и генерации образов, обработке текстов и речи, прогнозировании событий, управлении трудно формализуемыми процессами. Однако пока не удалось наделить нейросетевые машины мышлением. Все получаемые с использованием нейросетевых машин результаты можно отнести к решениям на основе различных видов связывания сигналов без полноценного управления процессами их обработки. Типичными представителями таких машин выступают ChatGPT. Возможности по интеллектуальному оперированию различными сигналами в известных нейросетевых машинах очень ограничены. Среди основных причин таких ограничений следует выделить несовершенство используемых базовых принципов нейросетевой обработки информации. Свойства нейронов длительное время рассматривались упрощенно. Обуславливалось это, как пробелами в области биологических исследованиях, так и отсутствием возможностей построения больших нейронных сетей на сложных моделях нейронов. В последние годы ситуация изменилась. Появились новые способы реализации больших нейронных сетей. Также установлено, что даже отдельные нейроны могут обладать обширной внутренней памятью и реализовывать различные функции. Однако до сих пор многие механизмы функционирования нейронов и их взаимодействия остаются не раскрытыми. Мало исследованы вопросы управляемого ассоциативного обращения к внутренней памяти нейронов. Эти недостатки существенно сдерживает создание мыслящих нейросетевых машин. Объектом исследования в статье выступает процесс интеллектуальной нейросетевой обработки информации. Предмет исследования: принципы, модели и методы такой обработки. Преследуется цель расширения функциональных возможностей нейросетевых машин по решению трудно формализуемых творческих задач за счет разработки новых принципов, моделей и методов интеллектуальной обработки информации. В интересах достижения этой цели уточняются принципы функционирования интеллектуальных нейросетевых машин, предлагаются новые модели и методы нейросетевой обработки информации. Раскрывается новая модель импульсного нейрона, как базового элемента таких машин. Искусственный мозг нейросетевых машин рекомендуется формировать в виде многослойных нейронных сетей, наделенных логическими структурами, с различными по параметрам нейронами. Предлагается новый метод многоуровневой интеллектуальной обработки информации в нейросетевых машинах на основе умных импульсных нейронов. Поясняются механизмы мышления нейросетевых машин, лежащие в их основе функции интеллектуального оперирования образами и понятиями в нейросетевой памяти. Приводятся результаты моделирования, подтверждающие справедливость предложенных решений.
Бесплатно
Информационные технологии цифровой адаптационной медицины
Статья
В статье дана комплексная характеристика информационных технологий цифровой адаптационной медицины. Акцент сделан на применимость к разработке специализированных автоматизированных комплексов, программных моделей и систем изучения адаптационных возможностей человека к условиям внешней среды. Сформулированы требования к информационным технологиям повышения этих возможностей. Отражены особенности информационных технологий применительно к проведению прикладных системных исследований обеспечения жизнедеятельности, сохранения профессионального здоровья и продления долголетия человека. Охарактеризованы шесть базовых концепций адаптационной медицины с акцентом на особенности математического обеспечения обработки информации, определены приоритеты совершенствования информационных технологий, применяемых в этих концепциях. Рассмотрены информационные технологии, применяемые в задачах обеспечения профессиональной работоспособности человека с акцентом на необходимость применения адекватных методов диагностики состояния человека на всех этапах профессиональной деятельности и необходимости разработки технологий цифровых двойников, адекватно моделирующих адаптационные процессы и реакции организма в реальных условиях. Дана характеристика информационных технологий персонифицированного мониторинга рисков здоровью, позволяющих объективизировать воздействия физических факторов условий деятельности и реализовать индивидуальное и коллективное информирование персонала об опасности окружающей среды. Показана насущная необходимость стандартизации методов обработки информации при разработке информационных технологий цифровой адаптационной медицины в интересах обеспечения физиологической адекватности и математической корректности подходов к получению и обработке информации о состоянии человека. Сделаны выводы о том, что приоритеты совершенствования информационных технологий цифровой адаптационной медицины связаны с внедрением достижений четвёртой промышленной революции, в том числе, концепции социокиберфизических систем.
Бесплатно
Статья
Проблемы организации медицинской помощи в условиях пандемии COVID-19, связанные с неопределенностью и ограниченностью различных ресурсов, привели к необходимости совершенствования систем принятия решений при госпитализации пациентов. С помощью ситуационного управления можно улучшить процесс принятия решений, чтобы он лучше соответствовал текущей ситуации. При этом важным становится учет влияния психологических факторов на решения, принимаемые при госпитализации. В статье предлагается использование коалиционных игр для ситуационного управления при госпитализации больных. Игроками и участниками коалиции являются госпитали, бригады скорой помощи, пациенты и центры компьютерной томографии. Цель игры - сформировать коалицию участников, обеспечивающую максимальную выгоду по времени и стоимости госпитализации в момент принятия решения. Рассмотрены общая схема госпитализации, основные источники информации о ситуации, постановка и формализация проблемы. Проведен эксперимент, в котором проверялось формирование коалиции во время госпитализации на основе данных, полученных при анализе динамики пандемии COVID-19. В связи с малым объемом данных и отсутствием апробированных моделей развития ситуации при проведении расчета часть параметров была оценена с использованием эвристических моделей развития ситуации, основанных на анализе информации из открытых источников информации. Результат эксперимента содержит набор коалиций, обеспечивающих максимальную выгоду, при указанных ограничениях. При этом время расчета коалиционной игры позволяет использовать предложенную модель поддержки принятия решений при госпитализации в диспетчерской службе станций скорой помощи.
Бесплатно
Использование онтологии для анализа английских комментариев в социальных сетях
Статья
Чат-боты заинтересовывают многих пользователей по мере того, как технологии становятся все более продвинутыми. Потребность в обмене информацией между людьми через компьютерные системы увеличивается с каждым днем, в результате чего в большинстве стран растет предпочтение использовать чат-боты. Поскольку Вьетнам является развивающейся страной с множеством этнических групп, требуется усиленное внимание к распространению социальных сетей и расширению кооперативной экономики. Серьезной проблемой стало неуместное использование слов в повседневной жизни. В социальных сетях встречаются неоднозначные отзывы с похвалой и критикой о том, что мы пытаемся уменьшить использование негативной лексики и улучшить качество использования языка в социальных сетях. Мы стремимся удовлетворить потребности пользователей в социальных сетях, способствовать экономическому развитию и более эффективно решать социальные проблемы. Для достижения этих целей предлагается метод глубокого обучения, использующий интеллектуальный анализ онтологических знаний для сбора и обработки комментариев в социальных сетях. Этот подход направлен на улучшение пользовательского опыта и облегчение обмена информацией между людьми путем анализа мнений в комментариях. Результаты экспериментов показывают, что наш метод превосходит традиционный подход.
Бесплатно
Статья
Использование радиолокационных спутниковых данных в мониторинге сельскохозяйственных культур является перспективным дополнением методов и технологий, базирующихся на анализе мультиспектральных изображений. К основным достоинствам радиолокационных вегетационных индексов относится их чувствительность к поляриметрическим свойствам принимаемого сигнала, а также независимость от облачности. Это особенно важно для территории юга российского Дальнего Востока, муссонный климат которого обеспечивает влажную и облачную погоду в период набора сельскохозяйственными культурами максимальной биомассы. Для оценки возможностей радиолокационных спутниковых данных на примере пахотных земель Хабаровского края и Амурской области были проанализированы 64 снимка космического аппарата Sentinel-1 за период наблюдений с мая по октябрь 2021 года. Для каждого снимка были рассчитаны значения индексов DpRVI, RVI, VH/VV и построены временные ряды для всего периода наблюдений по отдельным полям (всего 342 поля). По мультиспектральным снимкам Sentinel-2 с использованием маски облачности были построены временные ряды NDVI. Были рассчитаны характеристики экстремумов временных рядов для разных типов пахотных земель: сои, овса, и залежи. Показано, что для каждой сельхозкультуры кривые сезонного хода DpRVI, RVI, VH/VV имели характерный вид. Установлено, что индекс DpRVI продемонстрировал наиболее высокую устойчивость – коэффициенты вариации сезонного хода DpRVI были существенно ниже показателей для RVI и VH/VV. Также было выявлено, что сходство между сезонным ходом индексов сохранялось для удаленных друг от друга регионов – Хабаровского края и Амурской области. Были рассчитаны основные характеристики сезонного хода временных рядов радиолокационных индексов в сравнении с NDVI – величина максимума, дата наступления максимума и вариабельность этих показателей. Установлено, во-первых, что значения этих показателей в разных регионах схожи между собой; во-вторых, вариабельность максимума и дня наступления максимума для DpRVI ниже, чем для RVI и VH/VV; в-третьих, вариабельность максимума и дня наступления максимума для DpRVI сопоставима с NDVI. Таким образом, можно сделать вывод о том, что временные ряды радиолокационных индексов DpRVI, RVI, VH/VV для основных типов сельскохозяйственных земель Дальнего Востока имеют отличительные особенности и могут быть использованы в задачах классификации, моделирования урожайности и контроля севооборота.
Бесплатно
Статья
Представлен метод итеративной настройки параметров моделей на основе ансамблей деревьев с использованием настройки байесовских гиперпараметров для прогнозирования состояний на примере рака молочной железы. Предлагаемый метод использует три различных набора данных, в том числе набор данных по диагностическому раку молочной железы Висконсина (WDBC), набор данных по надзору, эпидемиологии и конечным результатам (SEER) по раку молочной железы и набор данных по раку молочной железы в Коимбре (BCCD), а также реализует набор данных на основе древовидных ансамблей. Модели, в частности AdaBoost, Gentle-Boost, LogitBoost, Bag и RUSBoost, для прогнозирования рака молочной железы. Байесовская оптимизация использовалась для итеративной настройки гиперпараметров моделей, а производительность моделей оценивалась с использованием нескольких показателей, включая точность, прецизионность, полноту и оценку f1. Наши результаты показывают, что предложенный метод значительно повышает производительность моделей на основе ансамблей деревьев, что приводит к более высокой точности, прецизионности, полноте и оценке f1. По сравнению с другими современными моделями предлагаемый метод более эффективен. Он достиг 100% идеальных результатов по точности, прецизионности, полноте и оценке F1 в наборе данных WDBC. В наборе данных SEER BC точность метода составила 95,9%, прецизионность 97,6%, полнота 94,2% и оценка F1 95,9%. Для набора данных BCCD метод достиг точности 94,7%, прецизионности 90%, полноты 100% и оценки F1 94,7%. Результаты этого исследования имеют важное значение для медицинских работников, поскольку раннее выявление рака молочной железы может значительно повысить шансы на выживание. В целом, это исследование вносит ценный вклад в область прогнозирования рака молочной железы с использованием машинного обучения.
Бесплатно
Калмановская фильтрация одного класса изображений динамических объектов
Статья
Рассматривается задача оценивания состояния динамического объекта по наблюдаемым изображениям, сформированным оптической системой. Цель исследования состоит в реализации нового подхода, обеспечивающего повышение точности автономного слежения за динамическим объектом по последовательности изображений. Используется векторная модель изображения объекта в виде ограниченного количества вершин (базовых точек). Предполагается, что в процессе регистрации объект удерживается в центральной области каждого кадра, поэтому параметры движения могут описываться в виде проекций на оси системы координат, связанной с оптической осью камеры. Новизна подхода состоит в том, что наблюдаемые параметры (расстояние вдоль оптической оси и угловое положение) объекта вычисляются по координатам заданных точек на изображениях объекта. Для оценки состояний объекта строится фильтр Калмана-Бьюси в предположении, что движение динамического объекта описывается совокупностью уравнений поступательного движения центра масс вдоль оптической оси и изменений углового положения относительно плоскости изображения. Приведен пример оценивания углового положения объекта, иллюстрирующий работоспособность предложенного метода.
Бесплатно
Каскадный классификатор для обнаружения и идентификации птиц в видеопотоке
Статья
В статье представлен разработанный метод и прототип программы для определения наличия птиц в видеопотоке данных в режиме реального времени. Этот метод основан на использовании каскадного классификатора, который был применен для решения задачи обнаружения и идентификации птиц в биоакустической установке отпугивания птиц в аэропорту Томска. В рамках исследования был использован каскадный классификатор Виолы-Джонса, который является одной из реализаций алгоритма каскад Хаара. Этот алгоритм позволяет с высокой точностью и скоростью обнаруживать объекты на изображениях и видео. В данном случае классификатор был обучен на наборе данных, содержащем изображения птиц, что позволило достичь высокой точности обнаружения и идентификации птиц на видео. Также приведены результаты оценки возможностей созданного классификатора и продемонстрирована его высокая результативность. В ходе исследования были использованы различные методы машинного обучения и анализа видеоданных, что позволило получить точные и надежные результаты. В целом, данная работа представляет собой инновационный подход к решению актуальной задачи защиты аэропортов от птиц. Применение разработанного метода позволило повысить эффективность работы биоакустической установки отпугивания птиц и обеспечить безопасность полетов в аэропорту Томска, снизив вероятность столкновения самолетов с птицами. Новизна работы заключается в применении метода Виолы-Джонса к задаче обнаружения и идентификации птиц с оценкой его результативности. Таким образом, представленная в статье работа является важным вкладом в развитие методов обнаружения и идентификации объектов на видео и может быть использована в других областях, где требуется автоматическое обнаружение и классификация объектов в видеопотоке данных.
Бесплатно
Статья
Сельское хозяйство является одним из основных источников экономического роста в России; мировое производство яблок в 2019 году составило 87 миллионов тонн. Болезни листьев яблони являются основной причиной ежегодного сокращения производства яблок, что приводит к огромным экономическим потерям. Автоматизированные методы выявления болезней листьев яблони позволяют сократить трудоемкую работу по мониторингу яблоневых садов и раннему выявлению симптомов болезни. В этой статье предложена многослойная сверточная нейронная сеть (MCNN), которая способна классифицировать листья яблони по одной из следующих категорий: парша яблони, черная гниль и болезни яблоневой кедровой ржавчины, используя недавно созданный набор данных. В этом методе мы использовали методы аффинного преобразования и перспективного преобразования для увеличения размера набора данных. После этого операции предварительной обработки на основе метода кадрирования и выравнивания гистограммы OpenCV использовались для улучшения предлагаемого набора данных изображения. Экспериментальные результаты показывают, что система достигает точности обучения 98,40% и точности проверки 98,47% для предложенного набора данных изображения с меньшим количеством параметров обучения. Результаты предполагают более высокую точность классификации предложенной модели MCNN по сравнению с другими известными современными подходами. Эта предложенная модель может использоваться для обнаружения и классификации других типов болезней яблони из разных наборов данных изображений.
Бесплатно
Кластеризация сетей с использованием алгоритма поиска косяков рыб
Статья
Сеть представляет собой совокупность узлов, соединенных ребрами, которые представляют сущности и их взаимосвязи. В кластеризации социальных сетей узлы организованы в кластеры в соответствии с их шаблонами соединений с целью обнаружения сообществ. Выявление структур сообществ в сетях является важным. Однако существующие методы обнаружения сообществ еще не использовали потенциал алгоритма поиска косяков рыб (FSS) и принципов модулярности. Мы предложили новый метод, основанный на кластеризации с использованием алгоритма поиска рыбной школы и функции модулярности (FSC), который улучшает модулярность в кластеризации сети путем итерационного разбиения сети и оптимизации функции модулярности. Этот подход облегчает обнаружение высокомодулярных структур сообществ, улучшая разрешение и эффективность кластеризации сети. Мы протестировали FSC на известных и неизвестных структурах сетей. Также мы протестировали его на сети, сгенерированной с использованием модели LFR, чтобы проверить его производительность на сетях с различными структурами сообществ. Наша методология демонстрирует высокую эффективность в выявлении структур сообществ, что указывает на ее способность эффективно захватывать сплоченные сообщества и точно определять фактические структуры сообществ.
Бесплатно
Статья
Извлечение терминов является важным этапом автоматизированного построения систем знаний на основе естественно-языковых текстов, поскольку обеспечивает формирование базовой системы понятий, используемой затем в прикладных задачах интеллектуальной обработки информации. В статье рассмотрена проблема автоматизированного извлечения терминов из естественно-языковых текстов с целью их дальнейшего использования при построении формализованных систем знаний (онтологий, тезаурусов, графов знаний) в рамках задачи мониторинга тематических обсуждений в социальных медиа. Данная задача характеризуется необходимостью включения в формируемую систему знаний как понятий из нескольких различных предметных областей, так и некоторых общеупотребительных понятий, используемых аудиторией социальных медиа в рамках тематических обсуждений. Кроме того, формируемая система знаний является динамичной как с точки зрения состава охватываемых ею предметных областей, так и состава релевантных понятий, подлежащих включению в систему. Применение существующих классических методов извлечения терминов в данном случае затруднительно, поскольку они ориентированы на извлечение терминов в рамках одной предметной области. Исходя из этого, для решения рассматриваемой задачи предложен комбинированный метод, совмещающий в себе подходы на основе внешних источников знаний, инструментов NER и правил. Результаты проведенных экспериментов демонстрируют эффективность предложенной комбинации подходов к извлечению терминов для задачи мониторинга и анализа тематических обсуждений в социальных медиа. Разработанный метод значительно превосходит по точности существующие инструменты извлечения терминов. В качестве дальнейшего направления исследования рассмотрена возможность развития метода для решения задачи выделения вложенных терминов или сущностей.
Бесплатно