Статьи журнала - Информатика и автоматизация (Труды СПИИРАН)
Все статьи: 225
Статья
В статье исследуется влияние непреднамеренных импульсных помех на прием информации в условиях эпизодической синхронизации кадров физического уровня канала спутниковой связи с потоками импульсов помех. Предложена аналитическая модель влияния непреднамеренных импульсных помех на прием информации в спутниковом канале связи в условиях эпизодической синхронизации кадров физического уровня с потоками импульсных помех. На примере стандарта DVB-S2 показано совместное влияние шума и непреднамеренных импульсных помех на условные вероятности ошибок при приеме синхрогруппы, служебной части заголовка и информационной части кадра. Приведены оценки среднего числа кадров физического уровня на длительности интервала эпизодической синхронизации, числа интервалов эпизодической синхронизации и доли элементарных посылок в кадре, подвергшихся воздействию помехи, в зависимости от скважности импульсной помехи. Показано, что существуют такие соотношения между длительностью импульса помехи и скважностью ее следования, при которых явление эпизодической синхронизации кадров физического уровня с потоком импульсных помех оказывает существенное влияние на функционирование канала спутниковой связи. Получены зависимости вероятности ошибочного приема кадра физического уровня канала спутниковой связи от отношения сигнал/помеха при фиксированном отношении сигнал/шум и от длительности импульса помехи. Установлено, что при высоких отношениях сигнал/помеха и длительности помехи, соотносимой с длительностью служебной части кадра, но значительно меньше длительности кадра, вероятность ошибочного приема кадра может быть выше, чем при более низких отношениях сигнал/помеха за счет ошибок при приеме служебной части кадров.
Бесплатно
Модель централизованно-зарезервированного доступа к среде в сетях цифровой радиосвязи
Статья
Централизованно-зарезервированный доступ к среде в сетях цифровой радиосвязи семейства стандартов IEEE 802.11 является альтернативой случайному множественному доступу к среде типа CSMA/CA и в основном используется при передаче голосовых и видеосообщений в режиме реального времени. Область применения централизованно-зарезервированного доступа к среде определяет интерес к нему со стороны злоумышленников. Однако оценка эффективности централизованно-зарезервированного доступа к среде в условиях потенциально возможных деструктивных воздействий не проводилась, а потому сложно определить вклад этих воздействий в снижение эффективности такого доступа. Представлена аналитическая модель централизованно-зарезервированного доступа к среде, учитывающая не только этап его функционирования, но и этап установления в условиях деструктивных воздействий со стороны злоумышленника. Причем в модели этап установления централизованно-зарезервированного доступа к среде отображает последовательную взаимосвязь такого доступа, синхронизации элементов сетей цифровой радиосвязи и случайного множественного доступа к среде типа CSMA/CA. Установлено, что коллизии в канале передачи данных, вызванные деструктивными воздействиями, способны исключить централизованно-зарезервированный доступ к среде еще на этапе его установления. Модель применима при проектировании сетей цифровой радиосвязи семейства стандартов IEEE 802.11, оптимизации работы таких сетей и обнаружении потенциально возможных деструктивных воздействий со стороны злоумышленника.
Бесплатно
Статья
Данный исследовательский обзор сосредоточен на мониторинге надежности вычислительных систем в режиме реального времени на стороне пользователя. В условиях гетерогенной и распределенной вычислительной среды, где отсутствует централизованный контроль, исследуется использование моделей искусственного интеллекта для поддержки процессов принятия решений в мониторинге надежности системы. Методология исследования основана на систематическом отображении предыдущих исследований, опубликованных в научных базах данных IEEE и Scopus. Анализ проведен на основе 50 научных статей, опубликованных с 2013 по 2022 годы, показал растущий научный интерес к данной области. Основное применение исследуемого метода связано с сетевыми технологиями и здравоохранением. Данный метод нацелен на интеграцию сети медицинских сенсоров и управляющих данных с пользовательскими вычислительными устройствами. Однако этот метод также применяется в промышленном и экологическом мониторинге. Выводы исследования показывают, что мониторинг надежности пользовательских вычислительных устройств в режиме реального времени находится на начальной стадии развития. Он не имеет стандартов, но за последние два года приобрел значительное значение и интерес. Большинство исследуемых статей сосредоточены на методах сбора данных с использованием уведомлений для поддержки централизованных стратегий принятия решений. Однако, существует множество возможностей для дальнейшего развития данного метода, таких как совместимость данных, федеративные и совместные модели принятия решений, формализация экспериментального дизайна, суверенитет данных, систематизация базы данных для использования предыдущих знаний и опыта, стратегии калибровки и повторной корректировки для источников данных.
Бесплатно
На пути к автоматизированному и оптимальному проектированию систем IIoT
Статья
В современном мире Интернет вещей стал неотъемлемой частью нашей жизни. Растущее число умных устройств и их повсеместное распространение усложняют разработчикам и системным архитекторам эффективное планирование и внедрение систем Интернета вещей и промышленного Интернета вещей. Основная цель данной работы – автоматизировать процесс проектирования промышленных систем Интернета вещей при оптимизации параметров качества обслуживания, срока службы батареи и стоимости. Для достижения этой цели вводится общая четырехуровневая модель туманных вычислений, основанная на математических множествах, ограничениях и целевых функциях. Эта модель учитывает различные параметры, влияющие на производительность системы, такие как задержка сети, пропускная способность и энергопотребление. Для нахождения Парето-оптимальных решений используется генетический недоминируемый алгоритм сортировки II, а для определения компромиссных решений на Парето-фронте – метод определения порядка предпочтения по сходству с идеальным решением. Оптимальные решения, сгенерированные этим подходом, представляют собой серверы, коммуникационные каналы и шлюзы, информация о которых хранится в базе данных. Эти ресурсы выбираются на основе их способности улучшить общую производительность системы. Предлагаемая стратегия следует трехэтапному подходу для минимизации размерности и уменьшения зависимостей при исследовании пространства поиска. Кроме того, сходимость оптимизационных алгоритмов улучшается за счет использования предварительно настроенной начальной популяции, которая использует существующие знания о том, как должно выглядеть решение. Алгоритмы, используемые для генерации этой начальной популяции, описываются подробно. Для иллюстрации эффективности автоматизированной стратегии приводится пример ее применения.
Бесплатно
Нечетко-логические методы в задаче детектирования границ объектов
Статья
Рассматривается задача уменьшения вычислительной сложности методов выделения контуров на изображениях. Решение поставленной задачи достигается модификацией детектора Канни двумя нечетко-логическими методами, позволяющими сократить число проходов по исходному изображению: в-первом случае, путем исключения двух проходов, связанных с определением наличия соседства претендующего на границу пикселя со смежными в рамке размером 3´3, а во-втором случае, исключением операции определения угла направления градиента путем формирования данной величины комбинацией нечетких правил. Целью работы является уменьшение времени детектирования границ объектов на фото- видео-изображениях, за счет уменьшения вычислительной сложности применяемых методов. Интеллектуализация процесса детектирования границ осуществляется частичным повтором вычислительных операций, используемых в детекторе Канни, с дальнейшей заменой наиболее сложных вычислительных процедур. В предлагаемых методах после определения величины градиента и угла его направления осуществляется фаззификация восьми входных переменных, в качестве которых используется разность градиентов между центральной и смежными ячейками в рамке размером 3´3. Затем строится база нечетких правил. В первом методе в зависимости от угла направления градиента используются четыре нечетких правила и исключается один проход. Во втором методе шестнадцать нечетких правил сами задают угол направления градиента, при этом исключается два прохода вдоль изображения. Разность градиентов между центральной ячейкой и смежными ячейками позволяет учитывать форму распределения градиента. Затем на основе метода центра тяжести осуществляется дефаззификация результирующей переменной. Дальнейшее использование нечетких a-срезов позволяет осуществить бинаризацию результирующего изображения с выделением на нем границ объектов. Для оценки вычислительной скорости работы предложенных нечетких методов детектирования границ в среде Microsoft Visual Studio было разработано программное обеспечение. Представленные экспериментальные результаты показали, что уровень шума зависит от величины a-среза и параметров меток трапециевидных функций принадлежности. Ограничением двух методов является использование кусочно-линейных функций принадлежности. Экспериментальные исследования работоспособности предложенных методов детектирования контуров показали, что время первого нечеткого метода на 18% быстрее по сравнению с детектором Канни и на 2 % по отношению ко второму нечеткому методу. Однако при визуальной оценке установлено, что второй нечеткий метод лучше определяет границы объектов.
Бесплатно
Новый метод оптимального сокращения множества признаков
Статья
Рассматривается задача нахождения минимального по размеру множества атрибутов, используемых для распределения многомерных объектов по классам, например на основе деревьев решений. Задача имеет важное значение при разработке высокопроизводительных и точных классифицирующих систем. Приведен краткий сравнительный обзор известных методов. Задача сформулирована как отыскание минимального (взвешенного) покрытия на различающей 0,1-матрице, которая служит для описания возможности атрибутов разделять пары объектов из разных классов. Приведено описание способа построения различающей матрицы. Сформулированы и решены на основе общего разрешающего принципа групповых резолюций следующие варианты задачи: отыскание минимального по размеру множества атрибутов на заданном входном наборе данных; отыскание минимального по размеру множества атрибутов с минимальным суммарным весом атрибутов (в качестве весов атрибутов можно использовать величины, определяемые на основе известных алгоритмов, например на основе метода RELIEF); нахождение оптимального взвешенного нечеткого покрытия для случая, когда элементы различающей матрицы принимают значения в диапазоне [0,1]; определение статистически оптимального покрытия различающей матрицы (например, для входных наборов данных больших размеров). Статистически оптимальный алгоритм позволяет ограничить время решения полиномом от размеров задачи и плотности единичных элементов в различающей матрице и при этом обеспечить близкую к единице вероятность отыскания точного решения. Таким образом, предлагается общий подход к определению минимального по размеру множества атрибутов, учитывающий различные особенности в постановке задачи, что отличает данный подход от известных. Изложение содержит многочисленные иллюстрации с целью придать ему максимальную ясность. Ряд теоретических положений, приводимых в статье, основывается на ранее опубликованных результатах. В заключительной части представлены результаты экспериментов, а также сведения о сокращении размерности задачи о покрытии для больших массивов данных. Отмечаются некоторые перспективные направления изложенного подхода, включая работу с неполными и качественными данными, интегрировании управляющей модели в систему классификации данных.
Бесплатно
О стохастической оптимизации энергопотребления процессора смартфона
Статья
Увеличение времени работы смартфона — это постоянное стремление, которое с каждым годом становится все более и более важным. Это может быть достигнуто с помощью более совершенного оборудования или путем внедрения в программное обеспечение практик с учетом энергопотребления, и последний подход является более доступным. Поскольку ЦП является одним из самых энергоемких устройств для смартфонов, динамическое масштабирование частоты напряжения (DVFS) представляет собой метод настройки частоты ЦП в соответствии с текущими вычислительными потребностями, и уже были разработаны различные алгоритмы, как энергосберегающие, так и энергонезависимые. Следуя нашей предыдущей работе по этому вопросу, мы предлагаем новый подход DVFS для использования стохастической аппроксимации одновременных возмущений (SPSA) с двумя зашумленными наблюдениями для отслеживания оптимальной частоты и реализации нескольких алгоритмов на его основе. Кроме того, мы также решаем проблему аппаратной задержки между сигналом для ЦП об изменении частоты и ее фактическим обновлением. Поскольку ОС Android может использовать планировщик задач по умолчанию или планировщик с учетом энергопотребления, который способен использовать преимущества разнородных архитектур мобильных ЦП, таких как ARM big.LITTLE, мы также исследуем схему интеграции между предлагаемыми алгоритмами и планировщиками ОС. Представлена методология тестирования на основе моделей для сравнения разработанных алгоритмов с существующими, а также описан набор тестов, отражающий реальные сценарии использования. Наши эксперименты показывают, что алгоритм на основе SPSA хорошо работает с EAS с упрощенной схемой интеграции, демонстрируя производительность ЦП, сравнимую с другими алгоритмами DVFS с учетом энергопотребления, и снижение энергопотребления.
Бесплатно
Статья
Интеграция методологического базиса нескольких разных наук при междисциплинарных исследованиях является характерной чертой новых механизмов решения современных прикладных задач. Формируемые теоретические основы аэролимнологии, как нового научного направления, рассматриваются с точки зрения вклада в нее трех ключевых наук: лимнологии, информатики и робототехники. Приведены классификации методов и способов лимнологических исследований, воздушных робототехнических средств, информационных технологий, перспективных для решения задач в области аэролимнологии. Задача научного направления аэролимнологии формулируется как изучение возможностей и ограничений комбинированных способов дистанционного сенсорного измерения, роботизированного пробоотбора и аналитического исследования параметров экосистем пресных водоемов для мониторинга и предсказания динамики их развития. Среди основных направлений аэролимнологических исследований выделены: построение ортофотопланов и фотограмметрических пространственных моделей рельефа дна и отдельных элементов донного ландшафта и прибрежной зоны разного масштаба; геолого-геофизическое картирование подводной части береговой зоны; изучение фитопланктона, в частности «цветения» воды, вызванного цианобактериями; исследование распределения и миграций крупных представителей гидрофауны; изучение температурных полей и процессов перераспределения водных масс. Обсуждаются ограничения, накладываемые на использование беспилотных летательных аппаратов (БпЛА) при пробоотборе и мониторинге прибрежных водных территорий, прежде всего погодно-климатические, временные, пространственные, технические. Преимущество использования беспилотных летательных аппаратов в аэролимнологии обосновывается увеличением скорости получения данных, возможностью подлета к труднодоступным и территориально удаленным объектам, снижением влияния человеческого фактора. Научная новизна представленного исследования состоит в попытке интеграции междисциплинарных знаний при использовании беспилотных летательных аппаратов и обработке полученных данных на основе технологий искусственного интеллекта при изучении лимнологических объектов и процессов. Отмечается важная роль геоинформационных систем и приводятся примеры карт типизации берегов и геоморфологии Ладожского озера, размещенные на сайте Центра коллективного пользования научным оборудованием «Северо-Западный центр мониторинга и прогнозирования развития территорий» СПБ ФИЦ РАН. Рассматриваются основные этапы методологии проведения аэролимнологических исследований с применением междисциплинарных подходов на основе лимнологии, информатики и робототехнических средств, функционирующих в разных средах.
Бесплатно
О целесообразности и возможностях аппроксимации звена с чистым запаздыванием
Статья
При решении задач управления объектом с запаздыванием часто необходимо аппроксимировать звено чистого запаздывания минимально фазовым звеном, чтобы обеспечить возможность использования аналитических методов для проектирования регулятора. Существует множество методов аппроксимации, основанных на разложении в ряд Тейлора, а также модифицированных методов. Наиболее известен метод аппроксимации Паде. Известные методы аппроксимации имеют существенные недостатки, которые выявляет данная работа. Однако существуют и другие способы формирования других типов фильтров, которые могут служить лучшим приближением при определении соотношения задержек, хотя они и не используются для этих целей. В частности, известны способы формирования искомого дифференциального уравнения замкнутой системы заданного порядка методом численной оптимизации. В этом случае замкнутая система ведет себя как фильтр соответствующего порядка, числитель которого равен единице, а указанный полином стоит в знаменателе. Моделирование показало, что такой фильтр является эффективной альтернативной аппроксимацией звена задержки и может использоваться для тех же целей, для которых предполагалось использовать аппроксимацию Паде. Полиномиальные коэффициенты в литературе рассчитывались только до 12-го порядка. Чем выше порядок полинома, тем точнее аппроксимация.
Бесплатно
О частичной устойчивости нелинейных дискретных систем с запаздыванием
Статья
Рассматривается система нелинейных дискретных (конечно-разностных) уравнений общего вида с ограниченным запаздыванием. Интерес к задачам устойчивости таких систем в последние годы значительно возрос; в частности, это связано с актуальными проблемами управления через сеть. В основном анализируется задача устойчивости по всем переменным нулевого положения равновесия, поскольку заменой переменных к такой задаче сводится задача устойчивости по всем переменным любого решения рассматриваемой системы. Одним из основных методов исследования является дискретно-функциональный вариант прямого метода Ляпунова, получивший существенное развитие в теоретическом и прикладном аспектах. В данной статье предполагается, что рассматриваемая система уравнений допускает «частичное» (нулевое) положение равновесия, и ставится задача устойчивости по отношению к части определяющих это положение равновесия переменных. Такая задача относится к более общим задачам частичной устойчивости, которые исследуются для нелинейных динамических систем различной формы математического описания. Предложенная постановка задачи частичной устойчивости дополняет круг указанных исследований применительно к классу рассматриваемых систем. Для решения поставленной задачи применяется метод функционалов Ляпунова – Красовского в пространстве дискретных функций при соответствующей конкретизации требований к функционалам. Ослабления таких требований можно добиться введением дополнительных дискретных функций, посредством которых: 1) проводится корректировка области функционального пространства, где строятся функционалы Ляпунова – Красовского; 2) находятся оценки функционалов и их разностей (приращений) в силу рассматриваемой системы. В результате используемые функционалы и их разности (приращения) могут быть знакопеременными в области функционального пространства, обычно рассматриваемой при анализе частичной устойчивости. На основе предложенного подхода получены достаточные условия частичной устойчивости (асимптотической устойчивости) указанного вида. Особенности подхода показаны на примере двух классов нелинейных систем заданной структуры, для которых частичная устойчивости анализируется в пространстве параметров. При этом обращается внимание на целесообразность использования семейства функционалов.
Бесплатно
Статья
Использование пестицидов и загрязнение окружающей среды в садах можно значительно снизить, сочетая опрыскивание с переменной скоростью с пропорциональными системами управления. В настоящее время фермеры могут использовать опрыскивание с переменной скоростью для применения средств от сорняков только там, где они необходимы, что обеспечивает экологически чистые и экономичные химические средства для защиты растений. Кроме того, серьезной проблемой является ограничение использования пестицидов в качестве средств защиты растений (СЗР) при сохранении надлежащего отложения растительного покрова. Кроме того, автоматические опрыскиватели, которые регулируют норму внесения в соответствии с размером и формой садовых насаждений, показали значительный потенциал для сокращения использования пестицидов. Для автоматического распыления в существующем исследовании использовались искусственная нейронная сеть (ИНС) и машинное обучение. Кроме того, эффективность опрыскивания можно повысить за счет снижения потерь при распылении из-за осаждения на грунт и нецелевого сноса. Таким образом, это исследование включает в себя тщательное изучение существующих методов опрыскивания с переменной скоростью в садах. Помимо предоставления примеров их прогнозов и краткого рассмотрения влияния на параметры опрыскивания, в нем также представлены различные альтернативы предотвращению чрезмерного использования пестицидов и исследуются их преимущества и недостатки.
Бесплатно
Обмен навигационной информацией для оперативного управления дорожным движением
Статья
Снижение эффективности грузопассажирских перевозок в условиях городской инфраструктуры определяется ростом числа автомобилей, опережающим развитие сети дорог. Моделирование неравномерности потоков во времени (час пик) выявило ключевое значение интервала движения транспортных средств как фактора борьбы с эффектом аккумуляции при снижении средней скорости в условиях загруженности дорог. Снижение эффективного времени реакции водителя, определяющего предельную дистанцию между транспортными средствами, требует минимизации влияния человеческого фактора. Для автоматизации процесса (реализации беспилотного управления транспортом) необходимо обеспечить эффективный обмен навигационной и маршрутной информацией между участниками движения. Совокупности требований к системе информационного обмена лучше всего отвечает коммуникационно-навигационная система (КНС) на базе принципов широковещательной радиосвязи. Ее применение позволяет одновременно повысить и безопасность, и эффективность дорожного движения. Рост безопасности обеспечивается за счет повышения предсказуемости действий соседних участников движения. Для увеличения эффективности в зоне высокой плотности потоков формируются Центры управления транспортом (ЦУТ). Распределенные сети приемо-передающих станций ЦУТ образуют локальную систему позиционирования на принципах трилатерации. Алгоритмы верификации корректности работы бортовых навигационных средств и автоматического разрешения коммуникационных конфликтов обеспечивают высокую надежность функционирования КНС. Отказ от принципов абонентской радиосвязи обеспечивает ее работоспособность даже в условиях очень высокой плотности ТС (несколько тысяч на квадратный километр). В сочетании с передовыми технологиями организации дорожного движения (реализации решетки транспортных магистралей и режима «тотальной зеленой волны») КНС и ЦУТ способны обеспечить среднюю скорость в городских условиях более 45 км/ч. Совокупная экономия затрат на последнюю милю доставки в результате их внедрения оценивается на уровне единиц процентов ВВП даже без учета социальных и экологических эффектов только за счет снижения аварийности и сокращения числа пробок.
Бесплатно
Статья
Возможность подключения автономных транспортных средств к сетям порождает новые возможности для атак и, следовательно, потребность в развитии методов кибербезопасности. Таким образом, важно обеспечить, чтобы мониторинг сети в транспортном средстве включал в себя возможность точно обнаруживать вторжение и анализировать кибератаки на основе данных о транспортных средствах и журналов событий транспортных средств с учетом их конфиденциальности. В статье предложен и оценен метод, использующий характеризующую функцию и проведено его сравнение с подходом, основанным на искусственных нейронных сетей. Визуальный анализ соответствующих потоков событий дополняет оценку. Несмотря на то, что метод с характеризующей функцией на порядок быстрее, точность полученных результатов, по крайней мере, сравнима с таковой, полученной с помощью искусственной нейронной сети. Таким образом, этот метод представляет собой перспективный вариант для реализации во встраиваемых системах автомобиля. Кроме того, важным аспектом использования методов анализа в рамках кибербезопасности является объяснимость результатов обнаружения.
Бесплатно
Статья
Проанализированы предложенные ранее исследователями рекомендации по применению методов многомерного оценивания объектов. Отмечена слабая обоснованность этих рекомендаций, следующая из поверхностной систематизации методов многомерного оценивания. Рекомендации ориентированы не на классы задач многомерного оценивания объектов, а на различные области человеческой деятельности. Однако в каждой сфере человеческой деятельности имеет место широкий спектр задач оценивания объектов различной природы. В связи с этим признана актуальность более тщательной систематизации методов многомерного оценивания. Учитывая разноплановость методов многомерного оценивания, решено ограничиться систематизацией методов, применяющих оценочные функции, и на этой основе предложить общие рекомендации по их применению. Обзор методов многомерного оценивания с единой позиции потребовал уточнения применяемой в них терминологии. На основе формальной модели установлены отношения между понятиями «предпочтение», «критерий» и «показатель». Для выделения методов, применяющих оценочные функции, введено понятие целевого значения показателя. Относительно его расположения на шкале показателя введены понятия идеальной и реальной целей. Соответствующие этим целям критерии разделены на целевые и ограничительные. С применением предложенной терминологии проанализированы наиболее известные методы многомерного оценивания. Из них выделена группа методов, применяющих оценочные функции. Рассмотрены варианты оценочных функций, создаваемых на основе критерия и постулатов теории ценности и полезности. На основе сходства областей определения и значений различных оценочных функций установлена взаимосвязь между ними. Относительно целевого значения показателя они разделены на функции достижения цели и функции отклонения от цели. Показана взаимная дополнительность этих функций. Выделена группа функций отклонения от цели, которая позволяет упорядочивать объекты раздельно по штрафам и поощрениям относительно достижения реальной цели. Для отношения соответствия введено понятие нормы. На примере медицинских анализов показано практическое применение функций отклонения от нормы с применением как минимаксной, так и средневзвешенной обобщающей функции для установления рейтинга на множестве объектов. Выявленное в процессе исследования сходство и различие оценочных функций положено в основу классификации использующих их методов многомерного оценивания. Различие оценочных функций по трудоемкости их создания отражено в предложенной методике их применения.
Бесплатно
Статья
Оппортунистическая маршрутизация повысила эффективность и надежность в самоорганизующихся сетях когнитивной радиосвязи (CRAHN). Многие исследователи разработали модели оппортунистической маршрутизации, в том числе модель оппортунистической маршрутизации на базе карты спектра (SMOR), которая считается более эффективной моделью в этой области. Однако в SMOR существуют определенные ограничения, которые требуют внимания и устранения. В данной статье рассматривается проблема задержки и ухудшения коэффициента доставки пакетов из-за неучета пропускной способности сети. Чтобы решить эти проблемы, в базовой модели маршрутизации SMOR используется гибридный алгоритм оптимизации, состоящий из алгоритмов оптимизации Firefly и Grey Wolf. Разработанная таким образом гибридная модель маршрутизации SMOR на основе оптимизации Firefly и Grey-Wolf (HFGWOSMOR) повышает производительность за счет высокой локальной и глобальной поисковой оптимизации. Первоначально анализируется взаимосвязь между задержкой и пропускной способностью, а затем устанавливается совместная многолучевая связь. Предлагаемая модель маршрутизации также вычисляет значения энергии принимаемых сигналов в пределах порога полосы пропускания и периода времени, и, следовательно, проблемы с производительностью, обнаруженные в SMOR, решаются. Чтобы оценить её эффективность, предложенная модель сравнивается со SMOR и другими существующими моделями оппортунистической маршрутизации, которые показывают, что предлагаемая модель HFGWOSMOR работает лучше, чем другие модели.
Бесплатно
Статья
В статье разработано вычислительно эффективное алгоритмическое решение задачи оптимальной нелинейной фильтрации оценок информационного воздействия в обобщенной стохастической модели информационного противоборства. Сформированное решение применимо при наличии разнородных правил измерения параметров модели информационного противоборства, на основании которых формируется пара систем стохастических дифференциальных уравнений. Оценка информационного воздействия в модели оптимальной нелинейной фильтрации выполняется по критерию максимального правдоподобия по определяемой эволюции апостериорной условной функции плотности вероятности на заданном интервале наблюдения. Нахождение апостериорной условной функции плотности вероятности в заданный момент времени осуществляется с учетом теоремы сложения вероятностей, как вероятность суммы двух совместных событий, функции плотности которых устанавливаются из численного решения соответствующих робастных уравнений Дункана-Мортенсена-Закаи. Для первого события полагается, что первая система стохастических дифференциальных уравнений является уравнением состояния, а вторая - уравнением наблюдения. Для второго события устанавливается их определение в обратном порядке. Решение робастного уравнения Дункана-Мортенсена-Закаи выполнено в постановке спектрального метода Галёркина при дискретизации интервала наблюдения на подынтервалы и сведении исходного решения к численному рекуррентному исследованию последовательности подзадач по так называемому Yau-Yau’s алгоритму, предполагающему оценку вероятностной меры из решения прямого уравнения Колмогорова при ее последующей коррекции по наблюдению. Для выделения особенностей алгоритмической реализации составленного решения сформирован алгоритм оптимальной нелинейной фильтрации оценок информационного воздействия в обобщенной стохастической модели информационного противоборства при уточнении листинга исполняющей его функции, который представлен псевдокодом. Для выявления предпочтительности составленного алгоритмического решения по оптимальной нелинейной фильтрации оценок информационного воздействия проведена серия вычислительных экспериментов на тестовых выборках большого объема. Результат оценки информационного воздействия, получаемый по предложенному алгоритму, сравнен с определяемым решением: 1) по средневыборочным значением из моделей наблюдения; 2) ансамблевым расширенным фильтром Калмана; 3) алгоритмом фильтрации, предполагающим численное исследование уравнения Дункана-Мортенсена-Закаи. По проведенному апостериорному исследованию выделены количественные показатели, устанавливающие выигрыш составленного алгоритма и границы его применимости.
Бесплатно
Оптимизационный подход к выбору методов обнаружения аномалий в однородных текстовых коллекциях
Статья
Рассматривается задача обнаружения аномальных документов в текстовых коллекциях. Существующие методы выявления аномалий не универсальны и не показывают стабильный результат на разных наборах данных. Точность результатов зависит от выбора параметров на каждом из шагов алгоритма, и для разных коллекций оптимальны различные наборы параметров. Не все из существующих алгоритмов обнаружения аномалий эффективно работают с текстовыми данными, векторное представление которых характеризуется большой размерностью при сильной разреженности. Задача поиска аномалий рассматривается в следующей постановке: требуется проверить новый документ, загружаемый в прикладную интеллектуальную информационную систему (ПИИС), на соответствие хранящейся в ней однородной коллекции документов. В ПИИС, обрабатывающих юридически значимые документы, на методы обнаружения аномалий накладываются следующие ограничения: высокая точность, вычислительная эффективность, воспроизводимость результатов, а также объяснимость решения. Исследуются методы, удовлетворяющие этим условиям. В работе изучается возможность оценки текстовых документов по шкале аномальности путем внедрения в коллекцию заведомо инородного документа. Предложена стратегия обнаружения в документе новизны по отношению к коллекции, предполагающая обоснованный подбор методов и параметров. Показано, как на точность решения влияет выбор вариантов векторизации, принципов токенизации, методов снижения размерности и параметров алгоритмов поиска аномалий. Эксперимент проведен на двух однородных коллекциях нормативно-технических документов: стандартов в отношении информационных технологий и в сфере железных дорог. Использовались подходы: вычисление индекса аномальности как расстояния Хеллингера между распределениями близости документов к центру коллекции и к инородному документу; оптимизация алгоритмов поиска аномалий в зависимости от методов векторизации и снижения размерности. Векторное пространство строилось с помощью преобразования TF-IDF и тематического моделирования ARTM. Тестировались алгоритмы Isolation Forest (изолирующий лес), Local Outlier Factor (локальный фактор выброса), OneClass SVM (вариант метода опорных векторов). Эксперимент подтвердил эффективность предложенной оптимизационной стратегии для определения подходящего метода обнаружения аномалий для заданной текстовой коллекции. При поиске аномалии в рамках тематической кластеризации юридически значимых документов эффективен метод изолирующего леса. При векторизации документов по TF-IDF целесообразно подобрать оптимальные параметры словаря и использовать метод опорных векторов с соответствующей функцией преобразования признакового пространства.
Бесплатно
Оптимизация размера ансамбля регрессоров
Статья
Алгоритмы обучения ансамблей, такие как bagging, часто генерируют неоправданно большие композиции, которые, помимо потребления вычислительных ресурсов, могут ухудшить обобщающую способность. Обрезка (pruning) потенциально может уменьшить размер ансамбля и повысить точность; однако большинство исследований сегодня сосредоточены на использовании этого подхода при решении задачи классификации, а не регрессии. Это связано с тем, что в общем случае обрезка ансамблей основывается на двух метриках: разнообразии и точности. Многие метрики разнообразия разработаны для задач, связанных с конечным набором классов, определяемых дискретными метками. Поэтому большинство работ по обрезке ансамблей сосредоточено на таких проблемах: классификация, кластеризация и выбор оптимального подмножества признаков. Для проблемы регрессии гораздо сложнее ввести метрику разнообразия. Фактически, единственной известной на сегодняшний день такой метрикой является корреляционная матрица, построенная на предсказаниях регрессоров. Данное исследование направлено на устранение этого пробела. Предложено условие, позволяющее проверить, включает ли регрессионный ансамбль избыточные модели, т. е. модели, удаление которых улучшает производительность. На базе этого условия предложен новый алгоритм обрезки, который основан на декомпозиции ошибки ансамбля регрессоров на сумму индивидуальных ошибок регрессоров и их рассогласованность. Предложенный метод сравнивается с двумя подходами, которые напрямую минимизируют ошибку путем последовательного включения и исключения регрессоров, а также с алгоритмом упорядоченного агрегирования (Ordered Aggregation). Эксперименты подтверждают, что предложенный метод позволяет уменьшить размер ансамбля регрессоров с одновременным улучшением его производительности и превосходит все сравниваемые методы.
Бесплатно
Основанный на генетическом подходе алгоритм внутрикодирования для H.266/VVC
Статья
Представлен генетический подход для оптимизации внутреннего кодирования в H.266/VVC. Предлагаемый алгоритм эффективно выбирает инструменты кодирования и многотипные древовидные разбиения (MTT) для достижения баланса между временем кодирования и качеством видео. Функция оценки пригодности, которая объединяет показатели восприятия и эффективности кодирования, используется для оценки качества каждого возможного решения. Результаты демонстрируют значительное сокращение времени кодирования без ущерба для качества видео. Предлагаемый алгоритм выбирает инструменты кодирования из набора доступных инструментов в H.266/VVC. Эти инструменты включают режимы внутреннего прогнозирования, единицы преобразования, параметры квантования и режимы энтропийного кодирования. Схема разбиения MTT включает четыре типа разбиений: квадродерево, двоичное дерево, троичное дерево и квадро-двоичное дерево. Показатели восприятия используются для оценки визуального качества закодированного видео. Показатели эффективности кодирования используются для оценки эффективности кодирования закодированного видео. Функция оценки пригодности объединяет показатели восприятия и показатели эффективности кодирования для оценки качества каждого возможного решения.
Бесплатно
Открытие чёрного ящика: Извлечение семантических факторов Осгуда из языковой модели word2vec
Статья
Современные модели искусственного интеллекта развиваются в парадигме чёрного ящика, когда значима только информация на входе и выходе системы, тогда как внутренние представления интерпретации не имеют. Такие модели не обладают качествами объяснимости и прозрачности, необходимыми во многих задачах. Статья направлена на решение данной проблемы путём нахождения семантических факторов Ч. Осгуда в базовой модели машинного обученния word2vec, представляющей слова естественного языка в виде 300-мерных неинтерпретируемых векторов. Искомые факторы определяются на основе восьми семантических прототипов, составленных из отдельных слов. Ось оценки в пространстве word2vec находится как разность между положительным и отрицательным прототипами. Оси силы и активности находятся на основе шести процессно-семантических прототипов (восприятие, анализ, планирование, действие, прогресс, оценка), представляющих фазы обобщённого кругового процесса в данной плоскости. Направления всех трёх осей в пространстве word2vec найдены в простой аналитической форме, не требующей дополнительного обучения. Как и ожидается для независимых семантических факторов, полученные направления близки к попарной ортогональности. Значения семантических факторов для любого объекта word2vec находятся с помощью простой проективной операции на найденные направления. В соответствии с требованиями к объяснимому ИИ, представленный результат открывает возможность для интерпретации содержимого алгоритмов типа "чёрный ящик'' в естественных эмоционально-смысловых категориях. В обратную сторону, разработанный подход позволяет использовать модели машинного обучения в качестве источника данных для когнитивно-поведенческого моделирования.
Бесплатно