Статьи журнала - Информатика и автоматизация (Труды СПИИРАН)

Все статьи: 177

Аналитический обзор подходов к обнаружению вторжений, основанных на федеративном обучении: преимущества использования и открытые задачи

Аналитический обзор подходов к обнаружению вторжений, основанных на федеративном обучении: преимущества использования и открытые задачи

Евгения Сергеевна Новикова, Елена Владимировна Федорченко, Игорь Витальевич Котенко, Иван Иванович Холод

Статья

Для обеспечения точного и своевременного реагирования на различные типы атак системы обнаружения вторжений собирают и анализируют большое количество данных, которые могут включать в том числе и информацию с ограниченным доступом, например, персональные данные или данные, представляющие коммерческую тайну. Следовательно, такие системы могут быть рассмотрены как источник рисков, связанных с обработкой конфиденциальной информации и нарушением ее безопасности. Применение парадигмы федеративного обучения для построения аналитических моделей обнаружения атак и аномалий может значительно снизить такие риски, поскольку данные, генерируемые локально, не передаются какой-либо третьей стороне, а обучение модели осуществляется локально – на источниках данных. Использование федеративного обучения для обнаружения вторжений позволяет решить проблему обучения на данных, которые принадлежат различным организациям, и которые в силу необходимости обеспечения защиты коммерческой или другой тайны, не могут быть выложены в открытый доступ. Таким образом, данный подход позволяет также расширить и разнообразить множество данных, на которых обучаются аналитические модели анализа и повысить тем самым уровень детектируемости разнородных атак. Благодаря тому, что этот подход способен преодолеть вышеупомянутые проблемы, он активно используется для проектирования новых подходов к обнаружению вторжений и аномалий. Авторы систематизировано исследуют существующие решения для обнаружения вторжений и аномалий на основе федеративного обучения, изучают их преимущества, а также формулируют открытые проблемы, связанные с его применением на практике. Особое внимание уделяется архитектуре предлагаемых систем, применяемым методам и моделям обнаружения вторжений, а также обсуждаются подходы к моделированию взаимодействия между множеством пользователей системы и распределению данных между ними. В заключении авторы формулируют открытые задачи, требующие решения для применения систем обнаружения вторжений, основанных на федеративном обучении, на практике.

Бесплатно

Аналитический обзор подходов к распределению задач в группах мобильных роботов на основе технологий мягких вычислений

Аналитический обзор подходов к распределению задач в группах мобильных роботов на основе технологий мягких вычислений

Олег Владимирович Даринцев, Айрат Барисович Мигранов

Статья

Рассматривается использование различных типов эвристических алгоритмов на основе технологий мягких вычислений для распределения задач в группах мобильных роботов, выполняющих односложные операции в едином рабочем пространстве: генетические алгоритмы, муравьиные алгоритмы и искусственные нейронные сети. Показано, что данная задача является NP-сложной и ее решение прямым перебором для большого числа заданий невозможно. Исходная задача сведена к типовым NP-полным задачам: обобщенной задаче поиска оптимальной группы замкнутых маршрутов от одного депо и задаче коммивояжера. Представлены описание каждого из выбранных алгоритмов и сравнение их характеристик. Приводится пошаговый алгоритм работы с учетом выбранных генетических операторов и их параметров при заданном объеме популяции. Представлена общая структура разработанного алгоритма, позволяющего достаточно эффективно решить многокритериальную оптимизационную задачу с учетом временных затрат и интегрального критерия эффективности роботов, учитывающего энергетические затраты, функциональную насыщенность каждого агента группы и т.д. Показана возможность решения исходной задачи с использованием муравьиного алгоритма и обобщенного поиска оптимальной группы замкнутых маршрутов. Для многокритериальной оптимизации показана возможность линейной свертки полученного векторного критерия оптимальности за счет введения дополнительных параметров, характеризующих групповое управление: общее КПД функционирования всех роботов, затраты энергии на функционирование группы поддержки и энергия на размещение одного робота на рабочем поле. Для решения задачи распределения заданий с использованием нейронной сети Хопфилда произведено ее представление в виде графа, полученного в ходе перехода от обобщенной задачи поиска оптимальной группы замкнутых маршрутов от одного депо к задаче коммивояжера. Показателем качества выбран суммарный путь, пройденный каждым из роботов группы.

Бесплатно

Аналитический обзор систем автоматического определения депрессии по речи

Аналитический обзор систем автоматического определения депрессии по речи

Алёна Николаевна Величко, Алексей Анатольевич Карпов

Статья

В последние годы в медицинской и научно-технической среде возрос интерес к задаче автоматического определения наличия депрессивного состояния у людей. Депрессия является одним из самых распространенных психических заболеваний, непосредственно влияющих на жизнь человека. В данном обзоре представлены и проанализированы работы за последние два года на тему определения депрессивного состояния у людей. Приведены основные понятия, относящиеся к определению депрессии, описаны как одномодальные, так и многомодальные корпусы, содержащие записи информантов с установленным диагнозом депрессии, а также записи контрольных групп, людей без депрессии. Рассмотрены как теоретические исследования, так и работы, в которых описаны автоматические системы для определения депрессивного состояния — от одномодальных до многомодальных. Часть рассмотренных систем решает задачу регрессивной классификации, предсказывая степень тяжести депрессии (отсутствие, слабая, умеренная, тяжелая), а другая часть – задачу бинарной классификации, предсказывая наличие заболевания у человека или его отсутствие. Представлена оригинальная классификация методов вычисления информативных признаков по трем коммуникативным модальностям (аудио, видео и текстовая информация). Описаны современные методы, используемые для определения депрессии в каждой из модальностей и в совокупности. Наиболее популярными методами моделирования и распознавания депрессии в рассмотренных работах являются нейронные сети. В ходе аналитического обзора выявлено, что основными признаками депрессии считаются психомоторная заторможенность, которая влияет на все коммуникативные модальности, и сильная корреляция с аффективными величинами валентности, активации и доминации, при этом наблюдается обратная корреляция между депрессией и агрессией. Выявленные корреляции подтверждают взаимосвязь аффективных расстройств с эмоциональными состояниями человека. В множестве рассмотренных работ наблюдается тенденция объединения модальностей для улучшения качества определения депрессии.

Бесплатно

Аппроксимация временных рядов индексов вегетации (NDVI и EVI) для мониторинга сельхозкультур (посевов) Хабаровского края

Аппроксимация временных рядов индексов вегетации (NDVI и EVI) для мониторинга сельхозкультур (посевов) Хабаровского края

Алексей Сергеевич Степанов, Елизавета Андреевна Фомина, Любовь Викторовна Илларионова, Константин Николаевич Дубровин, Денис Владимирович Федосеев

Статья

Аппроксимация рядов сезонного хода индексов вегетации является основой для эффективного мониторинга сельскохозяйственных культур, их идентификации и автоматизированной классификации пахотных земель. Для пахотных земель Хабаровского края в период с мая по октябрь 2021 года по мультиспектральным снимкам Sentinel-2A (20 м) с использованием маски облачности были построены временные ряды NDVI и EVI. Для приближения временных рядов были использованы пять видов аппроксимирующих функций: функция Гаусса; двойная гауссиана; двойная синусоида; ряд Фурье; двойная логистическая. Были построены и рассчитаны характеристики экстремумов аппроксимированных временных рядов для разных типов пахотных земель: гречихи, многолетних трав, сои, залежи и пара. Было показано, что для каждой сельхозкультуры аппроксимированные кривые сезонного хода имели характерный вид. Как было достоверно установлено (p<0,05), наиболее высокую точность аппроксимации рядов NDVI и EVI показал ряд Фурье (средняя ошибка составила, соответственно, 8,5% и 16,0%). Аппроксимация рядов NDVI с использованием двойной синусоиды, двойной гауссианы и двойной логистической функции приводила к увеличению ошибки до 8,9-10,6%. Аппроксимация рядов EVI на основе двойной гауссианы и двойной синусоиды способствовала росту средней ошибки до 18,3-18,5%. Проведенный апостериорный анализ с использованием критерия Тьюки показал, что для полей с соей, парующих и залежных земель для приближения индексов вегетации достоверно лучше использовать ряд Фурье, двойную гауссиану или двойную синусоиду, для полей с гречихой целесообразно применять ряд Фурье или двойную гауссиану. В целом, средняя ошибка аппроксимации сезонных временных рядов NDVI в 1,5-4 раза меньше, чем ошибка аппроксимации рядов EVI.

Бесплатно

Балансовая модель эпидемии COVID-19 на основе процентного прироста

Балансовая модель эпидемии COVID-19 на основе процентного прироста

Виктор Васильевич Захаров, Юлия Ефимовна Балыкина

Статья

В статье изучается возможность использования альтернативного подхода к прогнозированию статистических показателей эпидемии вируса нового типа. Представлен систематический обзор моделей прогнозирования эпидемий новых инфекций в зарубежной и российской научной литературе. Анализируется точность модели SIR при прогнозировании весенней волны эпидемии COVID-19 в России. В качестве альтернативного подхода к моделированию эпидемии предлагается использование вместо традиционной модели SIR новой дискретной стохастической модели распространения эпидемии CIR, основанной на балансе показателей эпидемии в текущий и прошлые моменты времени. Новая модель описывает динамику общего количества заболевших (С), общего количества выздоровевших и умерших (R) и числа активных случаев (I). Параметрами системы являются процентный прирост величины C(t) и характеристика динамического баланса эпидемиологического процесса, впервые введенная в этой статье. Сформулирован принцип динамического баланса эпидемиологического процесса, предполагающий наличие у любого процесса свойства близости значений общего количества заболевших в прошлые периоды и значений общего количества выздоровевших и умерших в текущий момент времени. Для вычисления значений характеристики динамического баланса используется задача целочисленного программирования. Продемонстрировано, что в общем случае динамическая характеристика эпидемиологического процесса не является постоянной величиной. Эпидемиологический процесс, динамическая характеристика которого не является постоянной величиной, называется нестационарным. Для построения среднесрочных прогнозов показателей эпидемиологического процесса на промежутках стационарности эпидемиологического процесса разработан специальный алгоритм. Исследован вопрос об использовании этого алгоритма на промежутках стационарности и нестационарности. Приведены примеры применения модели CIR для построения прогнозов рассматриваемых показателей эпидемии в России в мае-июне 2020 года.

Бесплатно

Безопасность протокола поиска и верификации в многомерном блокчейне

Безопасность протокола поиска и верификации в многомерном блокчейне

Илья Михайлович Шилов, Данил Анатольевич Заколдаев

Статья

Проблема безопасного обмена информацией и проведения транзакций между устойчивыми распределенными реестрами является одной из наиболее актуальных в сфере проектирования и построения децентрализованных технологий. До настоящего времени были предложены подходы, ориентированные на ускорение проверки цепочки блоков для верификации транзакций в соседних блокчейнах. При этом проблема поиска ранее не затрагивалась. В работе рассмотрен вопрос безопасности обмена данными между самостоятельными устойчивыми распределенными реестрами в рамках многомерного блокчейна. Описаны принципы и основные этапы работы протокола, а также базовые требования, предъявляемые к нему. Предложены способы построения протокола обмена сообщениями для верификации внешних транзакций: централизованный подход, принцип подмножества и стойкий SVP. Доказана эквивалентность централизованного подхода идеальному функционалу поиска и верификации в GUC-моделях. Показана вероятность успешной верификации в случае использования подхода, основанного на подмножествах, при применении полного графа сети или эквивалентного подхода с полным графом между родительским и дочерним блокчейнами. Доказана небезопасность случая со связью 1 к 1 между родительским и дочерним реестром, а также небезопасность подхода, основанного на подмножестве узлов родительского и дочернего реестров. Предложен стойкий протокол поиска и верификации блоков и транзакций, основанный на свойствах стойкости устойчивых распределенных реестров. В значительной степени вероятность атаки определяется вероятностью атаки на процесс верификации, а не на процесс поиска. При необходимости защиты от атакующих, контролирующих до половины узлов в сети, предложен метод комбинации подходов для поиска и верификации блоков и транзакций.

Бесплатно

Быстрый трекинг зрачка, основанный на исследовании гранично-ступенчатой модели изображения и многомерной оптимизации методом Хука-Дживса

Быстрый трекинг зрачка, основанный на исследовании гранично-ступенчатой модели изображения и многомерной оптимизации методом Хука-Дживса

Юрий Васильевич Грушко, Роман Иванович Паровик

Статья

Предлагается новый быстрый метод регистрации движения глаз в режиме реального времени на основе исследования гранично-ступенчатой модели полутонового изображения оператором Лапласиан – Гауссиана и нахождения нового предложенного дескриптора накопленных разностей (идентификатора точек), который отображает меру равноудаленности каждой точки от границ некоторой относительно монотонной области (например, зрачок глаза). Работа данного дескриптора исходит из предположения о том, что зрачок в кадре является наиболее округлой монотонной областью, имеющей высокий перепад яркости на границе, пиксели области должны иметь интенсивность меньше заранее заданного порога (но при этом зрачок может не являться самой темной областью на изображении). Учитывая все вышеперечисленные характеристики зрачка, дескриптор позволяет достичь высокой точности детектирования его центра и размера в отличии от методов, основанных на пороговой сегментации изображения, опирающихся на предположение о зрачке как наиболее темной области, морфологических методов (рекурсивная морфологическая эрозия), корреляционных или методов, исследующих только граничную модель изображения (преобразование Хафа и его вариации с двумерным и трехмерным пространствами параметров, алгоритм Starburst, Swirski, RANSAC, ElSe). Исследована возможность представления задачи трекинга зрачка как задачи многомерной оптимизации и ее решение неградиентным методом Хука –Дживса, где в качестве целевой функции выступает функция, выражающая дескриптор. При этом отпадает необходимость в вычислении дескриптора каждой точки изображения (составления специальной аккумуляторной функции), что значительно ускоряет работу метода. Проведен анализ предложенных дескриптора и метода, а также разработан программный комплекс на языке Python 3 (визуализация) и C++ (ядро трекинга) в лаборатории физико-математического факультета Камчатского государственного университета им. Витуса Беринга, позволяющий иллюстрировать работу метода и осуществлять трекинг зрачка в режиме реального времени.

Бесплатно

Верификация разливов нефти на водных поверхностях по аэрофотоснимкам на основе методов глубокого обучения

Верификация разливов нефти на водных поверхностях по аэрофотоснимкам на основе методов глубокого обучения

Маргарита Николаевна Фаворская, Нишчхал Нишчхал

Статья

В статье решается задача верификации разливов нефти на водных поверхностях рек, морей и океанов по оптическим аэрофотоснимкам с использованием методов глубокого обучения. Особенностью данной задачи является наличие визуально похожих на разливы нефти областей на водных поверхностях, вызванных цветением водорослей, веществ, не приносящих экологический ущерб (например, пальмовое масло), бликов при съемке или природных явлений (так называемые «двойники»). Многие исследования в данной области основаны на анализе изображений, полученных от радаров с синтезированной апертурой (Synthetic Aperture Radar (SAR) images), которые не обеспечивают точной классификации и сегментации. Последующая верификация способствует сокращению экологического и материального ущерба, а мониторинг размеров площади нефтяного пятна используется для принятия дальнейших решений по устранению последствий. Предлагается новый подход к верификации оптических снимков как задачи бинарной классификации на основе сиамской сети, когда фрагмент исходного изображения многократно сравнивается с репрезентативными примерами из класса нефтяных пятен на водных поверхностях. Основой сиамской сети служит облегченная сеть VGG16. При превышении порогового значения выходной функции принимается решение о наличии разлива нефти. Для обучения сети был собран и размечен собственный набор данных из открытых интернет-ресурсов. Существенной проблемой является несбалансированность выборки данных по классам, что потребовало применения методов аугментации, основанных не только на геометрических и цветовых манипуляциях, но и на основе генеративной состязательной сети (Generative Adversarial Network, GAN). Эксперименты показали, что точность классификации разливов нефти и «двойников» на тестовой выборке достигает значений 0,91 и 0,834 соответственно. Далее решается дополнительная задача семантической сегментации нефтяного пятна с применением сверточных нейронных сетей (СНС) типа кодировщик-декодировщик. Для сегментации исследовались три архитектуры глубоких сетей, а именно U-Net, SegNet и Poly-YOLOv3. Лучшие результаты показала сеть Poly-YOLOv3, достигнув точности 0,97 при среднем времени обработки снимка 385 с веб-сервисом Google Colab. Также была спроектирована база данных для хранения исходных и верифицированных изображений с проблемными областями.

Бесплатно

Вероятностный анализ безопасности беспроводной системы связи для канала типа Beaulieu-Xie с затенениями

Вероятностный анализ безопасности беспроводной системы связи для канала типа Beaulieu-Xie с затенениями

Алексей Сергеевич Гвоздарев, Татьяна Константиновна Артёмова, Павел Евгеньевич Патралов, Дмитрий Михайлович Мурин

Статья

В работе рассмотрена задача анализа безопасного сеанса на физическом уровне беспроводной системы связи в условиях многолучевого канала распространения сигнала и наличия канала утечки информации. Для обобщения эффектов распространения была выбрана модель канала Beaulieu-Xie с затенениями. Для описания безопасности процесса передачи информации использовалась такая метрика, как вероятность прерывания безопасного сеанса связи. В рамках исследования было получено аналитическое выражение вероятности прерывания связи. Проведён анализ её поведения в зависимости от характеристик канала и системы связи: среднего значения отношения сигнал-шум в основном канале и канале утечки, эффективного значение показателя потерь на пути распространения сигнала, относительного расстояния между законным приемником и прослушивающим приёмником и пороговой пропускной способности, нормированной на пропускную способность гладкого гауссова канала. Рассмотрены совокупности параметров, которые покрывают важные сценарии функционирования беспроводных систем связи. К ним относятся как глубокие замирания (отвечающие гиперрэлеевскому сценарию), так и малые замирания. Учитываются условия наличия существенной по величине компоненты прямой видимости и значительного количества многопутевых кластеров, затенения доминантной компоненты и многопутевость волн, а также всевозможные промежуточные варианты. Обнаружено, что величина энергетического потенциала, необходимого для гарантированной безопасной связи с заданной скоростью, определяется в первую очередь мощностью многопутевых компонент, а также наличие неснижаемой вероятности прерывания безопасного сеанса связи с ростом для каналов с сильным общим затенением компонент сигнала, что с практической точки зрения важно учитывать при предъявлении требований к величинам отношения сигнал/шум и скорости передачи данных в прямом канале, обеспечивающим желаемую степень безопасности беспроводного сеанса связи.

Бесплатно

Вероятностный анализ обобщённой статистической модели многолучевого канала SIMO системы с замираниями и коррелированными затенениями

Вероятностный анализ обобщённой статистической модели многолучевого канала SIMO системы с замираниями и коррелированными затенениями

Алексей Сергеевич Гвоздарев, Павел Евгеньевич Патралов

Статья

Рассмотрена задача анализа характеристик процесса передачи информации многоэлементными системами связи в условиях многолучевого канала распространения сигнала. Для обобщения эффектов распространения была выбрана модель канала κ–μ с коррелированными затенениями, а в качестве используемой технологии организации многоэлементной системы – SIMO система, использующая дифференциально-взвешенное комбинирование сигнала на приёмной стороне. Для описания характеристик процесса передачи информации использовался подход на основе статистик высшего порядка эргодической пропускной способности. В рамках исследования были получены аналитические выражения для статистик произвольного порядка для рассматриваемой модели канала. Проведён анализ поведения первых четырёх статистик (эргодической пропускной способности, величины надёжности, коэффициентов асимметрии и эксцесса) в зависимости от характеристик канала (количества многопутевых кластеров распространения, доли мощности, приходящейся на доминантные компоненты, степени затенения доминантных компонент и коэффициента корреляции затенений). В рамках исследования были рассмотрены 4 ситуации поведения исследуемой модели канала, существенно различающиеся по своим свойствам. Отмечено, что в отличие от пропускной способности, статистики высшего порядка оказываются существенно более чувствительными к параметрам канала и, как следствие, являются более значимыми индикаторами флуктуации скорости передачи информации в канале связи. Обнаружено наличие ярко выраженного экстремума (минимума) зависимости надёжности эргодической пропускной способности от среднего соотношения сигнал/шум, что с практической точки зрения важно учитывать при предъявлении требований к величине отношения сигнал/шум в канале, обеспечивающей желаемое качество функционирования системы связи.

Бесплатно

Взаимное влияние интеллектуального капитала и информационных технологий управления

Взаимное влияние интеллектуального капитала и информационных технологий управления

Борис Владимирович Соколов, Дмитрий Николаевич Верзилин, Татьяна Геннадьевна Максимова, Минь Чжан

Статья

На сегодняшний день существует общее представление об интеллектуальном капитале, разработаны различные подходы к его измерению на микро- и макроуровне. Разработаны методы патентной аналитики для анализа технологических трендов. На концептуальном уровне известно, что существует взаимовлияние интеллектуального капитала и технологических трендов, но отсутствуют методические разработки для количественного оценивания такого влияния с использованием данных из различных источников. Цель исследования заключается в количественном оценивании взаимного влияния национального интеллектуального капитала и современных информационных технологий управления на макроуровне. Рассмотрены математические основания разделения компонентов интеллектуального капитала и технологий. Подтверждена гипотеза о статистической значимости взаимовлияния интеллектуального капитала и информационных технологий управления. Определена регрессионная зависимость, которая достаточно хорошо аппроксимируется линейной регрессией индекса интеллектуального капитала от логарифма индекса патентной активности страны в области IT-методов управления, что может быть интерпретировано как замедление роста индекса интеллектуального капитала при достижении определенного уровня патентной активности. Установлено, что чем более развита экономика, тем выше в ней уровень интеллектуального капитала и выше уровень распространения IT-методов управления. Явными исключениями из этой закономерности являются Китай и Индия. Китай, который относится к странам с доходом выше среднего уровня, демонстрируют более высокие, чем страны его уровня экономического развития, взаимосвязанные значения индекса интеллектуального капитала и распространенности IT-методов управления. Индия, занимающая 3-е место среди стран с уровнем дохода ниже среднего, имеет соизмеримые показатели развития интеллектуального капитала и распространения IT-методов управления со странами с уровнем дохода выше среднего. Дальнейшие исследования могут быть связаны с проверкой гипотез о возможности выявления предложенным методом количественных зависимостей между интеллектуальным капиталом и технологическим развитием. Необходима детализация выявленных зависимостей по кодам Международной патентной классификации и составляющим интеллектуального капитала, выявление зависимостей для других технологических областей.

Бесплатно

Восстановление дискретной временной последовательности сигнала на основе локальной аппроксимации с использованием ряда Фурье по ортогональной системе тригонометрических функций

Восстановление дискретной временной последовательности сигнала на основе локальной аппроксимации с использованием ряда Фурье по ортогональной системе тригонометрических функций

Владимир Николаевич Якимов

Статья

В статье рассмотрена разработка математического и алгоритмического обеспечения для восстановления отсчетов на проблемных участках дискретной последовательности непрерывного сигнала. Цель работы состояла в том, чтобы обеспечить восстановление утраченных отсчетов или участков отсчетов с непостоянной искаженной временной сеткой при осуществлении дискретизации сигнала с равномерным шагом и одновременно обеспечить снижение вычислительной сложности цифровых алгоритмов восстановления. Решение поставленной задачи осуществлено на основе метода локальной аппроксимации. Спецификой применения этого метода стало использование двух подпоследовательностей отсчетов, расположенных симметрично по отношению к восстанавливаемому участку последовательности. В качестве аппроксимирующей модели используется ряд Фурье по ортогональной системе тригонометрических функций. Оптимальное решение задачи аппроксимации основано на критерии минимума квадратичной погрешности. Для данного вида погрешности получены математические соотношения. Они позволяют оценить ее значение в зависимости от порядка модели и числа отсчетов подпоследовательностей, по которым осуществляется процедура восстановления. Особенность полученных в настоящей работе математических соотношений для восстановления сигнала заключается в том, что они не требуют предварительного вычисления коэффициентов ряда Фурье. Они обеспечивают непосредственно вычисление значений восстанавливаемых отсчетов. При этом в случае выбора четного числа отсчетов в подпоследовательностях, используемых для восстановления, не требуется выполнять операции умножения. Всё это обеспечило снижение вычислительной сложности разработанного алгоритма для восстановления сигнала. Экспериментальные исследования алгоритма осуществлялись на основе имитационного моделирования с использованием модели сигнала, представляющей собой аддитивную сумму гармонических компонент со случайной начальной фазой. Численные эксперименты показали, что разработанный алгоритм обеспечивает результат восстановления отсчетов сигнала с достаточно низкой погрешностью. Алгоритм реализован в виде программного модуля. Работа модуля осуществляется на основе асинхронного управления процессом восстановления отсчетов. Он может быть применен в составе метрологически значимого программного обеспечения систем цифровой обработки сигналов.

Бесплатно

Выявление характеристик индивидуального человеческого капитала сотрудников организации по данным самоотчетов о профессиональных навыках и личностным особенностям

Выявление характеристик индивидуального человеческого капитала сотрудников организации по данным самоотчетов о профессиональных навыках и личностным особенностям

Валерия Фуатовна Столярова, Татьяна Валентиновна Тулупьева, Максим Викторович Абрамов, Валентина Борисовна Салахова

Статья

В области рекрутинга и менеджмента персонала существует задача автоматизации процесса оценки характеристик человеческого капитала, учитывающего в том числе особенности личности сотрудника. Статья посвящена вопросу выявления характеристик индивидуального человеческого капитала, имеющих наибольший вклад в некоторые показатели эффективности сотрудника организации, таких как карьерный успех, по данным их самоотчетов о профессиональных навыках и ответов на вопросы–утверждения о различных психологических аспектах личности. Предлагается общая структура опросного инструментария, опирающегося на самоотчеты сотрудников, а также формализация предполагаемых методов анализа таких вопросов. Для выявления групп респондентов, обладающих схожими профессиональными навыками, было предложено использовать кластерный анализ, который позволяет сохранить сложную структуру их взаимосвязи. Для выявления личностных особенностей сотрудников из вопросов–утверждений предлагается формировать шкалы и посредством методов современной теории тестирования получить оценки латентной переменной, отражающей личностные особенности. На завершающем этапе исследования предполагается использование аппарата регрессии для оценивания взаимосвязи выявленных кластеров и латентных характеристик личности с тем или иным индикатором успешности сотрудника. Предлагаемый подход представляет собой структуру пилотного исследования, позволяющего выделить характеристики человеческого капитала (профессиональные навыки и особенности личности), обладающие наибольшим вкладом в показатели эффективности сотрудника или организации, и направлен на снижение трудозатрат на последующих этапах более подробного и прицельного исследования. Возможности предложенного подхода продемонстрированы на примере данных, собранных среди государственных гражданских служащих различных структур Российской Федерации. В качестве индикатора эффективности сотрудника рассматривается наиболее доступный к наблюдению аспект карьерного успеха, выраженный фактом наличия руководящей должности.

Бесплатно

Выявление экономических сговоров метриками квантовой запутанности

Выявление экономических сговоров метриками квантовой запутанности

Евгений Константинович Семененко, Анна Геннадьевна Белолипецкая, Родион Николаевич Юрьев, Александр Павлович Алоджанц, Игорь Александрович Бессмертный, Илья Алексеевич Суров

Статья

Эффективность экономики обусловлена оперативностью пресечения незаконного поведения хозяйствующих субъектов. В условиях ускорения деловой активности важной частью данного условия становится выявление рыночных сговоров на основе статистики электронных следов. В статье представлено решение этой задачи на основе кванто-теоретического подхода к моделированию принятия решений. А именно, когнитивные состояния субъектов представляются комплекснозначными векторами в пространстве, образованном базисными поведенческими альтернативами, тогда как вероятности принятия решений определяются проекциями этих состояний на соответствующие направления. Согласованность многостороннего поведения при этом соответствует запутанности порождающего когнитивного состояния, степень которой измеряется стандартными квантово-теоретическими метриками. Высокое значение метрики свидетельствует о вероятном наличии сговора между рассматриваемыми субъектами. Полученный таким образом метод выявления поведенческой координации апробирован на открытых данных об участии юридических лиц в государственных закупках за период с 2015 по 2020 годы, доступных на федеральном портале https://zakupki.gov.ru. Для использованной выборки построены квантовые модели примерно 80 тысяч уникальных пар и 10 миллионов уникальных троек ИНН. Достоверность выявления сговоров определялась сравнением подозреваемых с открытыми данными Федеральной антимонопольной службы https://br.fas.gov.ru. Согласно полученным функциям ошибок, половина известных парных сговоров выявляется с достоверностью более 50%, что сравнимо с методами выявления на основе классической корреляции и классической взаимной информации. В трёхстороннем случае, напротив, квантовая модель оказывается практически безальтернативной в силу ограниченности классических метрик двусторонней корреляцией. Половина таких сговоров выявляется с достоверностью 40%. Полученные результаты свидетельствуют об эффективности квантово-вероятностного подхода к моделированию многостороннего экономического поведения. Разработанные метрики могут быть использованы в качестве информативных признаков для аналитических систем и алгоритмов машинного обучения подобной направленности.

Бесплатно

Генерация данных для моделирования атак на БПЛА с целью тестирования систем обнаружения вторжений

Генерация данных для моделирования атак на БПЛА с целью тестирования систем обнаружения вторжений

Елена Сергеевна Басан, Ольга Юрьевна Пескова, Олег Игоревич Силин, Александр Сергеевич Басан, Евгений Сергеевич Абрамов

Статья

На сегодняшний день вопросы, связанные с обеспечением безопасности БПЛА, весьма актуальны. Исследователям необходимо разрабатывать новые методы защиты для своевременного обнаружения атаки и реализации мер по смягчению ее последствий. В работе авторы предлагают новую концепцию обнаружения атак «изнутри» БПЛА. Идея состоит в анализе киберфизических параметров БПЛА, которые могут указывать на атаку и ее возможные последствия. Было определено, что для обнаружения атаки и определения последствий, к которым она может привести, необходимо контролировать не только исходные параметры, но и внутренние кибер-физические параметры БПЛА. Это позволит спрогнозировать возможные последствия нападения и принять экстренные меры. Проработана схема влияния атаки на БПЛА и взаимосвязь с инцидентами безопасности, построенная с использованием онтологического подхода. Рассмотрены две основные сущности БПЛА - физические и цифровые аспекты БПЛА. Также показаны примеры цепочек атак, приводящие к различным последствиям. В обзорной части выполнен анализ методов и алгоритмов обнаружения спуфинговых атак с использованием генераторов данных, на основании которого сделаны выводы об их достоинствах и недостатках. Далее, на основании проведенных экспериментов, авторы предлагают метод оценки качества данных и метод генерации аномальных наборов данных, похожих на реальные данные об атаках, которые могут применяться для разработки и тестирования методов обнаружения и блокирования атак. Описана архитектура экспериментального стенда, который был использован в рамках натурного моделирования. На данном стенде, предназначенном для разбора атак с подменой GPS (GPS-спуфинг), проходила отработка нескольких сценариев нормального полета, а затем нескольких сценариев атаки. По результатам проведенных экспериментов был предложен метод, позволяющий имитировать данные, соответствующие атаке, с требуемой точностью. Также был предложен метод оценки качества сгенерированных данных.

Бесплатно

Геометрический кусочно-кубический интерполяционный многочлен Безье с непрерывностью C2

Геометрический кусочно-кубический интерполяционный многочлен Безье с непрерывностью C2

Мустафа Аббас Фадхель, Зурни Б Омар

Статья

Кривая Безье – это параметрический полином, который применяется для получения хороших методов кусочной интерполяции с большим преимуществом перед другими кусочными полиномами. Следовательно, критически важно построить кривые Безье, которые были бы гладкими и могли бы повысить точность решений. Большинство известных стратегий определения внутренних контрольных точек для кусочных кривых Безье обеспечивают только частичную гладкость, удовлетворяющую первому порядку непрерывности. Некоторые решения позволяют строить интерполяционные полиномы с гладкостью по ширине вдоль аппроксимирующей кривой. Однако они все еще не могут обрабатывать расположение внутренних контрольных точек. Частичная гладкость и неконтролирующее расположение внутренних контрольных точек могут повлиять на точность приблизительной кривой набора данных. Чтобы улучшить гладкость и точность предыдущих стратегий, предлагается новый кусочно-кубический многочлен Безье второго порядка непрерывности C2 для оценки пропущенных значений. Предлагаемый метод использует геометрическое построение для поиска внутренних контрольных точек для каждого смежного подынтервала указанного набора данных. Не только предлагаемый метод сохраняет стабильность и гладкость, анализ ошибок численных результатов также показывает, что результирующий интерполирующий полином более точен, чем те, которые получены с помощью существующих методов.

Бесплатно

Гибридные сетевые структуры и их использование при диагностировании сложных технических систем

Гибридные сетевые структуры и их использование при диагностировании сложных технических систем

Виктор Леонидович Якимов, Георгий Николаевич Мальцев

Статья

Предложен подход к техническому диагностированию сложных технических систем по результатам обработки телеметрической информации внешней системой контроля и диагностирования с использованием гибридных сетевых структур. Рассмотрен принцип построения диагностических комплексов сложных технических систем, обеспечивающий автоматизацию процесса технического диагностирования и основанный на использовании при обработке телеметрической информации моделей в виде гибридных сетевых структур, включающих многослойные нейронные сети и дискретные байесовские сети со стохастическим обучением. Разработаны модель изменения параметров технического состояния сложных технических систем на основе многослойных нейронных сетей, позволяющая сформировать вероятностную оценку отнесения текущей ситуации функционирования сложной технической системы к множеству рассмотренных ситуаций функционирования по отдельным телеметрируемым параметрам, и многоуровневая иерархическая модель технического диагностирования сложных технических систем на основе дискретной байесовской сети со стохастическим обучением, позволяющая агрегировать полученную от нейросетевых моделей информацию и распознавать текущую ситуацию функционирования сложной технической системы. В условиях нештатных ситуаций функционирования сложной технической системы по результатам обработки телеметрической информации локализуются неисправные функциональные узлы и формируется объяснение причины возникновения нештатной ситуации. Детализированы этапы реализации технического диагностирования сложных технических систем с использованием предложенных гибридных сетевых структур при обработке телеметрической информации. Представлен пример использования разработанного подхода к решению задач технического диагностирования бортовой системы космического аппарата. Показаны преимущества предлагаемого подхода к техническому диагностированию сложных технических систем в сравнении с традиционным подходом, основанном на анализе принадлежности значений телеметрируемых параметров заданным допускам.

Бесплатно

Гибридный метод обучения сверточных нейронных сетей

Гибридный метод обучения сверточных нейронных сетей

Андрей Николаевич Голубинский, Андрей Андреевич Толстых

Статья

Предложен гибридный метод обучения сверточных нейронных сетей. Метод заключается в объединении методов второго и первого порядка для разных элементов архитектуры сверточной нейронной сети. Гибридный метод обучения сверточных нейронных сетей позволяет добиваться значительно лучшей сходимости по сравнению с методом обучения сверточных нейронных сетей «Adam» и требует меньше вычислительных операций для реализации. Рассматриваемый метод применим для обучения сетей, на которых происходит паралич обучения при использовании методов первого порядка. Более того, предложенный метод обладает способностью подстраивать свою вычислительную сложность под аппаратные средства, на которых производится вычисление, вместе с тем гибридный метод позволяет использовать подход обучения мини-пакетов. Приведен анализ соотношения вычислений между сверточными нейронными сетями и полносвязными искусственными нейронными сетями. Рассмотрен математический аппарат оптимизации ошибки искусственных нейронных сетей, включающий в себя метод обратного распространения ошибки, алгоритм Левенберга-Марквардта. Проанализированы основные ограничения данных методов, возникающие при обучении сверточной нейронной сети. Проведен анализ устойчивости предлагаемого метода при изменении инициализирующих параметров. Приведены результаты применимости метода в различных задачах.

Бесплатно

Глубокое трансферное обучение на основе спутниковых изображений для классификации землепользования и земного покрова

Глубокое трансферное обучение на основе спутниковых изображений для классификации землепользования и земного покрова

Теклай Тесфазги Уифтер, Юрий Николаевич Разумный, Василий Константинович Лобанов

Статья

Алгоритмы глубокого обучения сыграли важную роль в решении многих комплексных задач, за счет автоматического изучения правил (алгоритмов) на основе выборочных данных, которые затем сопоставляют входные данные с соответствующими выходными данными. Цель работы: выполнить классификацию земных покровов (LULC) спутниковых снимков Московской области на основе обучающих данных и сравнить точность классификации, полученной с применением ряда моделей глубокого обучения. Методы: точность, достигаемая при классификации земных покровов с использованием алгоритмов глубокого обучения и данных космической съёмки, зависит как от конкретной модели глубокого обучения, так и от используемой обучающей выборки. Мы использовали наиболее современные модели глубокого обучения и обучения с подкреплением вкупе с релевантным набором обучающих данных. Для тонкой корректировки параметров моделей и подготовки обучающего набора данных применялись разливные методы, в том числе аугментация данных. Результаты: Применены четыре модели глубокого обучения на основе архитектур Residual Network (ResNet) и Visual Geometry Group (VGG) на основе обучения с подкреплением: ResNet50, ResNet152, VGG16 и VGG19. Последующее до-обучение моделей выполнялось с использованием обучающих данных, собранных спутником ДЗЗ Sentinel-2 на территории Московской области. На основе оценки результатов, архитектура ResNet50 дала наиболее высокую точность классификации земных покровов на территории выбранного региона. Практическая значимость: авторы разработали алгоритм обучения четырёх моделей глубокого обучения с последующей классификацией фрагментов входного космического снимка с присвоением одного из 10 классов (однолетние культуры, лесной покров, травянистая растительность, автодороги и шоссе, промышленная застройка, пастбища, многолетние культуры, жилая застройка, реки и озера).

Бесплатно

Деформирующие преобразования изображений и их применение при аугментации данных для обучения глубоких нейронных сетей

Деформирующие преобразования изображений и их применение при аугментации данных для обучения глубоких нейронных сетей

Александр Анатольевич Сирота, Алексей Викторович Акимов, Ростислав Русланович Отырба

Статья

Проведены исследования возможностей аугментации (искусственного размножения) обучающих данных в задаче классификации с использованием деформирующих преобразований обрабатываемых изображений. Представлены математическая модель и быстродействующий алгоритм выполнения деформирующего преобразования изображения, при использовании которых исходное изображение преобразуется с сохранением своей структурной основы и отсутствием краевых эффектов. Предложенный алгоритм используется для аугментации наборов изображений в задаче классификации, содержащих относительно небольшое количество обучающих примеров. Аугментация исходной выборки осуществляется в два этапа, включающих зеркальное отображение и деформирующее преобразование каждого исходного изображения. Для проверки эффективности подобной техники аугментации в статье проводится обучение нейронных сетей – классификаторов различного вида: сверточных сетей стандартной архитектуры (convolutional neural network, CNN) и сетей с остаточными связями (deep residual network, DRN). Особенностью реализуемого подхода при решении рассматриваемой задачи является также отказ от использования предобученных нейронных сетей с большим количеством слоев и дальнейшим переносом обучения, поскольку их применение несет за собой затраты с точки зрения используемого вычислительного ресурса. Показано, что эффективность классификации изображений при реализации предложенного метода аугментации обучающих данных на выборках малого и среднего объема повышается до статистически значимых значений используемой метрики.

Бесплатно

Журнал