Информатика и автоматизация (Труды СПИИРАН) @ia-spcras
Статьи журнала - Информатика и автоматизация (Труды СПИИРАН)
Все статьи: 287
Статья
Актуальность исследования определяется важностью и сложностью выполнения оперативных обобщений постоянно возрастающего массива пользовательских сообщений в социальных сетях. Предлагается уменьшить сложность решаемой задачи за счет использования роботизированных алгоритмов и их автоматизированной интеллектуальной фокусировки на целевые платформы, доступность данных и их объемы. Рассматривается способность больших языковых моделей (LLMs) генерировать высококачественные, связные и контекстно-зависимые аннотации (рефераты), подходящие для динамической природы неструктурированных, «зашумленных» данных социальных сетей. Представлены особенности технологии RAG LLM при реферировании публикаций социальных сетей. Основным недостатком языковых моделей является нестабильность и сложность прослеживания результатов для подтверждения фактической точности. Авторами предложен гибридный метод для обобщения сообщений в социальных сетях за определенный период времени. Метод заключается в комплексном и вариативном сочетании классических способов извлечений данных из их хранилищ, а также реферативных и генеративных возможностей больших языковых моделей. Большие языковые модели использованы для векторизации анализируемых данных. Применение алгоритмов кластеризации к полученным векторным представлениям позволило повысить стабильность и качество результатов. В рамках технологии RAG возможности больших языковых моделей расширены средствами интеллектуального поиска в используемой для хранения исходных данных базе MongoDB. В работе представлены три конвейера, каждый из которых является вариантом реализации метода и обладает преимуществами и недостатками в различных условиях применения. Приведены используемые для оценки конвейеров метрики и произведен сравнительный анализ. В целом, метод позволяет уменьшить конфабуляции большой языковой модели и получать обобщения публикаций за разные временные периоды в режиме реального времени. Предложенный метод применяется на практике в разработанной авторами системе мониторинга открытых данных социальных медиа.
Бесплатно
Метод интеллектуального планирования миссий автономных подводных аппаратов
Статья
Создание полностью автономных необитаемых подводных аппаратов и комплексов, способных выполнять различные исследовательские и технологические операции в условиях неопределенности, является актуальной задачей. Ключевой проблемой является автоматическая коррекция миссий в реальном времени на основе данных от бортовых систем. Целью данной работы является разработка метода интеллектуального планирования миссий на стратегическом уровне управления автономными подводными робототехническими комплексами, обеспечивающего автоматическое формирование адаптивных планов и их преобразование в исполнительные команды тактического уровня для работы в изменяющихся условиях среды. В статье авторами определены принципы разработки интеллектуального планировщика миссий автономных подводных робототехнических комплексов (АПРК) на стратегическом уровне и менеджера миссий для управления миссией на тактическом уровне с формированием конкретных заданий исполнителям. Разработана формальная модель планирования миссий через множество линейных участков с предусловиями и постусловиями. Ключевым аспектом предложенного решения является использование онтологического подхода для стандартизации описания миссий и обеспечения их программной интерпретации. Создана специализированная среда разработки миссий на облачной платформе IACPaaS, позволяющая экспертам формировать и адаптировать планы миссий без углубления в технические детали. Разработан комплекс инструментальных средств с модульной архитектурой, обеспечивающий масштабируемость и адаптацию решения для различных классов АПРК и типов миссий. Результаты апробации показали, что предложенное решение позволяет формировать гибкие планы, учитывающие разнообразие ситуаций, и автоматически выбирать последовательности команд в зависимости от поступающих данных. Полученные результаты открывает новые возможности для создания полностью автономных подводных комплексов, способных выполнять сложные исследовательские и технологические операции без постоянного контроля оператора. Дальнейшие исследования направлены на совершенствование алгоритмов менеджера миссий, а также на интеграцию планировщика с другими компонентами бортового обеспечения.
Бесплатно
Статья
В стремительно развивающейся цифровой эпохе интерфейсы человеко-машинного взаимодействия непрерывно совершенствуется. Традиционные методы взаимодействия с компьютером, такие как мышь и клавиатура, дополняются и даже заменяются более интуитивными способами, которые включают технологии отслеживания глаз. Обычные методы отслеживания глаз используют камеры, которые отслеживают направление взгляда, но имеют свои ограничения. Альтернативным и многообещающим подходом к отслеживанию глаз является использование электроэнцефалографии, техники измерения активности мозга. Исторически ЭЭГ была ограничена в основном лабораторными условиями. Однако мобильные и доступные устройства для ЭЭГ появляются на рынке, предлагая более универсальное и эффективное средство для регистрации биопотенциалов. В данной статье представлен метод локализации взгляда с использованием электроэнцефалографии, полученной с помощью мобильного регистратора ЭЭГ в виде носимой головной повязки (компании BrainBit). Это исследование направлено на декодирование нейрональных паттернов, связанных с разными направлениями взгляда, с использованием продвинутых методов машинного обучения, в частности, нейронных сетей. Поиск паттернов выполняется как с использованием данных, полученных с помощью носимых очков с камерой для отслеживания глаз, так и с использованием неразмеченных данных. Полученные в исследовании результаты демонстрируют наличие зависимости между движением глаз и ЭЭГ, которая может быть описана и распознана с помощью предсказательной модели. Данная интеграция мобильной технологии ЭЭГ с методами отслеживания глаз предлагает портативное и удобное решение, которое может быть применено в различных областях, включающих медицинские исследования и разработку более интуитивных компьютерных интерфейсов.
Бесплатно
Метод нелинейной фильтрации при неизвестной интенсивности шума в наблюдениях
Статья
В работе изложен метод обратной статистической линеаризации – метод нелинейной фильтрации для оценивания состояний линейно-гауссовских дифференциальных систем с неизвестной интенсивностью шума в наблюдениях. Предложенный метод основан на нелинейном преобразовании разностной ошибки с сохранением коэффициента передачи, используемого в фильтре Калмана-Бьюси. В результате нелинейный фильтр описывается системой дифференциальных уравнений того же порядка, что и вектор состояния без использования уравнений на ковариационную матрицу ошибки. Уравнения нелинейного фильтра найдены в аналитическом виде для модели одномерного движения, в которой только на старшую производную действует возмущение в виде белого шума, а наблюдению доступно лишь положение с белошумной аддитивной помехой неизвестной интенсивности. Проведен анализ соответствующей разностной схемы нелинейной фильтрации: обоснована несмещенность оценок и получено уравнение на ковариационную матрицу ее ошибок в стационарном режиме. Теоретические результаты подтверждены численным экспериментом, в котором сравнивалась точность оценок оптимального и нелинейного фильтров.
Бесплатно
Метод обнаружения атак на систему навигации БПЛА
Статья
В данной работе рассмотрены вопросы реализации методов защиты беспилотных летательных аппаратов (БПЛА) от атак спуфинга глобальной системы позиционирования (GPS), для обеспечения безопасной навигации. Глобальная навигационная спутниковая система (GNSS) широко используется для определения местоположения БПЛА и на сегодняшний день является самым популярным навигационным решением. Это связано с простотой и относительно невысокой стоимостью данной технологии, а также точностью передаваемых координат. Тем не менее, существует множество угроз безопасности GPS-навигации. Это в первую очередь связано с природой сигнала GPS, т.к. сигнал передается в открытом виде, поэтому злоумышленник может заблокировать или подделать его. В данном исследовании проведен анализ существующих методов защиты GPS. В рамках исследования был разработан экспериментальный стенд и сценарии атак на систему GPS БПЛА. Далее были собраны данные из журнала полетов БПЛА и проведен анализ кибер-физических параметров, чтобы увидеть влияние атаки на показания бортовых датчиков. Исходя из этого, был предложен новый метод обнаружения аномалий БПЛА, основанный на анализе изменений внутренних параметров БПЛА. Этот метод самодиагностики позволяет БПЛА самостоятельно оценивать наличие изменений в его подсистемах, и выявлять признаки кибератаки. Для выявления атаки БПЛА собирает данные об изменении кибер-физических параметров на протяжении определенного периода времени, затем обновляет эти данные. В результате БПЛА необходимо определить степень различий между двумя временными рядами собранных данных. Чем больше будет степень различий между обновленными данными и предыдущими, тем больше вероятность того, что на БПЛА проводится атака.
Бесплатно
Статья
В работе исследованы структурные зависимости рабочих выходов логических комбинационных схем с целью последующей идентификации вида возможных ошибок. Приведены виды возникающих ошибок и классификация рабочих выходов логических комбинационных схем. Показано, что наличие внутренней структурной связи дискретных устройств приводит к увеличению кратности возможных ошибок. Приводится условие определения функциональной зависимости выходов от проявления ошибок исследуемой кратности. Отмечено, что из множества видов ошибок, на выходах схем могут проявляться однонаправленные (монотонные) ошибки. Приведен известный метод определения монотонно зависимых рабочих выходов дискретных устройств и указан его недостаток, заключающийся в необходимости только попарного сравнения каждого выхода с остальными из целого множества. Для удобства процесса поиска подобных выходов автором статьи предложен новый метод идентификации монотонно зависимых рабочих выходов, отличающийся от известных методов тем, что данный метод применим для любого числа выходов, что требует значительно меньшего времени для поиска вышеприведенных выходов. Показано, что логические комбинационные схемы могут обладать функциональными особенностями, при которых на рабочих выходах могут проявляться только монотонные ошибки. Следовательно, предложен новый метод идентификации любого числа монотонно независимых рабочих выходов комбинационных схем. Показано, что предлагаемые в статье методы поиска монотонно зависимых и монотонно независимых выходов логических комбинационных схем требуют выполнения несложных математических вычислений. В программной среде Multisim смоделированы внутренние неисправности диагностируемых схем и зафиксированы все возможные ошибки на рабочих выходах. По результатам экспериментов также подтверждена справедливость полученных теоретических результатов.
Бесплатно
Метод оптимизации траектории мобильного робота в поле источников-репеллеров
Статья
Рассматривается процедура корректировки траектории движения робототехнической платформы (РТП) на плоскости с целью снижения вероятности её поражения/обнаружения в поле конечного числа источников-репеллеров. Каждый из таких источников описан математической моделью некоторого фактора противодействия целостности или скрытности РТП. Указанная процедура основана, с одной стороны, на понятии характерной вероятностной функции системы источников-репеллеров, позволяющем оценивать степень влияния этих источников на движущуюся РТП. Из этого понятия вытекает используемая здесь в качестве показателя оптимизации целевой траектории вероятность её успешного прохождения. С другой стороны, эта процедура базируется на решении локальных оптимизационных задач, позволяющих корректировать отдельные участки исходной траектории с учетом нахождения в их окрестностях конкретных источниковрепеллеров с заданными параметрами. Каждый из таких источников характеризуется потенциалом, частотой воздействия, радиусом действия и параметрами спада поля. Корректировка траектории происходит итерационно и учитывает целевое значение вероятности прохождения. Основным ограничением на вариацию исходной траектории является максимально допустимое отклонение измененной траектории от исходной. Если такого ограничения нет, то задача может потерять смысл, поскольку тогда можно выделить область, охватывающую все препятствия и источники, и обойти её по периметру. Поэтому осуществляется поиск такого локального экстремума, который соответствует допустимой кривой в смысле указанного ограничения. Предлагаемая в настоящей работе итерационная процедура позволяет проводить поиск соответствующих локальных максимумов вероятности прохождения РТП в поле нескольких произвольно расположенных и ориентированных источников в некоторой окрестности исходной траектории. Вначале ставится и решается задача оптимизации траектории при условии движения в поле одного источника с областью действия в виде кругового сектора, затем полученный результат распространяется на случай нескольких аналогичных источников. Основной проблемой исследования является выбор общего вида функционала в каждой точке исходной кривой, а также его коэффициентов настройки. Показано, что выбор этих коэффициентов настройки есть адаптивная процедура, входными переменными которой являются характерные геометрические величины, описывающие текущую траекторию в поле источников. Для устранения осцилляций, возникающих вследствие локальности предлагаемой процедуры, применяются стандартные процедуры медианного сглаживания. Результаты моделирования показывают высокую эффективность предложенной процедуры для корректировки ранее спланированной траектории.
Бесплатно
Метод оценки времени беспроводной передачи энергетических ресурсов между двумя роботами
Статья
Энергоемкость аккумуляторов, применяемых в качестве основного источника питания в мобильных робототехнических средствах, определяет время автономной работы робота. Для планирования выполнения группой робототехнических средств задач с точки зрения затрат времени актуально учитывать время, в течение которого заряжается аккумулятор каждого отдельного робота. При использовании беспроводной передачи энергии это время зависит от эффективности системы передачи энергии, а также от мощности передающей части системы, необходимой для пополнения энергоемкости. В настоящей работе предлагается метод оценки времени передачи энергетических ресурсов между двумя роботами с учетом данных параметров. Предлагаемый метод учитывает применение алгоритма конечного позиционирования роботов, оценку линейных смещений между роботами, включает вычисление эффективности, а также определение времени подзарядки с учетом параметров, полученных на предыдущих этапах метода. Алгоритм конечного позиционирования роботов использует алгоритмы обработки данных системы технического зрения робота для поиска реперных маркеров и определения их пространственных характеристик для обеспечения конечного позиционирования мобильных робототехнических платформ. Данные характеристики также применяются для определения линейных смещений между роботами, от которых зависит эффективность передачи энергии. Для ее определения в методе используется математическая модель энергетических характеристик системы беспроводной передачи энергии и полученные линейные смещения. На последнем этапе метода вычисляется время подзарядки аккумулятора мобильного робота с учетом данных с предыдущих этапов. Применение предложенного метода для моделирования позиционирования роботов в некотором наборе точек рабочего пространства позволит уменьшить временные затраты на зарядку аккумулятора робота при использовании беспроводной передачи энергии. В результате моделирования было определено, что передача энергетических ресурсов между роботами происходило с эффективностью в диапазоне от 58,11% до 68,22%, а также из 14 точек позиционирования были определены 3 с наименьшим временем передачи энергии.
Бесплатно
Статья
В статье рассматривается проблема распознавания сентимента и эмоций пользователей в русскоязычных текстовых транскрипциях речи с использованием словарных методов и машинного перевода. Количество имеющихся информационных ресурсов для анализа сентимента текстовых сообщений на русском языке очень ограничено, что существенно затрудняет применение базовых методов анализа сентимента, а именно, предобработки текстов, векторизации с помощью тональных словарей, традиционных классификаторов. Для решения этой проблемы в статье вводится новый метод на основе автоматического машинного перевода русскоязычных текстов на английский язык. Частичный перевод предполагает перевод отдельных лексем, не включенных в русскоязычные тональные словари, тогда как полный перевод подразумевает перевод всего текста целиком. Переведенный текст анализируется с использованием различных англоязычных тональных словарей. Экспериментальные исследования для решения задачи распознавания сентимента и эмоций были проведены на текстовых транскрипциях многомодального русскоязычного корпуса RAMAS, извлеченных из аудиоданных экспертным путем и автоматически с использованием системы распознавания речи. В результате применения методов машинного перевода достигается значение взвешенной F-меры распознавания семи классов эмоций 31,12 % и 23,74 %, и трех классов сентимента 75,37 % и 71,60 % для экспертных и автоматических транскрипций русскоязычной речи корпуса RAMAS, соответственно. Также в ходе экспериментов было выявлено, что использование статистических векторов в качестве метода преобразования текстовых данных позволяет достичь значение показателя взвешенной F-меры на 1-5 % выше по сравнению с использованием конкатенированного (статистического и тонального) вектора. Таким образом, эксперименты показывают, что объединение всех англоязычных тональных словарей позволяет повысить точность распознавания сентимента и эмоций в текстовых данных. В статье также исследуется корреляция между длиной вектора текстовых данных и его репрезентативностью. По результатам экспериментов можно сделать вывод, что использование лемматизации для нормализации слов текстовых транскрипций речи позволяет достичь большей точности распознавания сентимента по сравнению со стеммингом. Использование предложенных методов с полным и частичным машинным переводом позволяет повысить точность распознавания сентимента и эмоций на 0,65–9,76 % по показателю взвешенной F-меры по сравнению с базовым методом распознавания сентимента и эмоций.
Бесплатно
Статья
В работе рассматривается задача построения безопасных маршрутов группы беспилотных летательных аппаратов в ограниченном воздушном пространстве над сельскохозяйственным участком. Актуальность исследования обусловлена растущим применением групп БпЛА в агропромышленном комплексе для мониторинга, картографирования и обработки полей, что требует обеспечения безопасности полётов в условиях высокой плотности воздушного движения, ограниченной связи, а также воздействия внешних факторов. Особую сложность представляет необходимость автономного выполнения миссий при наличии навигационных погрешностей и природных воздействий. Предлагается метод планирования маршрутов, основанный на представлении траектории каждого аппарата в виде капсульного воздушного коридора – трёхмерного объёма фиксированного радиуса, сформированного вдоль отрезков траектории. Пространственное резервирование обеспечивает безопасное разнесение траекторий на этапе планирования, исключая конфликты при последующем автономном выполнении полётов без необходимости непрерывной координации между агентами. Радиус капсулы включает запас на возможные отклонения от запланированной траектории, что обеспечивает устойчивость к навигационным ошибкам. В основе метода лежит последовательное формирование маршрутов для каждого аппарата по четырёхфазной схеме, включающей вертикальный подъём от точки старта до рабочей высоты, горизонтальный переход к входу в зону обработки, возврат от выхода из зоны к точке начала снижения и вертикальный спуск к исходной позиции. Каждый новый маршрут строится с учётом уже зарезервированных воздушных коридоров через аналитическую проверку геометрических пересечений между капсулами различных траекторий и выпуклыми многогранниками зон обработки. Для повышения вычислительной эффективности применяется иерархическая пространственная фильтрация на основе ограничивающих параллелепипедов, позволяющая на предварительном этапе быстро отсекать заведомо непересекающиеся объекты и выполнять точную геометрическую проверку только для потенциально конфликтующих сегментов маршрутов. Численные эксперименты проводились для групп от 2 до 32 аппаратов на типовом сельскохозяйственном участке площадью один квадратный километр. Установлено нелинейное возрастание времени планирования и количества итераций с увеличением числа агентов, что обусловлено необходимостью построения каждого последующего маршрута в уже частично занятом пространстве с возрастающим числом пространственных ограничений. Длина маршрутов демонстрирует тенденцию к росту, особенно выраженную на начальных этапах масштабирования, что связано с необходимостью обхода уже зарезервированных воздушных коридоров.
Бесплатно
Статья
В работе рассматривается проблема получения наилучшей альтернативы с помощью методов принятия решений, основанных на опыте специалиста и математических расчетов. Для решения данной проблемы подходит групповое принятие решений, однако оно может привести к выбору нескольких наилучших альтернатив (мультивариантности результата). Учет компетентности позволит отдать приоритет решению более компетентных участников и устранить возникновение нескольких наилучших альтернатив в процессе группового принятия решений. Сформулирована задача определения коэффициентов компетентности для участников группового принятия решений, которые обеспечивают выбор наилучшей альтернативы при мультивариантности результата. Разработан метод решения поставленной задачи, который включает в себя дискретизацию диапазона изменения входных переменных и уточнение в нем значений коэффициентов компетентности участников группового принятия решений. Уточнение выполняется с использованием либо мажоритарного принципа, либо с помощью лица, принимающего решение. Последующее вычисление коэффициентов компетентности для участников группового принятия решений осуществляется при помощи локальной линейной интерполяции уточненного коэффициента компетентности в окружающих точках из дискретизированного диапазона. Использование предложенного метода решения поставленной задачи рассмотрено на примере группового принятия решений по основным разновидностям мажоритарного принципа для выбора варианта технологического процесса нанесения гальванического покрытия. В результатах показано, что предложенный метод расчета коэффициентов компетентности участников группового принятия решений через локальную линейную интерполяцию является наиболее эффективным для выбора наилучшей альтернативы при мультивариантности результата по мажоритарному принципу относительного большинства.
Бесплатно
Метод структурно-параметрического синтеза конфигураций многорежимного объекта
Статья
Сложность современных объектов с перестраиваемой структурой приводит к необходимости учета различных факторов взаимодействия их с окружающей средой и связана с увеличением числа входящих в их состав элементов и подсистем, а также, соответственно, стремительным ростом числа внутренних связей, и проявляется в таких аспектах, как структурная сложность, сложность функционирования, сложность выбора поведения, сложность моделирования и сложность развития. Данные системы функционируют в условиях существенной неопределённости, связанной с изменением содержания целей и задач, стоящих перед объектом, воздействием возмущающих факторов со стороны внешней среды и имеющих целенаправленный и/или нецеленаправленный характер. Указанные аспекты сложности системы связаны не только с неопределенными воздействиями внешней среды, но и с множеством различных режимов (видов) функционирования, соответствующих множественности решаемых задач и множественности показателей качества их решения. Как правило, системы с фиксированной структурой, настраиваемые обычно на установившийся (какой-то заданный) режим, не обеспечивают наилучшего качества управления в других режимах. Поэтому многорежимность и неопределенность условий функционирования обуславливают необходимость решения проблемы анализа и синтеза конфигурации и реконфигурации рассматриваемых объектов, основанных на интеллектуальных подходах. При этом на этапах создания и проектирования объектов с перестраиваемой структурой должны быть синтезированы такие взаимосвязанные множества режимов функционирования и структур, а также, возможно, внесён такой уровень избыточности в указанные множества с учетом пространственно-временных, технических и технологических ограничений, при которых на этапе их применения по целевому назначению имелась бы возможность гибко реагировать на все расчётные и нерасчётные нештатные ситуации, вызывающие структурные изменения объекта. С формальной точки зрения, решение указанных задач возможно в рамках такого важнейшего класса современных научно-технических задач, как задачи многокритериального структурно-функционального синтеза конфигураций многорежимных объектов на различных этапах их жизненного цикла. В настоящей статье приведен метод решения указанных задач, основанный на предложенной авторами концепции параметрического генома сложных многорежимных объектов. Применение данной концепции позволяет в концентрированном виде хранить явные и неявные знания экспертов о взаимодействии элементов и подсистем объекта при выполнении различных вариантов реализации режимов функционирования, а также осуществлять оперативное вычисление значений оптимистических и пессимистических оценок показателей структурно-функциональной надежности однородных/неоднородных, монотонных/немонотонных, равноценных/неравноценных многорежимных объектов. Для решения задачи многокритериального выбора требуемого количества недоминируемых вариантов конфигураций многорежимного объекта, равномерно расположенных в множестве эффективных (паретовских) альтернатив, была предложена комбинация метода интервального лексикографического упорядочения (последовательных уступок) и операторного решающего правила. При этом для проведения детального анализа возможности реализации объектом совместного или раздельного задействования режимов функционирования с равноценной или неравноценной интенсивностью их применения было предложено нечетко-возможностное представление обобщенного показателя структурно-функциональной надежности в виде трапециевидного числа и определения его центра тяжести. Эффективность использования разработанного метода структурно-параметрического синтеза конфигураций многорежимного объекта с перестраиваемой структурой проиллюстрирована на примере решения задачи структурно-параметрического синтеза конфигураций системы управления движением малого космического аппарата «Аист-2Д».
Бесплатно
Статья
В статье рассматривается задача формирования цифровой тени процесса перемещения человека. Проведен анализ предметной области, который показал необходимость формализации процесса создания цифровых теней для имитации движений человека в виртуальном пространстве, тестировании программно-аппаратных комплексов, функционирующих на основе действий человека, а также в различных системах опорно-двигательной реабилитации. Выявлено, что среди существующих подходов к захвату движений человека нельзя выделить универсальный и стабильно работающий при различных условиях внешней среды. Разработан метод формирования цифровой тени на основе комбинирования и синхронизации данных из трех систем захвата движений (трекеры виртуальной реальности, костюм motion capture и камеры с использованием технологий компьютерного зрения). Объединение перечисленных систем позволяет получить комплексную оценку положения и состояния человека независимо от условий внешней среды (электромагнитные помехи, освещенность). Для реализации предложенного метода проведена формализация цифровой тени процесса перемещения человека, включающая описание механизмов сбора и обработки данных от различных систем захвата движений, а также этапы объединения, фильтрации и синхронизации данных. Научная новизна метода заключается в формализации процесса сбора данных о перемещении человека, объединении и синхронизации аппаратного обеспечения используемых систем захвата движений для создания цифровых теней процесса перемещения человека. Полученные теоретические результаты будут использоваться в качестве основы для программной абстракции цифровой тени в информационных системах для решения задач тестирования, имитации человека и моделирования его реакции на внешние раздражители за счет обобщения собранных массивов данных о его перемещении.
Бесплатно
Методика идентификации текстов, сгенерированных большими языковыми моделями
Статья
В статье представлена методика идентификации русскоязычных текстов, сгенерированных большими языковыми моделями (LLM). Методика разработана с фокусом на короткие сообщения длиной от 100 до 200 символов. Актуальность работы обусловлена широким распространением генеративных моделей, таких как GPT-3.5, GPT-4o, LLaMA, GigaChat, DeepSeek, Yandex GPT. Методика основана на ансамбле моделей машинного обучения, также используются признаки трех уровней: лингвистические (структура, пунктуация, морфология, лексическое разнообразие), статистические (энтропия, перплексия, частотность n-грамм), семантические (эмбеддинги RuBERT). В качестве базовых моделей применяются LightGBM, BiLSTM и предобученная трансформерная модель RuRoBERTa, объединенные стеккингом через логистическую регрессию. Выбор гибридного ансамблевого подхода обусловлен стремлением учесть признаки на разных уровнях иерархии текста и обеспечить надежность классификации в условиях разных тематик генерируемых текстов, различных версий и видов языковых моделей. Применение ансамбля является преимуществом при анализе коротких текстов, поскольку LightGBM, опирающаяся на усредненные показатели, менее чувствительна к длине (метрика перплексии уже усреднена по всему тексту), тогда как BiLSTM и RoBERTa, способны выявлять локальные признаки LLM-текста, а не только глобальные. Набор данных естественных текстов включает более 2,8 млн пользовательских комментариев из социальной сети «ВКонтакте». Набор данных LLM-текстов содержит 700 тыс. текстов, сгенерированных семью актуальными большими языковыми моделями. При проведении генерации текстов применялись тематическое моделирование (LDA) и ролевая генерация с использованием промпт-инжиниринга. Проведена оценка методики на открытых датасетах русскоязычных LLM-текстов. Результаты экспериментов показали точность до 0,95 в задаче бинарной классификации («Человек–LLM») и до 0,89 в многоклассовой задаче определения модели-генератора. Методика демонстрирует устойчивость к разнообразию источников, стилей и версий LLM.
Бесплатно
Статья
Увеличение количества вычислительных ядер является одним из основных современных способов повышения производительности процессоров. При этом увеличивается и нагрузка на подсистему памяти процессора в связи с растущим числом инициаторов обращений в память. Одним из нестандартных подходов к повышению производительности подсистемы памяти является аппаратная компрессия данных, позволяющая, во-первых, повысить эффективный объем кэш-памяти, снижая частоту запросов в оперативную память, а во-вторых, снизить интенсивность трафика в подсистеме памяти за счет более плотной упаковки данных. В работе рассматривается применение аппаратной компрессии данных в сети-на-кристалле и межпроцессорных каналах связи в конфигурации с широкими каналами передачи данных и политикой управления потоком wormhole. Существующие решения для такой конфигурации нельзя считать применимыми, т.к. они принципиально основаны на использовании узких каналов передачи данных и политиках управления потоком, предполагающих передачу пакета в неразрывном виде, что может не соблюдаться при применении политики wormhole. Предлагаемая в работе методика позволяет использовать аппаратную компрессию для рассматриваемой конфигурации за счет переноса процесса компрессии и декомпрессии из самой сети в соединяемые устройства, а также ряда оптимизаций по сокрытию задержек на преобразование данных. Рассматриваются оптимизации некоторых частных случаев передачи данных – передачи больших пакетов данных, состоящих из нескольких кэш-строк, а также нулевых данных. Особое внимание в работе уделено передаче данных по межпроцессорным каналам связи, в которых, в связи с их меньшей пропускной способностью по сравнению с сетью-на-кристалле, применение компрессии способно оказать наибольший эффект. Повышение пропускной способности подсистемы памяти при использовании в ней аппаратной компрессии данных подтверждается экспериментальными результатами, показывающими относительное увеличение IPC в задачах пакета SPEC CPU2017 до 14 процентов.
Бесплатно
Статья
Анализ применения технологии умный дом указывает на недостаточный уровень управляемости его инфраструктурой, что приводит к избыточному потреблению энергетических и информационных ресурсов. Проблема управления цифровой инфраструктурой жилого пространства человека, связана с большим числом узкоспециализированных решений по домашней автоматизации, которые усложняют процесс управления. Умный дом рассматривается как множество независимых киберфизических устройств направленных на достижение своей цели. Для согласованной работы киберфизических устройств предлагается обеспечивать их совместную работу через единый информационный центр. Моделирования режимов работы устройств в цифровой среде сохраняет ресурс физических устройств, производя виртуальный расчет для всевозможных вариантов взаимодействия устройств между собой и физической средой. Разработана методика управления микроклиматом умного дома с применением ансамбля нечетких искусственных нейронных сетей, на примере совместного использования кондиционера, вентиляции и отопления. Алгоритм работы нейронной сети позволяет контролировать параметры состояния физической среды, прогнозировать режимы работы киберфизических устройств и формировать сигналы управления для каждого из них, обеспечивая совместную работу устройств с минимальным ресурсопотреблением и информационным трафиком. Предложен вариант практической реализации системы управления микроклиматом умного дома на примере многофункционального учебного компьютерного класса. Разработаны гибридные нейронные сети систем кондиционирования, вентиляции и отопления. Произведено тестирование работы системы управления микроклиматом многофункциональной аудитории университета с применением гибридных нейронных сетей, в качестве устройства управления использован программируемый логический контроллер отечественного производства. Целью управления на основе взаимодействующих киберфизических устройств является достижения минимума используемой мощности и информационного трафика при их совместной работе.
Бесплатно
Методика обеспечения функциональной устойчивости системы связи за счет выявления конфликтов
Статья
Введение: Современные сложные технические системы часто бывают критически важными. Критичность обусловлена последствиями нарушения функционирования таких систем, не выполнением ими требуемого перечня функций и задач. Процесс контроля и управления такими системами осуществляется с использованием систем и сетей связи, которые становятся для них критичными. Возникает потребность в обеспечении устойчивого функционирования, как самих сложных технических систем, так и их систем управления, контроля, систем и сетей связи. В работе предложена методика обеспечения функциональной устойчивости системы связи, основой которой является процесс выявления и устранения в ней конфликтов, обусловленных отличием профиля функционирования и профиля процесса функционирования системы. Предложенная модель процесса функционирования системы связи позволяет на основе анализа интенсивностей воздействия дестабилизирующих факторов на систему, выявления конфликтов и их устранения, определить вероятность обеспечения функциональной устойчивости системы. Цель исследования: разработка методики обеспечения функциональной устойчивости системы связи в условиях воздействия дестабилизирующих факторов и возникновения конфликтов, а также модели процесса функционирования системы связи, позволяющей определять вероятность нахождения системы в функционально устойчивом состоянии. Методы теории графов и теории матриц, теории Марковских процессов. Результаты: предложена модель процесса функционирования системы связи в условиях воздействия дестабилизирующих факторов, позволяющая определять вероятность нарушения функционирования системы, разработана методика обеспечения функциональной устойчивости системы связи. Практическая значимость: результаты исследования могут быть использованы при проектировании и построении сложных технических систем, а также в системах поддержки принятия решений, контроля, связи и управления.
Бесплатно
Статья
В современных сетях передачи данных для постоянного мониторинга сетевого трафика и обнаружения в нем аномальной активности, а также идентификации и классификации кибератак, необходимо учитывать большое число факторов и параметров, включая возможные сетевые маршруты, времена задержки данных, потери пакетов и новые свойства трафика, отличающиеся от нормальных. Все это является побудительным мотивом к поиску новых методов и методик обнаружения кибератак и защиты от них сетей передачи данных. В статье рассматривается методика обнаружения аномалий и кибератак, предназначенная для использования в современных сетях передачи данных, которая основывается на интеграции методов фрактального анализа и машинного обучения. Методика ориентирована на выполнение в реальном или близком к реальному масштабе времени и включает несколько этапов: (1) выявления аномалий в сетевом трафике, (2) идентификации в аномалиях кибератак и (3) классификации кибератак. Первый этап реализуется с помощью методов фрактального анализа (оценки самоподобия сетевого трафика), второй и третий – с применением методов машинного обучения, использующих ячейки рекуррентных нейронных сетей с долгой краткосрочной памятью. Рассматриваются вопросы программной реализации предлагаемой методики, включая формирование набора данных, содержащего сетевые пакеты, циркулирующие в сети передачи данных. Представлены результаты экспериментальной оценки предложенной методики, полученные с использованием сформированного набора данных. Результаты экспериментов показали достаточно высокую эффективность предложенной методики и разработанных для нее решений, позволяющих осуществлять раннее обнаружение как известных, так и неизвестных кибератак.
Бесплатно
Методика оценивания результативности функционирования систем обнаружения веб-бэкдоров
Статья
В настоящее время наблюдается значительный рост инцидентов информационной безопасности, связанных с атаками на веб-ресурсы. Получение несанкционированного доступа к веб-ресурсам остается одним из основных методов проникновения в корпоративные сети организаций и расширения возможностей злоумышленников. В связи с этим множество исследований направлено на разработку систем обнаружения веб-бэкдоров (СОВБ), однако существует задача оценивания результативности функционирования данных систем. Цель данного исследования заключается в разработке объективного подхода для оценки результативности функционирования СОВБ. В данной работе было установлено, что объективно результативность СОВБ проявляется в процессе их использования, поэтому тестирование таких систем необходимо проводить в условиях, максимально приближенных к реальным. В связи с этим в статье предложена методика оценивания результативности функционирования СОВБ. Она основана на расчете трех групп частных показателей, характеризующих действенность, ресурсоемкость и оперативность работы системы обнаружения, а также вычислении обобщенного показателя результативности. На основе анализа исследований в данной области была составлена классификация веб-бэкдоров, встраиваемых злоумышленником в исходный код веб-приложений. Эта классификация используется при формировании тестовых наборов данных для вычисления частных показателей действенности. Разработанная методика применима для СОВБ, которые работают на основе анализа исходного кода веб-страниц. Также для ее использования необходим ряд исходных данных, таких как допустимые предельные ошибки частных показателей действенности и вероятность нахождения их в доверительном интервале, а также весовые коэффициенты частных показателей действенности, которые подбираются экспертными методами. Данная работа может быть полезной для специалистов и исследователей в области информационной безопасности, которые хотят проводить объективную оценку своих СОВБ.
Бесплатно
Статья
Цифровизация современной экономики привела к масштабному проникновению информационных технологий в различные сферы человеческой деятельности. Кроме положительных эффектов это крайне обострило проблему противодействия киберугрозам, реализация которых злоумышленниками часто влечет за собой тяжелые последствия. Вредоносное программное обеспечение (ВПО) занимает важное место на современном ландшафте киберугроз, наиболее громкие киберпреступления последних лет связаны с применением ВПО. В связи с этим активно развивается проблемная область противодействия ВПО и одним из перспективных направлений исследований в данной области является создание методов детектирования ВПО на основе машинного обучения. Однако слабым местом многих известных исследований является построение достоверных наборов данных для моделей машинного обучения, когда авторы не раскрывают особенности формирования, предобработки и разметки данных о ВПО, что компрометирует воспроизводимость этих исследований. В данной работе предлагается методика сбора данных об активности ВПО, основанная на матрице MITRE ATT&CK и Sigma-правилах, и рассчитанная на операционные системы семейства Windows. Предлагаемая методика направлена на повышение качества наборов данных, содержащих характеристики поведения ВПО и легитимных процессов, а также на сокращение времени разметки данных экспертным способом. Для апробации методики подготовлен программный стенд и проведены эксперименты, подтвердившие ее адекватность.
Бесплатно