Информатика и автоматизация (Труды СПИИРАН)
Статьи журнала - Информатика и автоматизация (Труды СПИИРАН)
Все статьи: 237

Статья
Сельское хозяйство является одним из основных источников экономического роста в России; мировое производство яблок в 2019 году составило 87 миллионов тонн. Болезни листьев яблони являются основной причиной ежегодного сокращения производства яблок, что приводит к огромным экономическим потерям. Автоматизированные методы выявления болезней листьев яблони позволяют сократить трудоемкую работу по мониторингу яблоневых садов и раннему выявлению симптомов болезни. В этой статье предложена многослойная сверточная нейронная сеть (MCNN), которая способна классифицировать листья яблони по одной из следующих категорий: парша яблони, черная гниль и болезни яблоневой кедровой ржавчины, используя недавно созданный набор данных. В этом методе мы использовали методы аффинного преобразования и перспективного преобразования для увеличения размера набора данных. После этого операции предварительной обработки на основе метода кадрирования и выравнивания гистограммы OpenCV использовались для улучшения предлагаемого набора данных изображения. Экспериментальные результаты показывают, что система достигает точности обучения 98,40% и точности проверки 98,47% для предложенного набора данных изображения с меньшим количеством параметров обучения. Результаты предполагают более высокую точность классификации предложенной модели MCNN по сравнению с другими известными современными подходами. Эта предложенная модель может использоваться для обнаружения и классификации других типов болезней яблони из разных наборов данных изображений.
Бесплатно

Статья
Анализ вредоносных программ является важнейшим аспектом кибербезопасности, направленным на выявление и дифференциацию вредоносного ПО от безвредных программ для защиты компьютерных систем от угроз безопасности. Несмотря на достижения в мерах кибербезопасности, вредоносные программы продолжают представлять значительные риски в киберпространстве, требуя точных и быстрых методов анализа. В этой статье представлен инновационный подход к классификации вредоносных программ с использованием анализа изображений, включающий три ключевых этапа: преобразование кодов операций в данные изображений RGB, использование генеративно-состязательной сети (GAN) для синтетической передискретизации и использование упрощенного классификатора на основе визуального трансформера (ViT) для анализа изображений. Данный метод повышает богатство функций и объяснимость с помощью данных визуальных изображений и устраняет несбалансированную классификацию с использованием методов передискретизации на основе GAN. Предложенная структура сочетает в себе преимущества сверточных автоэнкодеров, гибридных классификаторов и адаптированных моделей ViT для достижения баланса между точностью и вычислительной эффективностью. Как показали эксперименты, наш подход без использования сверток обладает превосходной точностью и прецизионностью по сравнению со сверточными моделями и превосходит модели CNN на двух наборах данных благодаря механизму многоголового внимания. На наборе данных Big2015 наша модель превосходит другие модели CNN с точностью 0,8369 и площадью под кривой (AUC) 0,9791. В частности, наша модель достигает точности 0,9697 и оценки F1 0,9702 на MALIMG, что является экстраординарным результатом.
Бесплатно

Классификация пространственно-временных паттернов на основе нейроморфных сетей
Статья
Эта работа посвящена проблемам разработки нейроморфных классификаторов пространственно-временных паттернов, а также их применению в нейроинтерфейсах для решения задачи управления робототехническими устройствами. Рассматриваются классификаторы пространственно-временных паттернов на основе нейронных сетей, метода опорных векторов, глубоких нейронных сетей, римановой геометрии. Проводится сравнительное исследование этих классификаторов на точность многоклассового распознавания электроэнцефалографических сигналов, показывающих зависимую от времени биоэлектрическую активность в различных зонах мозга при воображении разных движений. Показано, что такие классификаторы могут обеспечить точность 60-80% при распознавании от двух до четырех классов воображаемых движений. Предложен новый тип классификатора на основе нейроморфной сети, биоподобные нейроны которой построены на модели Ижикевича. Исходный электроэнцефалографический сигнал кодируется в импульсные потоки на основе алгоритма временного кодирования. Предложенная нейроморфная сеть обрабатывает импульсные входные последовательности и формирует на выходах импульсные потоки разной частоты. Обучение сети проводится по размеченной информации, содержащей примеры правильного распознавания нужных классов паттернов воображаемых движений с применением алгоритма Supervised STDP. Распознанный класс паттерна воображаемого движения определяется по максимальной частоте импульсного потока выходной последовательности. Нейроморфный классификатор показал среднюю точность классификации 90% для 4-х классов воображаемых двигательных команд, а максимальная точность составила 95%. Путем моделирования задачи управления роботом в виртуальной среде показано, что такая точность классификации достаточна для эффективного применения классификатора в составе неинвазивного интерфейса «мозг-компьютер» при бесконтактном управлении робототехническими устройствами.
Бесплатно

Кластеризация сетей с использованием алгоритма поиска косяков рыб
Статья
Сеть представляет собой совокупность узлов, соединенных ребрами, которые представляют сущности и их взаимосвязи. В кластеризации социальных сетей узлы организованы в кластеры в соответствии с их шаблонами соединений с целью обнаружения сообществ. Выявление структур сообществ в сетях является важным. Однако существующие методы обнаружения сообществ еще не использовали потенциал алгоритма поиска косяков рыб (FSS) и принципов модулярности. Мы предложили новый метод, основанный на кластеризации с использованием алгоритма поиска рыбной школы и функции модулярности (FSC), который улучшает модулярность в кластеризации сети путем итерационного разбиения сети и оптимизации функции модулярности. Этот подход облегчает обнаружение высокомодулярных структур сообществ, улучшая разрешение и эффективность кластеризации сети. Мы протестировали FSC на известных и неизвестных структурах сетей. Также мы протестировали его на сети, сгенерированной с использованием модели LFR, чтобы проверить его производительность на сетях с различными структурами сообществ. Наша методология демонстрирует высокую эффективность в выявлении структур сообществ, что указывает на ее способность эффективно захватывать сплоченные сообщества и точно определять фактические структуры сообществ.
Бесплатно

Статья
Извлечение терминов является важным этапом автоматизированного построения систем знаний на основе естественно-языковых текстов, поскольку обеспечивает формирование базовой системы понятий, используемой затем в прикладных задачах интеллектуальной обработки информации. В статье рассмотрена проблема автоматизированного извлечения терминов из естественно-языковых текстов с целью их дальнейшего использования при построении формализованных систем знаний (онтологий, тезаурусов, графов знаний) в рамках задачи мониторинга тематических обсуждений в социальных медиа. Данная задача характеризуется необходимостью включения в формируемую систему знаний как понятий из нескольких различных предметных областей, так и некоторых общеупотребительных понятий, используемых аудиторией социальных медиа в рамках тематических обсуждений. Кроме того, формируемая система знаний является динамичной как с точки зрения состава охватываемых ею предметных областей, так и состава релевантных понятий, подлежащих включению в систему. Применение существующих классических методов извлечения терминов в данном случае затруднительно, поскольку они ориентированы на извлечение терминов в рамках одной предметной области. Исходя из этого, для решения рассматриваемой задачи предложен комбинированный метод, совмещающий в себе подходы на основе внешних источников знаний, инструментов NER и правил. Результаты проведенных экспериментов демонстрируют эффективность предложенной комбинации подходов к извлечению терминов для задачи мониторинга и анализа тематических обсуждений в социальных медиа. Разработанный метод значительно превосходит по точности существующие инструменты извлечения терминов. В качестве дальнейшего направления исследования рассмотрена возможность развития метода для решения задачи выделения вложенных терминов или сущностей.
Бесплатно

Компенсация ошибок, вызванных временной задержкой цифровых датчиков
Статья
Исследование посвящено повышению точности цифровых датчиков с запаздыванием по времени. Актуальность темы обусловлена широким распространением датчиков этого типа, что во многом обусловлено резким повышением требований к точности датчиков, а также расширяющимся применением цифровых технологий для обработки информации в системах управления, связи, мониторинга и многих других. Для устранения ошибок, обусловленных временной задержкой цифровых датчиков, предлагается использовать астатический быстродействующий корректор. Целесообразность применения этот корректора обосновывается свойствами дискретных динамических систем. В связи с этим сначала рассматриваются условия, при которых дискретные системы являются физически реализуемыми и имеют конечную длительность переходных процессов, поскольку в этом последнем случае они являются наиболее быстродействующими. Также показано, что для измерения полиномиального сигнала ограниченной интенсивности с нулевой ошибкой в установившемся режиме, датчик должен иметь порядок астатизма на единицу больше степени этого сигнала. На основе приведенных условий доказывается основной результат статьи – теорема, в которой устанавливаются условия существования астатического быстродействующего корректора. При включении этого корректора на выходе цифрового датчика или коррекции программного обеспечения последнего образуется модернизированный датчик, ошибка которого в установившемся режиме будет равна нулю. Это происходит вследствие того, что корректор устраняет ошибку цифрового датчика, обусловленную имевшейся в нём задержкой по времени, которая предполагается кратной периоду дискретизации. Порядок корректора как системы определяется целочисленным решением полученного в работе уравнения, которое связывает степень измеряемого полиномиального сигнала, запаздывание цифрового датчика, допустимое перерегулирование модернизированного датчика и относительный порядок искомого корректора. Это уравнение решено для случаев, когда степень измеряемого сигнала не больше единицы, перерегулирование равно часто назначаемым значениям, а задержка по времени не превышает четырёх периодов дискретизации. Порядки соответствующих модернизированных цифровых датчиков приведены в табличной форме. Это позволяет находить необходимый корректор без решения указанного уравнения во многих практических случаях. Эффективность предлагаемого подхода к повышению точности цифровых датчиков показана на численном примере. Нулевое значение ошибки модернизированного датчика подтверждается как путем компьютерного моделирования, так и численным расчетом. Полученные результаты могут использоваться при разработке высокоточных цифровых датчиков различных физических величин.
Бесплатно

Комплексная система защиты от уязвимостей, основанных на возвратно-ориентированном программировании
Статья
Затруднительно или невозможно создать программное обеспечение, не содержащее ошибок. Ошибки могут приводить к тому, что переданные в программу данные вызывают нештатный порядок выполнения ее машинного кода. Разбиение на подпрограммы приводит к тому, что инструкции возврата из подпрограмм могут использоваться для проведения атаки. Существующие средства защиты в основном требуют наличия исходных текстов для предотвращения таких атак. Предлагаемая методика защиты направлена на комплексное решение проблемы. Во-первых, затрудняется получение атакующим контроля над исполнением программы, а во-вторых, снижается количество участков программ, которые могут быть использованы в ходе атаки. Для затруднения получения контроля над исполнением применяется вставка защитного кода в начало и конец подпрограмм. При вызове защищенной подпрограммы производится защита адреса возврата, а при завершении – восстановление – при условии отсутствия повреждения его атакующим. Для снижения количества пригодных для атак участков применяются синонимичные замены инструкций, содержащие опасные значения. Предложенные меры не изменяют алгоритм работы исходного приложения. Для проверки описанных решений была выполнена программная реализация и проведено ее тестирование с использованием синтетических тестов, тестов производительности и реальных программ. Тестирование показало правильность принятых решений, что обеспечивает устранение пригодных для атак участков и невозможность использования штатных инструкций возврата для проведения атак. Тестирование производительности показало 14 % падения скорости работы, что находится на уровне ближайших аналогов. Сравнение с аналогами показало, что количество реализуемых сценариев атаки для предложенного решения меньше, а применимость выше.
Бесплатно

Статья
Обоснован общий подход к моделированию случайных процессов обслуживания в условиях возмущений и неопределенности исходных данных. Предложен композиционный подход построения имитационных моделей массового обслуживания с параметрической неопределенностью на основе распределений фазового типа и фазовых функций. Проведены расчет и сравнение характеристик разработанных имитационных моделей с аналитическими решениями для подтверждения их эффективности и точности. Освещена проблематика неопределенности исходных данных и их влияние на моделирование систем обслуживания. Подчеркивается важность учета параметрической неопределенности в имитационных моделях для повышения их адекватности и применимости на практике. Проведенное исследование включает описание общего подхода к моделированию случайных процессов обслуживания с неопределенностью, а также методологические основы применения фазовых распределений и функций в композиционном моделировании. Рассмотрены четыре класса моделей обслуживания, отличающихся типом интегрального ядра и фазовой функции, что позволяет реализовать разнообразие случайных процессов обслуживания с учетом их особенностей и условий их возникновения. Проведен анализ модели с экспоненциальным интегральным ядром и различными видами фазовых функций, что демонстрирует гибкость и широкие возможности предложенного композиционного подхода к изучению и моделированию систем обслуживания. Представлены результаты имитационного моделирования, подтверждающие аналитические исследования и показывающие применимость и эффективность разработанного подхода при построении и анализе моделей систем обслуживания со случайными параметрами. Отмечается практическая значимость композиционного метода для проектирования и модернизации информационно-вычислительных систем на различных этапах их развития с учетом неопределенности исходных данных. Рассмотрены примеры расчета характеристик элементов архитектуры АСУ железнодорожного транспорта обработки информации в среде имитационного моделирования GPSS World для сетевого узла и сетевой модели массового обслуживания сегмента. Работа ориентирована на развитие методов имитационного моделирования систем массового обслуживания и открывает новые перспективы для их исследования и оптимизации в условиях неопределенности исходных параметров.
Бесплатно

Статья
Разрабатывается контекстно-управляемый подход к интеллектуальной поддержке принятия решений на основе цифровых следов пользователей. Рассматриваются вопросы использования концепции жизни человека в цифровой среде при интеллектуальной поддержке принятия решений. Исследуются цели обращения к цифровым следам человека в различных проблемных областях и выявляются подходы к моделированию жизни человека в цифровой среде. Предлагается подход к интеллектуальной поддержке принятия решений, в котором цифровые следы служат источником информации для выявления предпочтений пользователей и их поведения при принятии решений. Развиваются взгляды на поддержку принятия решений на основе учета следов пользователей в цифровой среде. Результатами исследования являются спецификация требований к интеллектуальной поддержке принятия решений на основе цифровых следов пользователя, принципы, концептуальная и информационная модели такой поддержки.
Бесплатно

Статья
Одним из основных подходов к обработке, анализу и визуализации геофизических данных является применение геоинформационных систем и технологий, что обусловлено их геопространственной привязкой. Вместе с тем, сложность представления геофизических данных связана с их комплексной структурой, предполагающей множество составляющих, которые имеют одну и ту же геопространственную привязку. Яркими примерами данных такой структуры и формата являются гравитационные и геомагнитные поля, которые в общем случае задаются трех и четырехкомпонентными векторами с разнонаправленными осями координат. При этом на сегодняшний день отсутствуют решения, позволяющие визуализировать указанные данные в комплексе, не декомпозируя их на отдельные скалярные значения, которые, в свою очередь, могут быть представлены в виде одного или многих пространственных слоев. В этой связи в работе предложена концепция, использующая элементы тензорного исчисления для обработки, хранения и визуализации информации такого формата. Формализован механизм тензорного представления компонент поля с возможностью его комбинирования с другими данными такого же формата, с одной стороны, и свертки при сочетании с данными более низкого ранга. На примере гибридной реляционно-иерархической модели данных предложен механизм хранения информации по тензорным полям, предусматривающий возможность описания и применения инструкций по трансформации при переходе между различными системами координат. В работе рассматривается применение подхода при переходе от декартовой к сферической системе координат при представлении параметров геомагнитного поля. Для комплексной визуализации параметров тензорного поля предложен подход, основанный на применении тензорных глифов. В качестве последних при этом используются суперэллипсы с осями, соответствующими рангу тензора. При этом атрибутивные значения предлагается визуализировать относительно осей графического примитива таким образом, что распределение данных может быть задано посредством варьирования градиента монохромного представления параметра вдоль оси. Работоспособность концепции была исследована в ходе сравнительного анализа тензорного подхода с решениями, основанными на скалярной декомпозиции соответствующих комплексных значений с последующим их представлением в виде одного или многих пространственных слоев. Проведенный анализ показал, что применение предложенного подхода позволит в значительной степени повысить наглядность формируемого геопространственного изображения без необходимости сложного перекрывания пространственных слоев.
Бесплатно

Статья
В статье описывается общая концепция построения коллаборативных систем поддержки принятия решений, в которых коллективы, осуществляющие поддержку принятия решений, а) формируются гибко в соответствии с задачей и б)состоят как из людей-экспертов, так и из интеллектуальных агентов, реализующих те или иные методы искусственного интеллекта. Проводится анализ ключевых проблем создания коллаборативных систем поддержки принятия решений, основанных на взаимодействии человека и искусственного интеллекта. В частности, выделены следующие проблемы: обеспечение интероперабельности (взаимопонимания) между разнородными участниками коллектива, согласование различающихся позиций участников, обеспечение доверия между участниками, обеспечение эффективности планирования совместных действий и соблюдение баланса между предопределенными потоками работ и самоорганизацией. Сформированы принципы построения подобных систем, предлагающие решения выделенных проблем. В частности, предлагается онтолого-ориентированное представление информации о проблеме (в частности, применение мультиаспектных онтологий), набор методов для мониторинга деятельности команды, схема репутации, элементы объяснимого искусственного интеллекта, а также применение механизма ограниченной самоорганизации. Предложенная концепция положена в основу программной платформы для создания коллаборативных систем поддержки принятия решений, основные архитектурные положения которой также представлены в статье. Применение платформы иллюстрируется на примере из области рационального управления дорожной инфраструктурой и создания коллаборативной системы поддержки принятия решений для разработки мероприятий по снижению аварийности.
Бесплатно

Статья
Информация о том, какие персональные данные собираются и обрабатываются различными устройствами и цифровыми сервисами, представлена в политиках конфиденциальности, однако, как показывают исследования, пользователи крайне редко их читают и, как следствие, не осознают, какие риски информационной безопасности, связанные с обработкой персональных данных, возникают. Решение проблемы повышения информированности субъектов персональных данных связано с разработкой методов поддержки принятия решений, которые представляют политики конфиденциальности в виде, более простом для понимания, например, в виде количественных оценок рисков и пиктограмм и позволяют принимать осознанные решения. Их разработка требует наличия структурированного и размеченного корпуса документов. В настоящей работе систематизируются корпусы политик конфиденциальности, находящиеся в открытом доступе, показываются их отличительные характеристики, такие как год создания, объем и наличие аннотаций. Также представлено описание нового корпуса документов, написанных на русском языке, даются результаты структурного и семантического анализа собранных политик безопасности, и выполняется сравнение с корпусом политик конфиденциальности, написанных на английском языке. Показано, что описание сценариев хранения, сбора и обработки данных в документах на русском языке составляет всего 25% объема текста документа, что может говорить об отсутствии деталей о том, какие типы данных собираются, какие механизмы для сбора используются, и каковы сроки их хранения, что влияет на “прозрачность” использования персональных данных.
Бесплатно

Корреляционные свойства коэффициентов кратномасштабного преобразования типовых изображений
Статья
Увеличивающийся поток фото и видеоинформации, передаваемый по каналам инфокоммуникационных систем и комплексов, стимулирует к поиску эффективных алгоритмов сжатия, позволяющих существенно снизить объем передаваемого трафика, при сохранении его качества. В общем случае, в основе алгоритмов сжатия лежат операции преобразования коррелированных значений яркостей пикселов матрицы изображения в их некоррелированные параметры, с последующим кодированием полученных коэффициентов преобразования. Поскольку основные известные декоррелирующие преобразования являются квазиоптимальными, то задача поиска преобразований, учитывающих изменения статистических характеристик сжимаемых видеоданных, все еще является актуальной. Указанные обстоятельства определили направление проведенного исследования, связанного с анализом декоррелирующих свойств формируемых вейвлет-коэффициентов, получаемых в результате кратномасштабного преобразования изображений. Основным результатом проведенного исследования явилось установления факта того, что вейвлет-коэффициенты кратномасштабного преобразования имеют структуру вложенных матриц, определенных как субматрицы. Поэтому, корреляционный анализ вейвлет-коэффициентов преобразования, целесообразно проводить раздельно для элементов каждой субматрицы на каждом уровне декомпозиции (разложения). Основным теоретическим результатом явилось доказательство того, что ядром каждого последующего уровня кратномасштабного преобразования является матрица, состоящая из вейвлет-коэффициентов предшествующего уровня декомпозиции. Именно данный факт и позволяет сделать вывод о зависимости соответствующих элементов соседних уровней. Кроме того, установлено, что между вейвлет-коэффициентами внутри локальной области изображения размером 8×8 пикселей существует линейная зависимость. При этом максимальная корреляция элементами субматриц непосредственно определяется формой их представления, и наблюдается между соседними элементами находящимися, соответственно в строке, столбце или по диагонали, что подтверждается характером рассеивания. Полученные результаты подтверждены на проведенном анализе выборок, более чем из двухсот типовых изображений. При этом обосновано, что между низкочастотными вейвлет-коэффициентами кратномасштабного преобразования верхнего уровня разложения сохраняются примерно одинаковые зависимости равномерно по всем направлениям. Практическая значимость исследования определяется тем, что все полученные в ходе его проведения результаты подтверждают наличие характерных зависимостей между вейвлет-коэффициентами преобразования на различных уровнях разложения изображений. Данный факт указывает на возможность достижения более высоких значений коэффициентов сжатия видеоданных в процессе их кодирования. Дальнейшие исследования авторы связывают с разработкой математической модели адаптивного арифметического кодирования видеоданных и изображений, учитывающей корреляционные свойства вейвлет-коэффициентов кратномасштабного преобразования.
Бесплатно

Краткий обзор методов сетевой стеганографии
Статья
Цифровые мультимедийные файлы 2D и 3D обладают многочисленными преимуществами, такими как отличное качество, сжатие, редактирование, надежное копирование и т. д. С другой стороны, эти качества мультимедийных файлов являются причиной опасений, в том числе боязни получить доступ к данным во время общения. Стеганография играет важную роль в обеспечении безопасности передаваемых данных. Изменение типа файла покрытия с цифровых мультимедийных файлов на протоколы повышает безопасность системы связи. Протоколы являются неотъемлемой частью системы связи, и эти протоколы также могут использоваться для сокрытия секретных данных, что снижает вероятность их обнаружения. Этот документ призван помочь улучшить существующие методы сетевой стеганографии за счет увеличения пропускной способности и снижения скорости обнаружения путем анализа предыдущей связанной работы. Были изучены, проанализированы и обобщены последние статьи о методах сетевой стеганографии за последний 21 год. Этот обзор может помочь исследователям понять существующие тенденции в методах сетевой стеганографии, чтобы продолжить работу в этой области для улучшения алгоритмов. Статья разделена по уровням модели OSI.
Бесплатно

Статья
Современные методы решения задач планирования выполнения пакетов заданий в многостадийных системах характеризуются наличием ограничений на их размерность, невозможностью гарантированного получения лучших результатов в сравнении с фиксированными пакетами при различных значениях входных параметров задачи. В статье автором решена задача оптимизации составов пакетов заданий, выполняющихся в многостадийных системах, с использованием метода ветвей и границ. Проведены исследования различных способов формирования порядков выполнения пакетов заданий в многостадийных системах (эвристических правил упорядочивания пакетов заданий в последовательностях их выполнения на приборах МС). Определен способ упорядочивания пакетов в последовательностях их выполнения (эвристическое правило), обеспечивающий минимизацию общего времени реализации действий с ними на приборах. На основе полученного правила сформулирован способ упорядочивания типов заданий, в соответствии с которым их пакеты рассматриваются в процедуре метода ветвей и границ. Построена математическая модель процесса реализации действий с пакетами на приборах системы, которая обеспечивает вычисление его параметров. Выполнено построение метода формирования всех возможных решений по составам пакетов заданий для заданного их количества. Решения по составам пакетов заданий разных типов интерпретируются в процедуре метода ветвей и границ с целью построения оптимальной их комбинации. Для реализации метода ветвей и границ сформулирована процедура ветвления (разбиения), предполагающая формирование подмножеств решений, включающих пакеты разных составов заданий одного типа. Построены выражения для вычисления нижних и верхних оценок значений критерия оптимизации составов пакетов для сформированных в процедуре ветвления подмножеств. Процедура отсева предполагает исключение подмножеств, нижняя оценка которых не меньше рекорда. Для поиска оптимальных решений применена стратегия поиска в ширину, предусматривающая исследование всех подмножеств решений, включающих различные пакеты заданий одного типа, полученных в результате процедуры разбиения подмножеств заданий, не исключенных из рассмотрения после реализации процедуры отсева. Разработанные алгоритмы реализованы программно, что позволило получить результаты планирования выполнения пакетов заданий в многостадийной системе, являющиеся в среднем на 30 % лучшими, чем для фиксированных пакетов.
Бесплатно

Математическая модель классификатора объектов на основе байесовского подхода
Статья
Утверждается, что первостепенное значение в решении задачи классификации занимают: нахождение условий разбиения генеральной совокупности на классы, определение качества такого расслоения и верификация модели классификатора. Рассмотрена математическая модель нерандомизированного классификатора признаков, полученных без учителя, когда априори не задается число классов, а лишь устанавливается его верхняя граница. Математическая модель приведена в виде постановки минимаксной условной экстремальной задачи и представляет собой задачу поиска матрицы принадлежности объектов к какому-либо классу. В основе разработки классификатора признаков находится синтез двумерной плотности вероятностей в пространстве координат: классы – объекты. С помощью обобщенных функций вероятностная задача поиска минимума Байесовского риска сведена к детерминированной задаче на множестве нерандомизированных классификаторов. Вместе с тем использование специально введенных ограничений фиксирует нерандомизированные правила принятия решений и погружает целочисленную задачу нелинейного программирования в общую непрерывную нелинейную задачу. Для корректного синтеза классификатора необходимы дисперсионная кривая изотропной выборки и характеристики качества классификации в зависимости от суммарной внутриклассовой и межклассовой дисперсии. Задача классификации может быть интерпретирована как частная задача теории катастроф. В условиях ограниченных исходных данных найден минимаксный функционал, отражающий качество классификации при квадратичной функции потерь. Математическая модель представлена в виде задачи целочисленного нелинейного программирования и приведена с помощью полиномиальных ограничений к виду общей задачи нелинейного непрерывного программирования. Найдены необходимые условия расслоения на классы. Эти условия могут быть использованы как достаточные при проверке гипотезы о существовании классов.
Бесплатно

Статья
Современные методы планирования процессов в конвейерных системах с буферами определенного размера между обрабатывающими приборами позволяют оптимизировать расписания выполнения единичных заданий либо фиксированных пакетов заданий при их ограниченном количестве и ограниченном количестве приборов. Применение математических моделей процессов выполнения единичных заданий (пакетов заданий), используемых этими методами, при оптимизации составов пакетов и расписаний их выполнения в системах с произвольным количеством пакетов и приборов является невозможным. В то же время математические модели процессов выполнения пакетов заданий в конвейерных системах при наличии буферов ограниченных размеров между приборами являются основой для разработки методов оптимизации их (пакетов) составов и расписаний реализации действий с ними на приборах конвейерных систем. В связи с этим в статье разработаны математические модели многостадийных процессов выполнения произвольного количества пакетов заданий в конвейерных системах при наличии промежуточных буферов ограниченных размеров для двух и трех приборов, а также для произвольного количества приборов. Использование этих моделей позволяет определять моменты времени начала выполнения пакетов заданий на приборах конвейерных систем с учетом ограниченных размеров промежуточных буферов, а также длительности интервалов времени использования этих ресурсов и эффективность их использования в течение времени. Также разработан алгоритм математического моделирования процессов выполнения пакетов заданий в конвейерных системах при наличии промежуточных буферов ограниченных размеров, осуществляющий на основе заданного порядка реализации действий с пакетами заданий на приборах конвейерных систем вычисление временных характеристик этих процессов. Осуществлена разработка приложения, реализующего синтезированные математические модели процессов выполнения пакетов заданий в конвейерных системах с промежуточными буферами ограниченных размеров и соответствующий метод моделирования этих процессов. Разностороннее тестирование разработанного приложения показало, что полученные математические модели и метод моделирования адекватно описывают ход многостадийных процессов выполнения пакетов заданий в конвейерных системах, задаваемый с использованием различных значений их (процессов) параметров.
Бесплатно

Статья
При решении задачи оптимального управления как прямыми, так и непрямыми подходами основной прием состоит в переводе задачи оптимального управления из класса бесконечномерной оптимизации в конечномерную. Однако при всех этих подходах в результате получается разомкнутое программное управление, чувствительное к неопределенностям, и для реализации которого в реальном объекте необходимо построить систему стабилизации. Введение системы стабилизации изменяет динамику объекта, а значит, оптимальное управление и оптимальная траектория должны рассчитываться для объекта уже с учетом системы стабилизации. В итоге получается, что изначальная задача оптимального управления является сложной, и часто возможность ее решения крайне зависима от типа объекта и функционала, а в случае усложнения объекта за счет введения системы стабилизации сложность задачи значительно увеличивается и применение классических подходов решения задачи оптимального управления оказывается трудоемким или невозможным. В настоящей работе предложен метод синтезированного оптимального управления, который реализует обозначенную логику разработки систем оптимального управления, преодолевая вычислительную сложность поставленной задачи за счет применения современных методов машинного обучения на основе символьной регрессии и эволюционных алгоритмов оптимизации. Согласно подходу сначала строится система стабилизации объекта относительно некоторой точки, а далее положение этой точки равновесия становится параметром управления. Таким образом, удается перевести задачу бесконечномерной оптимизации в задачу конечномерной оптимизации, а именно оптимального расположения точек равновесия. Эффективность подхода продемонстрирована на решении задачи оптимального управления мобильным роботом.
Бесплатно

Машинное обучение в задачах base-calling для методов секвенирования нового поколения
Статья
Развитие технологий секвенирования следующего поколения (NGS) внесло существенный вклад в тенденции снижения затрат и получения массивных данных секвенирования. В Институте аналитического приборостроения РАН разрабатывается аппаратно-программный комплекс (АПК) для расшифровки последовательности нуклеиновых кислот методом массового параллельного секвенирования (Нанофор СПС). Алгоритмы обработки изображений, входящие в состав АПК, играют существенную роль в решении задач расшифровки генома. Финальной частью такого предварительного анализа сырых данных является процесс base-calling. Base-calling — это процесс определения нуклеотидного основания, которое генерирует соответствующее значение интенсивности в каналах флуоресценции для различных длин волн на кадрах изображения проточной ячейки для различных циклов секвенирования методом синтеза. Приведен обширный анализ различных подходов к решению задач base-calling и сводка распространенных процедур, доступных для платформы Illumina. Рассмотрены различные химические процессы, включенные в технологию секвенирования методом синтеза, вызывающие смещения в значениях регистрируемых интенсивностей, включая эффекты фазирование / префазирование (phasing/prephasing), затухания сигнала (signal decay) и перекрестные помехи (cross-talk). Определена обобщённая модель, в рамках которой рассматриваются возможные реализации. Рассмотрены возможные подходы машинного обучения (machine learning) для создания и оценки моделей, реализующих этап обработки base-calling. Подходы ML принимают различные формы, включая обучение без учителя (unsupervised), обучение с ча-стичным привлечением учителя (semi-supervised), обучение с учителем (supervised). В работе показана возможность применения различных алгоритмов машинного обучения на основе платформы Scikit-learn. Отдельной важной задачей является оптимальное выделение признаков, выделенных в обнаруженных кластерах на проточной ячейке для машинного обучения. Наконец, на ряде данных секвенирования для приборов MiSeq Illumina и Нанофор СПС показана перспективность метода машинного обучения для решения задачи base-calling.
Бесплатно

Метод векторизации спутниковых снимков на основе их разложения по топологическим особенностям
Статья
Получение из растрового изображения объектов в векторном виде необходимо во многих сферах. Существующие методы векторизации спутниковых снимков не обеспечивают нужной точности автоматизации. В данной области требуется применять ручной труд, но объём поступающей информации зачастую превышает скорость обработки. Поэтому необходимы новые подходы для решения подобного рода задач. В статье предложен метод векторизации объектов на снимках с использованием разложения изображения на топологические особенности, который разбивает изображение на отдельные связанные структуры и при дальнейшей работе опирается уже на них. В результате уже на этом этапе изображение разбивается на древовидную структуру. Данный метод уникален по своему образу работы и в корне отличается от традиционных способов векторизации снимков. Большинство методов работает с помощью пороговой бинаризации, и основной задачей для них становится подбор порогового коэффициента. Главной проблемой в таком случае становится ситуация, когда на изображении имеется несколько объектов, для которых необходим разный порог. Метод отходит от непосредственной работы с яркостной характеристикой в сторону анализа топологической структуры каждого объекта. Предлагаемый метод имеет корректное математическое обоснование, в основе которого лежит алгебраическая топология. На основе метода разработана геоинформационная технология для автоматической векторизации растровых снимков с целью поиска находящихся на нем объектов. Тестирование проводилось на спутниковых снимках с разных масштабов. Разработанный метод сравнивался со специальным инструментом для векторизации R2V и превзошел его по средней точности. Средний процент у автоматической векторизации предложенного метода составил 81%, а у полуавтоматического векторизующего модуля R2V – 73%.
Бесплатно