Информатика и управление. Рубрика в журнале - Труды Московского физико-технического института
Cтатическая оценка производительности посредством эмбеддингов промежуточных представлений LLVM
Статья научная
Рассматривается метод отображения программ в пространство векторов (эмбеддингов) для создания инструментария эмпирической оценки производительности программы на этапе компиляции без фактического исполнения. Предлагаемый метод основан на серии трансформаций исходного промежуточного представления (IR), таких как инструментирование искусственными инструкциями в компиляторном проходе, преобразование инструментированного IR в многомерный вектор с помощью технологии IR2Vec [1] с последующим понижением размерности по алгоритму t-SNE [2]. В качестве метрики производительности предлагается доля кэш-промахов первого уровня (D1 cache misses). Приводится эвристический критерий, по которому в двухмерном пространстве есть возможность отличить программы с большой долей промахов в кэше от программ с меньшей долей. Производится экспериментальная проверка критерия на синтетических тестах.
Бесплатно
On list chromatic numbers of 2-colorable hypergraphs
Статья научная
We give an upper bound on the list chromatic number of a 2-colorable hypergraph which generalizes the Schauz bound on k-partite k-uniform hypergraphs. It makes sense for sparse hypergraphs. In particular we show that a k-uniform k-regular hypergraph has the list chromatic number 2 for k ≥ 4. Also, we obtain both lower and upper bounds on the list chromatic number of a complete s-uniform 2-colorable hypergraph in the vein of the Erd˝os-Rubin-Taylor theorem.
Бесплатно
Статья научная
Рассматривается способ и инструмент детектирования характерных паттернов на графо-структурированных промежуточных представлениях программ посредством решения задачи достижимости с контекстно-свободными (КС) ограничениями. Областями применимости исследования являются статический и гибридный анализ кода, анализ трасс исполнения ПО, графов вызовов. Статья представляет ключевые моменты методики исследования графов программ, проработки архитектурной и функциональной составляющих инструмента анализа. Представлено экспериментальное сравнение базовых алгоритмов проверки КС-достижимости на графах различной связности. Проверка концепции производится на примере детектирования специфической ситуации в работе с массивом данных посредством проведения экспериментов на разработанном программном комплексе. В работе также освещены дальнейшие направления исследования, тестирования и доработки представленного способа и инструмента.
Бесплатно
Статья научная
Представлена технология дистанционного сбора детализированных данных (Smart Monitoring) о потреблении и качестве энергоресурсов в коммунальной сфере. Под энергоресурсами (далее - ресурсами) имеются в виду электроэнергия, вода (холодная и горячая), тепловая энергия и газ. Под данными о качестве ресурса здесь понимаются параметры, характеризующие потребляемый ресурс. Представлен также вариант структуры системы сбора данных, основанный на технологии Smart Monitoring. Особое внимание уделено безопасности в системе и централизованному управлению ее элементами. Поток данных в такой системе несет в себе информацию о поведении потребителей энергоресурсов и используемом ими бытовом оборудовании. Данные о потреблении энергоресурсов для целей биллинга в такой системе являются только одной из многих и не самой главной функцией. Разработка технологии Smart Monitoring направлена на развитие рынка IT-услуг и массовых сервисов, в основе которых лежит анализ собранных детализированных данных о потреблении энергоресурсов.
Бесплатно
Автоматическое извлечение атрибутов водителя из логов мобильного приложения такси
Статья научная
Во многих задачах, решаемых в Яндекс.Такси с помощью машинного обучения, будь это обыкновенная сегментация пользователей, предсказание числа поездок в сле- дующем месяце или другие задачи, необходимо представлять пользователя приложе- ния в виде вектора признаков. Среди основных источников данных для построения такого вектора можно выделить логи мобильного приложения, которые, однако, слабо структурированы. Извлечение признаков из данных такого типа вручную осложнено характером данных: требуются серьезные знания в области человеческого поведения, а кроме этого - глубокое понимание технических деталей генерации логов. Мы раз- работали метод, который автоматически конструирует �-мерное векторное представ- ление пользователя, построенное на основе его активности в мобильном приложении. Полученное представление может использоваться как набор признаков в задачах обу- чения с учителем и без учителя. Как показывают эксперименты, опробованные модели успешно справляются с извлечением важной информации о пользователе. Мы проте- стировали наш метод в задачах обучения с учителем, решаемых в сервисе, и результаты показывают, что получаемое представление пользователя полезно как само по себе, так и в комбинации с собранными вручную признаками из истории заказов пользователя.
Бесплатно
Автомодельная редукция дифференциально-разностного уравнения для изучения его асимптотики
Статья научная
Сравниваются асимптотики решения дифференциально-разностного аналога уравнения Кортевега-де Фриза-Бюргерса, описывающего диффузию новых технологий в модели шумпетеровской динамики и решения непрерывной версии этого уравнения, полученного при автомодельной редукции Ферми-Улама.
Бесплатно
Адаптивные градиентные методы для некоторых классов задач негладкой оптимизации
Статья научная
Предложено несколько адаптивных алгоритмических методов, применимых к задачам негладкой выпуклой оптимизации. Первый из них основан на введении специальной искусственной неточности, и для его реализации предложен соответствующий аналог концепции абстрактной неточной модели целевой функции. Для этой концепции предложены аналоги градиентного метода, а также быстрого градиентного метода с адаптивной настройкой некоторых параметров неточной модели, и получена оценка качества найденного решения. Показано, что для негладких задач возможно модифицировать предложенные методы так, чтобы гарантированно выполнялась сходимость по функции со скоростью, близкой к оптимальной. Введена аналогичная концепция неточной модели для оператора поля вариационного неравенства, а также для седловой задачи и приведена оценка скорости сходимости соответствующего адаптивного варианта проксимального зеркального метода. Предложены аналоги субградиентных схем с переключениями для задач выпуклой оптимизации с ограничениями. При этом рассмотрены предположения, связанные с недавно предложенным условием относительной липшицевости. Это позволило выписать оценку качества решения с относительной точностью для задачи минимизации однородного выпуклого функционала при достаточно общих предположениях.
Бесплатно
Алгоритм вычисления граничного ранга двоичной матрицы
Статья научная
Рассматриваются методы исправления ошибки в системе параллельных каналов, в которых действуют помехи. Предложено пространство квадратных матриц над конечным полем. Граничным рангом двоичной матрицы называется минимальное число строк и столбцов, в которых содержатся все ненулевые элементы матрицы. В данной работе речь пойдет о алгоритме вычисления граничного ранга матрицы.
Бесплатно
Статья научная
При составлении планов наблюдений за космическими аппаратами (КА) радиотехническими средствами необходимо учитывать скорость вращения поворотной системы таким образом, чтобы сократить время переключения и сохранить качество плана. В данной статье предлагается квазиоптимальный алгоритм, позволяющий модифицировать план, сформированный в предположении о мгновенном переключении между КА, для работы на реальном средстве. В ходе эксперимента было продемонстрировано, что предложенный алгоритм позволяет обеспечить информативность плана на уровне 85% относительно плана для мгновенного переключения при использовании поворотной системы с максимальной скоростью 5 град/с и ускорением 1 град/с2.
Бесплатно
Статья научная
Задача сегментации речь/пауза представляет собой точное обнаружение границ начала и окончания информативных участков речи (вокализованной, невокализованной речи и пауз). Сегментация на информативные участки является важным этапом предварительной обработки речи. Точность сегментации влияет на работоспособность практически всех речевых приложений (распознавание речи, голосовое управление, идентификация диктора, преобразование речи в текст и др.). В статье представлен алгоритм сегментации речь/пауза, суть которого заключается во фрагментировании речи и декомпозиции фрагментов на эмпирические моды для последующего анализа одномерного расстояния Махаланобиса дискретных отсчетов времени каждой моды в отдельности. Проведено исследование алгоритма в сравнении с исходным алгоритмом на основе анализа одномерного расстояния Махаланобиса и известными способами сегментации на основе анализа количества пересечения сигнала через нулевую ось и кратковременной энергии. В соответствии с полученными результатами исследований сделан вывод, что разработанный алгоритм сегментации обеспечивает наилучшее обнаружение границ начала и окончания информативных участков речи с ошибками первого и второго рода 4,576% и 1,421% соответственно.
Бесплатно
Статья научная
Рассматривается задача автономной посадки и установки объекта на целевой неоднородной поверхности посредством беспилотного летательного аппарата. Целью работы является разработка алгоритмов оценивания параметров неоднородной поверхности для успешной посадки БпЛА и установки объекта. На точность посадки беспилотного аппарата и точность установки объекта влияет перепад высот по отношению к их геометрическим размерам. Предполагаемая для посадки поверхность может содержать значительные перепады высот, ввиду чего требуется оценивать сегменты данной поверхности для устойчивого расположения рассматриваемых объектов. В работе предлагаются алгоритмы оценивания неоднородности сегментов поверхности по получаемым изображениям с камеры глубины, управления БпЛА, алгоритмы оценивания перепада высот, обеспечивающие определение разности высот между соседними точками и угла наклона между ключевыми точками каждого сегмента поверхности. Данные алгоритмы позволяют анализировать доступные для посадки и установки объекта сегменты поверхности в процессе выполнения задачи посадки БпЛА, выделяя подходящие и исключая неподходящие сегменты. В качестве объектов, устанавливаемых на неоднородную поверхность, могут быть, например, датчики. Проведенные эксперименты в симуляционной среде показали, что в 97% случаев БпЛА фиксировался на поверхности с учетом заданных ограничений при общей площади участков местности в 25 и 81 км2. При изменении пороговых значений от 30 до 60% изменение количества доступных участков для посадки не превышало 5%.
Бесплатно
Алгоритмы трассирования в системе территориального проектирования
Статья научная
Приводятся алгоритмы трассирования коммуникаций на неоднородной территории. Рассмотрено применение метода локальных вариаций при представлении территории фигурами второго порядка. При наличии запретных зон в виде замкнутых многоугольников применяется алгоритм трассирования, использующий «матрицу видимости» узлов. В случае задания территории «сеткой категорийности» рассмотрены одноуровневый и двухуровневый алгоритмы трассирования, а также алгоритм трассирования на треугольной сетке категорийности территории.
Бесплатно
Статья научная
Рассматривается задача обнаружения изменения свойств случайного процесса (разладки) с неизвестными после изменения параметрами случайного процесса. В данной задаче в качестве наблюдаемого случайного процесса рассматриваются две модели: гауссовский процесс и процесс авторегрессии 1 порядка. В работе предлагается алгоритм обнаружения разладки для моделей с неизвестными параметрами после разладки: взвешенная процедура Ширяева-Робертса. Такой подход позволяет эффективно решать множество задач, встречающихся на практике, когда на самом деле до конца неизвестны свойства случайного процесса после разладки. Проведены исследования характеристик обнаружения для взвешенной процедуры Ширяева-Робертса и сравнены с характеристиками обнаружения процедуры Ширяева-Робертса, когда параметры случайного процесса после разладки известны. Анализ показал, что использование взвешенной процедуры Ширяева-Робертса позволяет обнаруживать разладку с заданным уровнем ложных обнаружений, при этом не проигрывать существенно характеристикам указанной процедуры, когда параметры случайного процесса после разладки известны.
Бесплатно
Анализ модели движения запасов газа по категориям
Статья научная
Строится непрерывная агрегированная детерминированная динамическая модель движения запасов газа по категориям. Каждая категория характеризуется своим уровнем знаний об объекте - носителе информации о запасах. Движение запасов газа по категориям описывается системой дифференциальных уравнений и схематично изображено на рисунке. Особое внимание уделяется кратности запасов. Для определения коэффициента кратности вводится временная функция, определяющая суммарные разведанные запасы природного газа. Делаются априорные предположения о ее свойствах. Рассматриваются шесть конкретных примеров. Для каждого примера определяется коэффициент кратности запасов, динамика которого подвергается анализу. Даются объяснения об особенностях поведения коэффициента кратности. Делаются соответствующие выводы.
Бесплатно
Анализ модели разработки газовых месторождений
Статья научная
Рассматривается непрерывная агрегированная динамическая модель газовых месторождений с взаимовлияющими скважинами. Аналитически исследуются различные режимы их разработки. Ставятся и решаются задачи на максимум накопленной добычи и на максимум прибыли. Предлагаемые к исследованию задачи относятся к классу задач оптимального управления со свободным правым концом и фиксированным временем.Основным математическим аппаратом является принцип максимума Понтрягина. Дополнительно выявлены условия, при которых группу месторождений в модельном представлении можно рассматривать как одно целое месторождение.
Бесплатно
Статья научная
В данном исследовании осуществляется анализ архитектур нейронных сетей на основе рекуррентных, сверточных сетей, а также на основе архитектуры трансформер, VAE, диффузионых моделей в контексте задачи дезагрегации данных о потреблении электроэнергии в промышленных объектах и домохозяйствах.
Бесплатно
Статья научная
Рассматриваются вопросы построения эффективной архитектуры нейросети для распознавания спуффинг-атак на систему лицевой биометрии, основанных на подмене в поле зрения камеры видеонаблюдения лица реального человека на видеоизображение лица другого человека, сформированного на экране носимого устройства. Проведен сравнительный анализ подходов к построению нейросетевых архитектур. Получены оценки метрик качества для каждого подхода.
Бесплатно
Аппроксимация корреляционной функции скорости транспортного средства по GPS/GLONASS-данным
Статья научная
В настоящей работе разработан подход к анализу данных о перемещении автотранспортного средства, получаемых в результате измерений, которые проводятся с помощью спутниковой навигационной системы. При использовании предлагаемого подхода скорость автотранспортного средства рассматривается как стационарный случайный процесс, корреляционная функция которого принадлежит к одному из заданных классов. По результатам мониторинга выбирается значение параметра корреляционной функции, которое в определённом смысле наилучшим образом соответствует результатам измерений. Решается также задача в определённом смысле оптимального выбора длительности интервала усреднения получаемых в результате мониторинга значений скорости, при этом учитывается, насколько при выбранной длительности интервала усреднения выборочная полученная корреляционная функция скорости соответствует корреляционной функции из гипотетического класса при выбранном значении параметра.
Бесплатно
Статья научная
Описана асимметричная криптосистема ГПТ (Габидулин-Парамонов-Третьяков), основанная на ранговых кодах Э. М. Габидулина. Представлена атака Гибсона, взломавшая эту систему. Указаны возможности восстановления ГПТ.
Бесплатно
Статья научная
Модели архитектуры Transformer стали золотым стандартом для решения многих задач обработки естественного языка. Однако для моделей, основанных на механизме внимания, невозможна обработка длинных последовательностей из-за их квадратичной сложности вычисления механизма внимания. Для решения этой проблемы мы предлагаем двухэтапный метод, который сначала собирает релевантную информацию по заданному документу, а затем объединяет ее с локальным контекстом для решения задачи. Результаты наших экспериментов показывают, что дообучение предобученной модели с аугментацией данных с помощью внешней памяти, содержащей элементы входной последовательности с наименьшей неопределенностью, повышает качество работы модели на задаче поиска ответа на вопрос по тексту по сравнению с базовой моделью. Мы также обнаружили, что содержимое глобальной памяти коррелирует с фактами из документов, необходимыми для формирования правильного ответа на вопрос.
Бесплатно