Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика @vestnik-susu-cmi
Статьи журнала - Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика
Все статьи: 337
Распознавание утомления человека на основе анализа его речи с помощью нейросетевых технологий
Статья научная
Качественные психофизиологические исследования сопряжены с созданием доступных и хорошо организованных баз данных, требующих большую предварительную работу по разработке измерительных комплексов, включающих не только средства для измерения психофизиологических параметров человека, но и его эмоционального состояния, которое отображается в выражении лица, речи и поведенческих паттернах респондентов. Измерительные комплексы должны также включать и средства обработки экспериментального материала. Суть исследования состояла в проведении эксперимента по созданию прототипа базы речевых данных русскоязычных респондентов, получения ответов на методические вопросы, возникающие у специалистов при использовании базы для задачи распознавания состояния утомления человека. Разработан аппаратно-программный комплекс, позволяющий синхронно регистрировать психофизиологические параметры, видеозаписи поведенческих реакций и аудиозапись речи человека. В качестве модели физического утомления использовался кардиореспираторный тест с физической нагрузкой. До прохождения и после завершении теста добровольцы зачитывали набор стандартных фонетически представительных текстов. Полученные аудиозаписи обрабатывались с помощью специализированной нейронной сети, способной анализировать интегральные спектральные характеристики звука. Результаты эксперимента показали возможность распознавания состояния утомления человека по его речи, что позволяет перейти к созданию большого банка аудиозаписей и совершенствованию алгоритмов распознавания состояния утомления.
Бесплатно
Распределение квадратов и проверка гипотез в нечетных разбиениях чисел
Статья научная
В статье рассматриваются разбиения натурального числа n, части которого различны, нечетны и их произведение не является квадратом. Такие разбиения применимы для определения ранга группы центральных единиц целочисленного группового кольца знакопеременной группы. Количество разбиений растет экспоненциально, следовательно, задача перебора является вычислительно затратной. В статье предложен параллельный алгоритм в общей памяти для нахождения количества разбиений числа n с дополнительными условиями. Алгоритм основан на концепции распараллеливания по данным и использовании вложенного параллелизма. Выделяется множество длин K разбиения числа n, элементы которого обрабатываются параллельно. Во время обработки длины k разбиения числа n выделяется множество уровней L, рассмотрение которого также выполняется параллельно. Приемлемые значения ускорения и параллельной эффективности предложенного алгоритма получаются при использовании двух нитей на параллельный регион по длинам и двух - по уровням. Таким образом, ускорение при разных n превышает 2.1, а параллельная эффективность не опускается ниже 50 %. Полученные результаты использованы для проверки гипотез Каргаполова и анализа распределения значений нечетных разбиений на некоторых диапазонах. Предложен алгоритм поиска оптимального коэффициента c. С помощью этого алгоритма получена асимптотическая формула количества разбиения числа n, в котором части различны и нечетны, а их произведение является квадратом. Эта формула основана на экспериментальных данных и сформулирована как гипотеза.
Бесплатно
Статья научная
В статье рассматривается распределенный алгоритм с локальными взаимодействиями Patch, предназначенный для управления распределением данных и динамической балансировки нагрузки в системе фрагментированного программирования LuNA. Система LuNA используется для упрощения создания параллельных реализаций крупномасштабных численных моделей для распределенных вычислительных систем. Фрагментированная программа в системе LuNA выполняется под управлением исполнительной системы, которая использует различные алгоритмы распределения данных и вычислений для обеспечения эффективного (в плане времени исполнения и потребления ресурсов) исполнения программы. Разработанный для использования в системе LuNA распределенный алгоритм Patch предназначен для случая распределения многомерных сеток данных на многомерной решетке вычислительных узлов. Алгоритм использует отображение данных на многомерную решетку ячеек (координат), которые затем распределяются между вычислительными узлами мультикомпьютера. Такое отображение позволяет алгоритму учитывать зависимости между данными и сохранять локальность данных при динамической балансировке нагрузки. Тестирование алгоритма Patch на фрагментированной реализации реальной вычислительной задачи показало его преимущество над использовавшимся ранее в системе LuNA алгоритме Rope, в виде уменьшения суммарного объема и дальности коммуникаций между вычислительными узлами в ходе исполнения программы.
Бесплатно
Статья научная
Программная Q-система предназначена для исследования ресурса параллелизма численных алгоритмов. С помощью Q-системы можно вычислить ресурс параллелизма любого численного алгоритма, а также найти алгоритм с лучшим ресурсом параллелизма из множества алгоритмов, решающих алгоритмическую проблему. Теоретической основой Q-системы является концепция Q-детерминанта, где Q - множество операций, используемых алгоритмом. Любой численный алгоритм имеет Q-детерминант и может быть представлен в форме Q-детерминанта. Такое представление является универсальным описанием численных алгоритмов. Q-детерминант состоит из Q-термов. Их число равно числу выходных данных алгоритма. Каждый Q-терм описывает все возможные способы вычисления одного из выходных данных на основе входных данных. Q-детерминант делает алгоритм понятным с точки зрения структуры и реализации. Q-система может быть использована для повышения эффективности параллельных вычислений. В статье описаны новые возможности Q-системы. Новая функциональность позволяет использовать классификацию алгоритмов при их исследовании. Также новая функциональность дает возможность вычислять функции для аппроксимации высоты и ширины алгоритмов более точно и создавать их графическое представление. В результате интерфейс пользователя Q-системы стал более удобным, появилось больше возможностей для исследования ресурса параллелизма алгоритмов.
Бесплатно
Статья научная
В статье рассматриваются характерные особенности реализации итерационных методов решения систем линейных уравнений в задачах математической физики на параллельных вычислительных системах, которыми являются геометрическая декомпозиция расчетной области и распараллеливание данных внутри последовательно выполняемых процессором итераций с интенсивным информационным обменом между процессорами и памятью. Стандартные методы реализации итерационных методов решения систем линейных уравнений при множественных транзакциях с памятью и межпроцессорных обменах, существенно снижающих реальную производительность, дополнительно требуют от вычислительной системы наличия большого числа физических линий связи для реализации сложных топологий и иерархических схем хранения данных. Выходом является использование многопроцессорных систем с реконфигурируемой архитектурой, позволяющее адаптировать свою архитектуру под структуру итерационных алгоритмов математической физики путем распараллеливания по итерациям. В статье рассмотрена реализация метода Якоби для решения краевой задачи Дирихле для уравнения Лапласа на реконфигурируемой вычислительной системе, на примере которой показано сокращение количества внешних каналов обмена как одного из наиболее критических ресурсов реконфигурируемой вычислительной системы.
Бесплатно
Реализация транслятора RAID-5 для распределенной файловой системы GlusterFS
Статья научная
Статья посвящена реализации алгоритма RAID-5 в распределенной файловой системе GlusterFS. Анализ требований предъявляемых к масштабируемой файловой системе (ФС), способной задействовать в дисковые ресурсы узлов вычислительного кластера, показывает, что реализация распределенной версии алгоритма RAID-5 позволяет существенно повысить устойчивость ФС к сбоям отдельных узлов и даже стоек кластера. В статье дается краткий обзор принципов функционирования распределенной файловой системы GlusterFS и описывается способ встраивания алгоритма RAID-5 в эту систему. Описываются основные алгоритмы и структуры данных, реализованные для адаптации RAID-5 в распределенную ФС. Делаются выводы об устойчивости и производительности разработанной ФС. Показано, что реализованный алгоритм позволяет наращивать пропускную способность ФС до пропускной способности нижележащей сетевой системы, незначительно теряя в производительности при наличии отказавших узлов.
Бесплатно
Статья научная
В статье представлен метод уменьшения ошибки реконструкции изображения для рентгеновской компьютерной томографии путем применения вейвлет-фильтрации зашумленных проекционных данных. Вейвлет-преобразование и основанное на нем вейвлет-фильтрация одномерных сигналов дает возможность определять конкретное место соответствия частотной и временной (в данном случае пространственной по координате детекторов) области. Это позволяет однозначно определять переход из частотной области в пространственную и обратно. Для фильтрации проекционных данных используется вейвлет-преобразование, которое дает возможность через коэффициенты, определяющие масштабирующие функции и функции вейвлетов определять в частотной и пространственной области место шума в зашумленном сигнале и осуществлять выделение не зашумленного сигнала путем назначения порогов фильтрации на вышеуказанные коэффициенты. Для усиления фильтрующих свойств вейвлет-преобразования предложено разбивать проекционные данные на интервалы, для каждого из которых определяются свои коэффициенты. Вейвлет-фильтрация проводится с использованием вейвлетов Добеши. Результаты исследований были подтверждены математическим моделированием зашумленных проекционных данных, их вейвлет-фильтрации и реконструкции по ним тестового томографического изображения. Математическая модель тестового объекта исследования и разработанный авторами программный реконструктор томографического изображения позволили осуществлять моделирование прямой (получение проекционных данных по тестовому объекту), обратной (получение тестового томографического изображения по проекционным данным объекта) задач томографии и осуществлять сравнительный анализ качества реконструкции изображения с «идеальными» и зашумленными проекционными данными.
Бесплатно
Статья научная
В данной работе предлагается преобразовать стандартную последовательную топологию информационного графа с дистрибутивными операциями к комбинированному варианту с последовательными и параллельными фрагментами, что позволяет эффективно описать реализацию вычислений в ресурсонезависимойформе. Конечная топология зависит от доступного вычислительного ресурса реконфигурируемой системы иобеспечивает повышение удельной производительности в сравнении с исходным вариантом. Разработанныйалгоритм преобразования линейной структуры в различные комбинированные топологии в зависимости отконфигурации вычислительной системы описан на языке программирования Set@l.
Бесплатно
Решение одной коалиционной игры в программных стратегиях при неопределенности
Статья научная
Игровые модели конфликтных ситуаций находят широкое применение на практике при решении задач управления системами различной природы. В работе построена математическая модель дифференциальной игры двух коалиций при неопределенности в программных стратегиях, рассмотрен вариант антагонистического взаимодействия между коалициями. Дано определение решения с использованием принципа гарантированного результата. Применение метода штрафов позволило преобразовать исходную максиминную задачу на связанных множествах к задаче на максимум. Доказаны теоремы существования решения для задач со штрафами, получена оценка погрешности, условия согласования штрафных констант и необходимые условия оптимальности.
Бесплатно
Решение прикладных задач с использованием DVM-системы
Статья научная
Резюме: DVM-система предназначена для разработки параллельных программ научно-технических расчетов на языках C-DVMH и Fortran-DVMH. Эти языки используют единую модель параллельного программиро-вания (DVMH-модель) и являются расширением стандартных языков Си и Фортран спецификациями параллелизма, оформленными в виде директив компилятору. DVMH-модель позволяет создавать эффективные параллельные программы для гетерогенных вычислительных кластеров, в узлах которых в качестве вычислительных устройств наряду с универсальными многоядерными процессорами могут использоваться ускорители (графические процессоры или сопроцессоры Intel Xeon Phi). В статье описывается опыт использования DVMсистемы для распараллеливания различных прикладных программ. Рассматривается метод инкрементального или частичного распараллеливания, возможности системы для работы с неструктурированными сетками, новые средства для отображения MPI-программ на многоядерные процессоры и ускорители. Исследуется эффективность выполнения параллельных DVMH-программ на гетерогенных вычислительных кластерах K10, K-100, Ломоносов и MVS-10P. Описаны основные преимущества DVM-подхода при разработке параллельных программ. Представлены основные возможности инструментов DVM-системы для анализа производительности и функциональной отладки параллельных программ. Определяются направления для дальнейшего развития DVM-системы.
Бесплатно
Статья научная
Поиск в ширину является одним из основных алгоритмов обхода графа и базовым для многих алгоритмов анализа графов более высокого уровня. Поиск в ширину на графах является задачей с нерегулярным доступом к памяти и с нерегулярной зависимостью по данным, что сильно усложняет его распараллеливание на все существующие архитектуры. В статье будет рассмотрена реализация алгоритма поиска в ширину (основного теста рейтинга Graph500) для обработки больших графов на различных архитектурах: Intel х86, IBM Power8+, Intel KNL и NVidia GPU. Будет рассмотрены алгоритмы реализации поиска в ширину, такие как top-down обход, bottom-up обход и гибридный обход, содержащий в себе как top-down, так и bottom-up обходы. Будут описаны особенности реализации алгоритма на общей памяти, а также преобразования графа: локальная сортировка вершин графа, глобальная сортировка вершин графа, перенумерация всех вершин графа, сжатое представление вершин графа. Данные преобразования и гибридный алгоритм обхода позволяют достичь рекордных показателей производительности и энергоэффективности на данном алгоритме среди всех одноузловых систем рейтинга Graph500 и GreenGraph500.
Бесплатно
Сглаживание ломаных линий составными сплайнами Безье
Статья научная
В работе рассматривается новый итеративный метод построения на плоскости гладкого сплайна, состоящего из кубических кривых Безье и повторяющего форму заданной ломаной линии с требуемой точностью. На каждой итерации метода выполняются следующие операции: выбор количества узлов интерполяции сплайна, размещение их на заданной ломаной линии по определенному правилу, построение гладкого составного сплайна Безье, проходящего через эти узлы, и оценка точности аппроксимации, то есть, близости построенного сплайна и заданной ломаной линии. Выбор положения узлов интерполяции сплайна на заданной ломаной линии выполняется с помощью сопоставления мер близости смежных кривых Безье, из которых состоит сплайн, и участков ломаной линии, которые аппроксимируют эти кривые. Приводятся примеры сглаживания ломаных линий различной сложности, в том числе ломаных линий с самопересечениями, подтверждающие эффективность предложенного метода. Результаты работы можно использовать в различных приложениях, например, при построении траектории движения автоматических транспортных средств и мобильных роботов, при проектировании технических объектов в системах автоматизированного проектирования, при картографической генерализации линейных картографических объектов, при проектировании шрифтов и др.
Бесплатно
Сегментация 3D моделей данных с помощью мультимодального динамического графа CNN
Статья научная
В работе предложен метод семантической сегментации облаков точек в виде рельефа местности с использованием мультимодальной архитектуры сверточной нейронной сети на основе регулярного динамического взвешенного графа, которая позволяет получать точное решение задачи семантической сегментации, используя комбинацию геометрических и цветовых признаков точек. Метод может быть эффективно использован для разреженных, зашумленных, неоднородных и невыпуклых облаков точек. В работе было проведено компьютерное моделирование известных методов для семантической сегментации 3D данных с использованием эталонной коллекции данных ModelNet 40 и набора данных археологических памятников бронзового века Южного Зауралья, а именно данных, полученных в результате тахеометрической съемки комплекса археологических памятников в долине реки Синташта с использованием тахеометра Trimble 3300. Был проведен сравнительный анализ предложенного метода и современных методов 3D семантической сегментации с разными комбинациями входных признаков облаков точек, также в работе исследовано влияние на точность семантической сегментации способа формирования облака точек: в первом случае исследовалось облако точек из эталонного набора данных во втором случае применены варианты с использованием 3D регистрации на основе алгоритма ICP (iterative closest point).
Бесплатно
Система интеллектуального анализа данных физиологических исследований в спорте высших достижений
Статья научная
В работе представлена архитектура системы MedMining, которая предназначена для интеллектуального анализа данных физиологических исследований спортсменов. Система обеспечивает экспорт результатов измерений в хранилище данных. Поддерживается хранение как необработанных результатов измерений (значений, поступающих непосредственно с приборов), так и их обработанных аналогов (получаемых путем усреднения, аппроксимации или других интегрирующих действий над обработанными данными). Интеллектуальный анализ результатов измерений направлен на определение ключевых показателей результативности и эффективности методики тренировок, а также поиск трендов и аномалий в этих показателях для гибкого изменения тренировочного графика.
Бесплатно
Система учета посещаемости студентов на основе распознавания лиц
Статья научная
В настоящее время одним из значимых факторов для повышения качества подготовки специалистов является учет посещаемости студентов. Данный процесс может быть автоматизирован. В статье предлагается подход к построению системы учета посещаемости студентов на основе технологии распознаваниялиц, которая позволяет идентифицировать множество людей одновременно без прямого контакта с ними ибез использования дорогостоящего оборудования. Данный подход основан на сверточных нейронных сетях RetinaFace и ResNet, выбранных на основе обзора современных методов распознавания лиц, представленного в статье. Архитектура нашей системы учета посещаемости дополнена процедурами предобработкиизображений, которые по предложенной нами методике, основанной на мере BREN, проверяют качествоизображения и при необходимости применяют к изображению алгоритмы для уменьшения шума, повышения резкости, увеличения яркости и выравнивания цветов. Представлены результаты вычислительныхэкспериментов, показавшие более высокую эффективность предложенного подхода по сравнению с аналогами.
Бесплатно
Системный подход к суперкомпьютерному образованию
Статья научная
Система суперкомпьютерного образования создается в рамках выполнения проекта Комиссии при Президенте РФ по модернизации и технологическому развитию экономики России «Создание системы подготовки высококвалифицированных кадров в области суперкомпьютерных технологий и специализированного программного обеспечения». В данной статье дается краткая характеристика создаваемой Системы, рассматривается ее структура и основные компоненты. Главный акцент делается на системность реализуемого подхода, позволяющую заложить основу для внедрения суперкомпьютерного образования в практику образовательных учреждений России.
Бесплатно
Статья научная
В статье рассматриваются архитектура и сравнительные технические характеристики реконфигурируемых вычислительных систем (РВС) на основе программируемых логических интегральных схем (ПЛИС) семейства Xilinx Virtex-7: вычислительных модулей 24V7-750 и «Тайгета», устанавливаемых в вычислительный шкаф, и реконфигурируемого вычислительного блока «Калеано» для настольного использования. Рассматриваются также архитектура и компоновка РВС нового поколения на основе жидкостного охлаждения, приводятся результаты расчетов и макетирования основных технических решений. Рассматриваются технологии решения прикладных задач с помощью комплекса средств разработки прикладного программного обеспечения. РВС нового поколения на основе жидкостного охлаждения позволяют достичь производительности 1 Пфлопс в стандартном вычислительном шкафу высотой 47U при потребляемой мощности 150 кВт, обеспечивая, тем самым, существенное преимущество по таким технико-экономическим параметрам, как реальная и удельная производительность, энергоэффективность, массогабаритные характеристики и другим по сравнению с аналогичными системами.
Бесплатно
Создание симулятора для имитационного моделирования образовательного ресурсного центра
Краткое сообщение
Данная статья посвящена проблеме создания образовательных ресурсных центров, как средства организации экономически выгодного удаленного доступа образовательных учреждений к платному программному обеспечению. ЦОД образовательного ресурсного центра по- строен на базе инновационной технологии программно-конфигурируемых сетей, что позволяет эффективно решать проблемы маршрутизации и обеспечения качества обслуживания. Для исследования алгоритмов планирования виртуальных классов и виртуальных машин образовательного ресурсного центра необходимо создание его симулятора. С помощью диаграмм UML описывается проект создания симулятора - диаграмма вариантов использования показывает его функциональные возможности, а диаграмма деятельности - принцип его функционирования. Также разработана имитационная модель образовательного ресурсного центра, включая имитационные схемы всей системы в целом, вычислительного узла, коммутатора OpenFlow и контроллера OpenFlow.
Бесплатно
Сравнение областей истинности запросов к реляционной базе данных
Статья научная
В данной статье предлагается описание подходов аналитического сравнения пользовательских запросов к реляционной базе данных. Такое сравнение имеет целью установление возможности частичного или полного использования закэшированных на компьютере пользователя запросов к СУБД и основано на применении аппарата логики предикатов, где в качестве формул выступают логические ограничения SQL, а предикатами служат элементарные операции SQL. В случае, если результат выполнения пользовательского запроса полностью содержится в кэше, то данные можно взять оттуда, минуя запрос к удаленному серверу. Описанные подходы выражены в алгоритме использования кэшированных данных. Предложенный алгоритм также может быть использован для определения недостающих в кэше данных и последующего запроса только на эти данные. Для этого также используются аналитические вычисления, что экономит сетевой трафик и время на выполнение запросов и является принципиальным отличием данной технологии от существующих аналогов.
Бесплатно
Сравнение производительности пакетов симуляции квантовых вычислений QuEST и Intel-QS
Статья научная
В ближайшем будущем появятся квантовые компьютеры, пригодные для практического использования. Разработка квантовых алгоритмов может проводиться с использованием классических компьютеров и специализированного программного обеспечения, позволяющего симулировать работу квантовой схемы. Результаты моделирования могут использоваться для анализа алгоритма, а также способствуют ко-дизайну при разработке квантовых архитектур. Однако при планировании и выполнении численных экспериментов необходимо понимать возможности симуляторов и ограничения на параметры квантовой схемы, накладываемые характеристиками доступных классических вычислительных ресурсов. В работе представлены результаты вычислительных экспериментов по симуляции работы квантовых схем на идеальном квантовом компьютере с использованием пакетов QuEST и Intel-QS, а также собственной «наивной» реализации. Показаны ограничения на размер моделируемой квантовой системы N при использовании вычислительных систем различного класса - виртуальной машины, вычислительного сервера, вычислительного сервера с графическим ускорителем, суперкомпьютера (маскимальный достигнутый размер N = 33). Приведены характеристики производительности и масштабируемости рассматриваемых реализаций на общей и распределенной памяти (наблюдаемая эффективность масштабирования - 30 % и 70 % соответственно). Для пакета QuEST и собственной реализации представлена производительность при использовании графических сопроцессоров.
Бесплатно