Статьи журнала - Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика

Все статьи: 329

Организация обмена данными в рамках платформы мобильной медицины

Организация обмена данными в рамках платформы мобильной медицины

Волков Иван Алексеевич, Радченко Глеб Игоревич, Черных Андрей Николаевич

Статья научная

Мобильная медицина является важной составляющей для реализации постоянного мониторинга здоровья, который открывает для врачей, пациентов и исследователей новые возможности. Экспоненциальныйрост сферы привел к увеличению скорости появления новых решений на рынке здравоохранения и, соответственно, к увеличению количества информации о здоровье населения. Однако сегодня практически всясобираемая сервисами мобильной медицины информация изолирована друг от друга, так как распределенапо разным сайтам и мобильным приложениям. Отсутствие у пользователя возможности удобно управлятьсвоими медицинскими данными и делиться ими является существенной проблемой на текущий момент.Создание платформы мобильной медицины позволит решить данную проблему, предлагая механизмы наоснове которых сторонние разработчики могут размещать свои сервисы и организовывать межсервисныйобмен данными пользователей. В рамках нашей работы мы провели анализ существующих решений нарынке мобильной медицины, описали варианты использования сервисов в сфере мобильной медицины. Нами предложена концепция платформы мобильной медицины и проведено сравнение способов организацииобмена медицинскими данными. На основе проведенного анализа нами был выбран и реализован прототипсистемы обмена медицинскими данными между мобильными клиентами на основе однорангового (peer-to-peer) соединения.

Бесплатно

Особенности реализации алгоритма Treecode для решения задачи n-тел с использованием графических ускорителей

Особенности реализации алгоритма Treecode для решения задачи n-тел с использованием графических ускорителей

Титов Александр Викторович, Хоперсков Александр Валентинович

Статья научная

Иерархические методы вычисления гравитационных сил для систем N-тел позволяют существенно увеличить качество численного моделирования при решении различных астрофизических задач за счет увеличения числа элементов N, поскольку вместо вычислительной сложности ~O(N2) для прямого метода, мы имеем N log(N) при использовании приближенного метода TreeCode, что позволяет существенно увеличить число частиц в численных моделях. Разработано новое программное обеспечение для решения динамической задачи с большим числом частиц для моделирования галактических бесстолкновительных компонент, в частности, звездной подсистемы и темной массы. В работе представлены результаты тестирования алгоритма TreeCode для параллельной реализациии на графических ускорителях NVidia Tesla. Для построения иерархической системы сеток нами реализован быстрый алгоритм построения октодеревьев, основанный на пространственной кривой Мортона. Для оценок качества построенной численной модели используем для сравнения результаты моделирования на основе прямого вычисления сил взаимодействия между всеми N частицами системы. Проведен анализ быстродействия различных реализаций алгоритмов решения задачи N-тел и выполнения интегральных законов сохранения физических характеристик для гравитирующих систем. В частности, проанализированы законы сохранения энергии и момента импульса для вращающегося самогравитирующего диска. Рассмотрены модели с различными критериями оценки удаленности частицы и значениями угла раскрытия θ.

Бесплатно

Отображение на кластеры с графическими процессорами DVMH-программ с регулярными зависимостями по данным

Отображение на кластеры с графическими процессорами DVMH-программ с регулярными зависимостями по данным

Бахтин Владимир Александрович, Колганов Александр Сергеевич, Крюков Виктор Алексеевич, Поддерюгина Наталия Викторовна, Притула Михаил Николаевич

Статья научная

В 2011 г. для новых гетерогенных и гибридных суперкомпьютерных систем в Институте прикладной математики им. М.В. Келдыша РАН была предложена модель DVMH (DVM for Heterogeneous systems), разработаны языки программирования высокого уровня, представляющие собой стандартные языки Фортран и Си, расширенные директивами отображения программы на параллельную машину, оформленными в виде специальных комментариев (или прагм). В статье описываются проблемы и методы отображения циклов с зависимостями на графические процессоры, демонстрируется эффективность разработанных на языке Fortran DVMH параллельных программ с регулярными зависимостями по данным.

Бесплатно

Оценка локальности параллельных алгоритмов, реализуемых на графических процессорах

Оценка локальности параллельных алгоритмов, реализуемых на графических процессорах

Лиходед Н.А., Полещук М.А.

Статья научная

Исследуется задача получения блоков операций и потоков операций параллельного алгоритма, приводящих к меньшему числу обращений к глобальной памяти и к эффективному использованию параллельными потоками вычислений кэшей и разделяемой памяти графического процессора. Сформулированы и доказаны утверждения, позволяющие оценить объем коммуникационных операций, порождаемых альтернативными вариантами задания размеров блоков вычислений, а также минимизировать число промахов кэша за счет использования временной и пространственной локальности данных с учетом размера и длины строк кэша. Исследования конструктивны и допускают программную реализацию для практического использования.

Бесплатно

Оценка популярности авторов социальной сети с помощью поиска экспертов на примере сервиса Twitter

Оценка популярности авторов социальной сети с помощью поиска экспертов на примере сервиса Twitter

Миниахметов Руслан Марсович, Цацина Елизавета Олеговна

Статья научная

В данной работе рассмотрена смешанная языковая модель, применяемая для поиска экспертов в таких областях как анализ социальных сетей и информационный поиск, предложена адаптация этой модели для социальной сети Twitter. Рассмотрены метрики популярности в социальной сети Twitter. Предложена формула оценки популярности пользователей социальой сети Twitter с учетом оценки релевантности их сообщений заданной теме, а также описан прототип системы для сбора данных и оценки популярности по предложенной формуле.

Бесплатно

Очистка сенсорных данных в интеллектуальных системах управления отоплением зданий

Очистка сенсорных данных в интеллектуальных системах управления отоплением зданий

М.Л. Цымблер, Я.А. Краева, Е.А. Латыпова, Е.В. Иванова, Д.А. Шнайдер, А.А. Басалаев

Статья научная

В современных интеллектуальных системах управления отоплением зданий зачастую возникают пропуски значений или выбросы в показаниях температурных и других датчиков ввиду сбоев программного или аппаратного обеспечения либо человеческого фактора. Для обеспечения эффективного анализа данных и принятия решений некорректные данные датчиков следует очищать путем восстановления пропущенных значений и сглаживания выбросов. В данной статье представлен пример SCADA-системы ПолиТЭР для управления отоплением, установленной в Южно-Уральском государственном университете, и описана структура и принципы реализации Модуля очистки данных, внедренного в указанную систему. Модуль очистки данных реализован с помощью технологий интеллектуального анализа данных и нейронных сетей в виде набора следующих подсистем. Препроцессор извлекает необработанные данные из хранилища данных системы и подготавливает обучающий набор данных для дальнейшей обработки. Предиктор представляет собой рекуррентную нейронную сеть для прогнозирования следующего значения датчика на основе его исторических данных. Реконструктор определяет, является ли текущее значение датчика выбросом, и в таком случае заменяет его на синтетическое значение, полученное Предиктором. Наконец, Детектор аномалий в режиме реального времени обнаруживает аномальные промежутки в данных датчика. В вычислительных экспериментах на реальных данных разработанный модуль показал относительно высокую и стабильную точность, а также адекватное обнаружение аномалий.

Бесплатно

Пакет параллельных прикладных программ Helmholtz3D

Пакет параллельных прикладных программ Helmholtz3D

Бутюгин Дмитрий Сергеевич

Статья научная

В работе представлен пакет параллельных прикладных программ Helmholtz3D, который позволяет проводить расчеты трехмерных электромагнитных полей с гармонической зависимостью от времени, распространяющиеся в трехмерных областях со сложной геометрией. Для решения возникающих в результате аппроксимаций систем линейных алгебраических уравнений (СЛАУ) с комплексными плохообусловленными неэрмитовыми матрицами используются современные итерационные методы решения СЛАУ в подпространствах Крылова совместно с оригинальными параллельными предобуславливателями. Апробация пакета проведена на серии методических и практических задач расчета электромагнитных полей для волновых устройств и задач электромагнитного каротажа.

Бесплатно

Параллельная СУБД с открытым исходным кодом для кластерных вычислительных систем

Параллельная СУБД с открытым исходным кодом для кластерных вычислительных систем

Гавриш Евгений Владимирович, Колтаков Алексей Владимирович, Медведев Александр Андреевич, Соколинский Леонид Борисович

Статья научная

Статья посвящена вопросам разработки параллельной СУБД с открытым исходным кодом для кластерных вычислительных систем. Дан обзор известных решений в этой области. Рассмотрена новая параллельная СУБД «Омега» с открытым исходным кодом, ориентированная на кластерные вычислительные системы. Приведена общая архитектура системы «Омега». Представлены диаграмма размещения и диаграмма классов. Описаны основные подсистемы СУБД «Омега» и принципы их взаимодействия при выполнении запросов.

Бесплатно

Параллельная декомпозиция реляционных операций на основе распределенных колоночных индексов

Параллельная декомпозиция реляционных операций на основе распределенных колоночных индексов

Иванова Елена Владимировна, Соколинский Леонид Борисович

Статья научная

Данная статья является продолжением и развитием более ранней работы авторов, в которой была рассмотрена декомпозиция операций пересечения и соединения колоночных индексов на основе доменно-интервальной фрагментации. Такая декомпозиция позволяет организовать параллельное выполнение реляционных операций над распределенными колоночными индексами без массовых обменов данными между процессорными узлами. В настоящей статье рассматривается декомпозиция операций проекции, выбора, удаления дубликатов и объединения. Кроме этого, вводится новый вид колоночных индексов, названных колоночными хеш-индексами. Колоночный хеш-индекс способен индексировать сразу несколько атрибутов отношения. Для распределенных колоночных хеш-индексов рассматривается декомпозиция операций пересечения, объединения и естественного соединения.

Бесплатно

Параллельная реализация алгоритма поиска минимальных остовных деревьев с использованием центрального и графического процессоров

Параллельная реализация алгоритма поиска минимальных остовных деревьев с использованием центрального и графического процессоров

Колганов А.С.

Статья научная

Решение задачи поиска минимальных остовных деревьев является распространенной в различных областях исследований: распознавание различных объектов, компьютерное зрение, анализ и построение сетей (например, телефонных, электрических, компьютерных, дорожных и т.д.), химия и биология и многие другие. Обработка больших графов - достаточно трудоемкая задача для центрального процессора (CPU) и является востребованной в данное время. Все более широкое распространение для решения задач общего назначения получают графические ускорители (GPU), имеющие большую вычислительную мощность, чем CPU. В данной статье рассмотрены методы сжатия и преобразования исходных графов для повышения эффективности их обработки. На примере алгоритма поиска минимальных остовных деревьев исследованы предложенные подходы. Исследована возможность гибридной реализация данного алгоритма. Получены самые высокие результаты по производительности на графах R-MAT и SSCA2.

Бесплатно

Параллельная реализация алгоритма разреженного QR разложения для прямоугольных верхних квазитреугольных матриц со структурой разреженности типа вложенных сечений

Параллельная реализация алгоритма разреженного QR разложения для прямоугольных верхних квазитреугольных матриц со структурой разреженности типа вложенных сечений

Харченко Сергей Александрович, Ющенко Алексей Александрович

Статья научная

В работе рассматривается параллельная MPI+threads+SIMD реализация алгоритма вычисления разреженного QR разложения специальным образом упорядоченной прямоугольной матрицы на основе разреженных блочных преобразований Хаусхолдера. В алгоритме производится предварительное независимое параллельное вычисление QR разложений для наборов строк матрицы. Затем в соответствии с деревом вычислений производится вычисление QR разложения матриц, составленных из R факторов строчных разложений. Приводятся результаты экспериментов, подтверждающие эффективность предложенной параллельной реализации для тестовых задач. Алгоритм также может быть эффективно реализован на гетерогенных кластерных архитектурах с ускорителями типа GPGPU.

Бесплатно

Параллельная реализация каталитической реакции (CO + O 2 -> CO 2) с помощью асинхронного клеточного автомата

Параллельная реализация каталитической реакции (CO + O 2 -> CO 2) с помощью асинхронного клеточного автомата

Шарифулина Анастасия Евгеньевна

Статья научная

Представлена параллельная реализация асинхронного клеточного автомата, моделирующего классическую реакцию гетерогенного катализа - окисление монооксида углерода на поверхности платины. В каталитических реакциях в неравновесных условиях могут возникать различные критические явления (автоколебания, хаос, гистерезис). Помимо фундаментального интереса изучение механизма протекания каталитических процессов на металлах платиновой группы имеет важное практическое применение, связанное с использованием в каталитических преобразователях для очистки выхлопных газов. Сложное поведение нелинейных каталитических систем наиболее эффективно может быть описано с помощью асинхронного клеточного автомата, который еще называют кинетическим методом Монте-Карло. КА-моделирование реакций гетерогенного катализа требует решения задач больших размеров, поэтому необходимо использовать эффективные алгоритмы распараллеливания. Распараллеливание асинхронных КА сопряжено с определёнными трудностями, которых можно избежать, преобразовав асинхронный КА в блочно-синхронный. Блочно-синхронный режим работы уменьшает стохастичность моделируемого процесса, поэтому необходимо проверить эквивалентность эволюций асинхронного и блочно-синхронного КА. Для этого проводится статистический анализ основных характеристик моделирования реакции окисления: бифуркационных диаграмм, функций распределения концентраций реагентов, математических ожиданий и дисперсий концентраций, полученных с помощью асинхронного и блочно-синхронного КА. Вычисленные характеристики свидетельствуют о совпадении эволюций асинхронного и блочно-синхронного КА. Кроме того, выполнено сравнение эволюций асинхронного и блочно-синхронного КА для моделей «ZGB» и «наивная диффузия». На основе полученных результатов делается вывод о приемлемой точности аппроксимации асинхронного режима блочно-синхронным для класса задач «реакция - диффузия». В статье представлены результаты распараллеливания блочно-синхронного КА и приведены оценки эффективности параллельной реализации.

Бесплатно

Параллельная реализация мелкозернистых алгоритмов в системе WinALT

Параллельная реализация мелкозернистых алгоритмов в системе WinALT

Остапкевич Михаил Борисович

Статья научная

Дано краткое описание системы имитационного моделирования алгоритмов и структур с мелкозернистым параллелизмом WinALT. Отличительные черты системы - визуальное построение и отладка моделей, а также ориентация не только на клеточный автомат и некоторые его расширения, но и на широкий спектр других мелкозернистых алгоритмов. Рассмотрена существующая подсистема параллельного исполнения, которая позволяет выполнять моделирование с использованием кластеров Windows машин. Сформулированы требования к новой проектируемой подсистеме параллельного исполнения, которая пригодна для исполнения моделей на широком спектре современных параллельных ЭВМ. Предложена ее архитектура, рассмотрены режимы параллельного исполнения моделей и сформулированы планы развития системы.

Бесплатно

Параллельная реализация следящего алгоритма для решения нестационарных задач линейного программирования

Параллельная реализация следящего алгоритма для решения нестационарных задач линейного программирования

Соколинская Ирина Михайловна, Соколинский Леонид Борисович

Статья научная

В статье описывается параллельный алгоритм решения нестационарных задач линейного программирования большой размерности, ориентированный на кластерные вычислительные системы. В основе алгоритма, получившего название «следящий», лежат фейеровские отображения. Алгоритм отслеживает изменения исходных данных и вносит корректировки в вычислительный процесс. При этом задача разбивается на большое количество подзадач, которые могут решаться независимо без обменов данными. Приводятся диаграммы деятельности UML, описывающие реализацию следящего алгоритма.

Бесплатно

Параллельная реализация стохастической клеточно-автоматной модели рекомбинации электронов и дырок в 2D и 3D неоднородных полупроводниках

Параллельная реализация стохастической клеточно-автоматной модели рекомбинации электронов и дырок в 2D и 3D неоднородных полупроводниках

Сабельфельд Карл Карлович, Киреева Анастасия Евгеньевна

Статья научная

В работе представлены стохастические клеточно-автоматные модели рекомбинации электронов и дырок в неоднородном полупроводнике для двумерного и трехмерного случаев. С помощью разработанных клеточно-автоматных моделей рекомбинации исследовано пространственно-временное распределение частиц, обнаружено и исследовано формирование макрокластеров электронов и дырок. В связи стем, что интегральные характеристики процесса рекомбинации вычисляются с помощью осреднения по большому ансамблю начальных данных, для сокращения времени вычислений разработаны параллельные программы, реализующие клеточно-автоматные модели рекомбинации в двумерном и трехмерном случаях. Параллельная реализация программ позволила вычислить за приемлемое время интегральные характеристики процесса: плотности частиц и интенсивность фотолюминесценции, для большого числа различных начальных условий, а также изучить кинетику процесса рекомбинации при наличии центров рекомбинации и диффузии частиц в двумерном и трехмерном случаях.

Бесплатно

Параллельное вычисление оценки приближенно оптимальных управлении

Параллельное вычисление оценки приближенно оптимальных управлении

Фесько Олесь Владимирович

Статья научная

Предложен метод расчета априорной оценки на основе достаточных условий оптимальности Кротова, позволяющей судить о качестве приближенного решения, полученного в ходе работы программы улучшения управления для задач оптимизации динамических систем. Метод реализован в виде параллельного алгоритма, являющегося частью программного комплекса оптимизации динамических систем на множествах кусочно-постоянных и кусочно-линейных управлений. Представленная процедура, кроме того, используется на этапе поиска начального управления при решении задач оптимального управления. Применение алгоритма и анализ эффективности его распараллеливания в рамках системы параллельного программирования с открытой архитектурой OpenTS демонстрируется в вычислительных экспериментах на примерах решения задач об оптимизации бифункциональной каталитической смеси и оптимального производства белка в биореакторе.

Бесплатно

Параллельное решение систем линейных уравнений на гибридной архитектуре CPU+GPU

Параллельное решение систем линейных уравнений на гибридной архитектуре CPU+GPU

Недожогин Никита Сергеевич, Копысов Сергей Петрович, Новиков Александр Константинович

Статья научная

В статье рассматривается параллельная реализация решения систем линейных алгебраических уравнений на вычислительных узлах, содержащих центральный процессор (CPU) и графические ускорители (GPU). Производительность параллельных алгоритмов для классических схем метода сопряженных градиентов при совместном использовании CPU и GPU существенно ограничивается наличием точек синхронизации. В статье исследуется конвейерный вариант метода сопряженных градиентов с одной точкой синхронизации и возможностью распределения нагрузки между CPU и GPU при решении систем уравнений большой размерности. Численные эксперименты проведены на тестовых матрицах и вычислительных узлах разной производительности гетерогенного кластера, что позволило оценить вклад коммуникационных затрат. Алгоритмы реализованы при совместном использованием технологий MPI, OpenMP и CUDA. Предложенные алгоритмы, помимо сокращения времени выполнения, позволяют решать системы линейных уравнений и большего порядка, для которых не обеспечиваются необходимые ресурсы памяти одним GPU или вычислительным узлом. При этом, конвейерный блочный алгоритм сокращает общее время выполнения за счет уменьшения точек синхронизации и объединения коммуникаций в одно сообщение.

Бесплатно

Параллельные методы и технологии декомпозиции областей

Параллельные методы и технологии декомпозиции областей

Ильин Ильин Валерий

Статья научная

Рассматриваются параллельные методы декомпозиции областей для решения трехмерных сеточных краевых задач, получаемых в результате конечно-элементных или конечно-объемных аппроксимаций. Данные проблемы являются «узким горлышком» среди различных этапов математического моделирования, поскольку современные требования к разрешающей способности сеточных алгоритмов приводят к необходимости решения систем линейных алгебраических уравнений с числом неизвестных в сотни миллионов и с очень плохой обусловленностью, что вызывает экстремальную ресурсоемкость расчетов. Описываются многопараметрические варианты алгоритмов с различной размерностью декомпозиции — одномерной, двумерной и трехмерной, — с пересечением или без пересечения подобластей, при использовании величин перехлеста как оптимизирующих параметров, а также с различными видами внутренних условий сопряжения на смежных границах (Дирихле, Неймана или третьего рода). Исследуются вариационные итерационные процессы крыловского типа в пространствах следов с разными предобуславливающими подходами: операторы Пуанкаре-Стеклова, блочный метод Чиммино, альтернирующий метод Шварца аддитивного типа, а также грубо-сеточная коррекция, являющаяся в определенном смысле упрощенным вариантом алгебраического многосеточного подхода. Проводится сравнительный анализ критериев эффективности распараллеливания на многопроцессорных вычислительных системах.

Бесплатно

Параллельный алгоритм восстановления сенсорных данных в режиме реального времени для многоядерного процессора

Параллельный алгоритм восстановления сенсорных данных в режиме реального времени для многоядерного процессора

Цымблер Михаил Леонидович, Полуянов Андрей Николаевич, Краева Яна Александровна

Статья научная

В настоящее время во многих предметных областях обработка сенсорных данных в режиме реального времени связана с необходимостью синтеза значения соответствующего временного ряда, которое было пропущено ввиду технического сбоя или человеческого фактора. В данной статье предлагается параллельный алгоритм восстановления пропущенных значений потокового временного ряда в режиме реального времени для многоядерного процессора. Алгоритм использует набор опорных временных рядов, которые имеют семантическую связь с исходным рядом. Алгоритм применяет следующую эвристику: если в опорных рядах имеют место повторяющиеся (схожие) подпоследовательности, то в ряде, содержащем пропущенное значение, повторяющиеся подпоследовательности возникают в тех же временных интервалах. Образцами поиска для каждого опорного ряда полагаются подпоследовательности заданной длины, оканчивающиеся в момент пропуска значения в исходном ряде. Схожесть подпоследовательностей с образцом определяется на основе меры DTW (Dynamic Time Warping), имеющей квадратичную вычислительную сложность относительно длины подпоследовательности. Применяется техника нижних границ схожести, позволяющая отбрасывать подпоследовательности, заведомо непохожие на образец, без вычисления DTW. Нижние границы имеют меньшую, чем у DTW сложность, и вычисляются параллельно. Восстановленное значение вычисляется как среднее арифметическое последних элементов найденных интервалов. В вычислительных экспериментах предложенный алгоритм демонстрирует высокую точность восстановления в сравнении с аналогами и быстродействие, приемлемое для применения алгоритма в режиме реального времени.

Бесплатно

Параллельный алгоритм вычисления матрицы евклидовых расстояний для многоядерного процессора Intel Xeon Phi поколения Knights Landing

Параллельный алгоритм вычисления матрицы евклидовых расстояний для многоядерного процессора Intel Xeon Phi поколения Knights Landing

Речкалов Тимофей Валерьевич, Цымблер Михаил Леонидович

Статья научная

Вычисление матрицы Евклидовых расстояний требуется в широком спектре задач, связанных с интеллектуальным анализом данных. В настоящее время большое количество параллельных алгоритмов решения этой задачи реализовано для графических процессоров. Однако данные разработки не могут быть просто перенесены на многоядерные системы архитектуры Intel Many Integrated Core. В статье предлагается параллельный алгоритм вычисления матрицы Евклидовых расстояний на многоядерном процессоре Intel Xeon Phi поколения Knights Landing для случая, когда входные данные могут быть размещены в оперативной памяти. Данный алгоритм использует блочно-ориентированную схему организации вычислений, которая позволяет эффективно использовать возможности векторизации вычислений Intel Xeon Phi. В алгоритме применена нетривиальная компоновка данных в оперативной памяти для уменьшения количества кэш-промахов процессора во время вычислений. Эксперименты на реальных и синтетических наборах данных показали, что предложенный алгоритм хорошо масштабируется и опережает аналоги в случае прямоугольных матриц с данными малой размерности.

Бесплатно

Журнал