Программные системы: теория и приложения @programmnye-sistemy
Статьи журнала - Программные системы: теория и приложения
Все статьи: 433

Система извлечения упоминаний симптомов из текстов на естественном языке с помощью нейронных сетей
Статья научная
В статье представлена система для извлечения упоминаний симптомов из медицинских текстов на естественном (русском) языке. Система осуществляет нахождение симптомов в тексте, их нормализацию (приведение к стандартной форме) и отождествление - отнесение найденного симптома к группе однотипных симптомов. Каждый этап обработки реализуется с помощью отдельной нейронной сети. Состав извлекаемых симптомов ограничен тремя видами заболеваний - аллергические и пульмонологические заболевания, а также коронавирусная инфекция (COVID-19). Представлен и описан аннотированный корпус предложений, использованный для обучения нейросети нахождению упоминаний симптомов, относящихся к этим трем заболеваниям. При разметке корпуса был использован простой XML-подобный язык. Для представления предложений, непосредственно поступающих на вход нейросети, предложен расширенный BIO-формат разметки. Для каждого этапа приведены оценки точности (для первого этапа точность оценивалась при строгом и гибком тестировании). Описаны подходы и реализация приведения к стандартной форме и отождествления упоминаний симптомов. Даны сравнения с аналогичными работами по извлечению симптомов из медицинских текстов на разных языках, а также показано место данной системы в системах поддержки принятия клинических решений.
Бесплатно

Систематический обзор методов составления тестовых инвариантов
Статья обзорная
Тестирование инвариантами (metamorphic testing) - один из наиболее эффективных методов тестирования программ, для которых сложно подбирать тестовые примеры и формулировать тестовые оракулы. При тестировании инвариантами вместо проверки правильности вывода программы на отдельных наборах входных данных проверяется выполнение тестового инварианта (metamorphic relation) - функции от нескольких наборов исходных данных и соответствующих им ответов программы. Составление тестовых инвариантов требует понимания решаемой программой задачи и творческого подхода. Предлагаемый систематический обзор посвящён выявлению широкоприменимых методик получения инвариантов и повторяющихся приёмов составления инвариантов в разных научных областях. На основе проведенного анализа предложена классификация инвариантов на шесть основных типов, выявлены типовые преобразования исходных данных, используемые при составлении инвариантов в нескольких областях знаний. Результаты обзора будут полезны исследователям в примененении тестирования инвариантами на практике к верификации наукоемких программ и алгоритмов машинного обучения.
Бесплатно

Системы поддержки принятия решений в медицине
Статья научная
Современная медицина осваивает системы поддержки принятия решений (СППР). Анализируя российские и зарубежные источники, работа выявляет основные барьеры на пути создания СППР для медицины. Приводятся возможные подходы к преодолению концептуальных барьеров, предлагается возможное комплексное решение проблемы. Рассматривается гибридная модель СППР широкого класса для медицины. Результаты могут быть использованы разработчиками ИТ для построения СППР на основе научной и эмпирической компонент медицинских знаний.
Бесплатно

Скрытые резервы системных сетей суперкомпьютеров Blue Waters (IBM) и Gemini (CRAY)
Статья научная
Рассматриваются простые возможности повышения характеристик интерконнекта суперкомпьютеров Blue Waters (IBM) и Gemini (CRAY) за счет использования системных сетей с прямыми каналами.
Бесплатно

Слияние циклов для локализации данных
Статья научная
Для улучшения локализации данных используется слияние циклов. Слияние циклов, имеющих общие переменные, может ускорить исполнение за счёт уменьшения количества кэш-промахов. Это преобразование известно давно, но компиляторы выполняют его лишь для простейших случаев.Наши улучшенные алгоритмы используют предварительные преобразования для корректного слияния циклов, имеющих разное количество итераций и информационные зависимости.
Бесплатно

Современные методы автоматического анализа темпоральных выражений в текстах на~естественном языке
Статья научная
Статья посвящена вопросу извлечения из текста на естественном языке информации о времени путем анализа указаний на время, которые в нем содержатся. В работе представлен обзор современных достижений в данной области, прежде всего в применении к текстам на английском языке. Рассмотрены методы и подходы, используемые авторами западных систем автоматического анализа текстов, а также предложение по использованию аналогичного подхода к русскоязычному материалу. Выявлены наиболее проблемные с точки зрения анализа участки текста, а именно — анафорические, дейктические и эллиптированные элементы темпоральных выражений
Бесплатно

Современные методы анализа модальности в текстах на естественном языке
Ред. заметка
Статья содержит обзор современных подходов к разметке и распознаванию модальной информации в текстах на естественном языке. Широко распространенные точки зрения представлены в их разнообразии --- как те, которые нацелены на обработку модальности в широком смысле (включая смежные характеристики, такие как временной план, эвиденциальность и пр), так и те, которые предназначены для отделения модализованной информации от немодализованной.
Бесплатно

Статья обзорная
Дан сравнительный анализ производительности серверных ARM./процессоров, используемых на~суперЭВМ или ориентированных в частности на~высокопроизводительные вычисления (HPC). В~стартовый анализ производительности были отобраны Fujitsu A64FX, Marvell ThunderX2 и Huawei Kunpeng 920. Обзор производительности для HPC сосредоточен в~первую очередь на~тестах и приложениях для A64FX, поддерживающего более длинные, чем у~других ARM./процессоров, вектора и имеющего большую пиковую производительность. Производительность A64FX сопоставлена с~соответствующими данными для Intel Xeon Skylake и Cascade Lake, и AMD EPYC с~Zen 2 и 3 (Roma и Milan), а также с~GPU Nvidia V100 и A100. Сформулирован краткий набор потенциальных плюсов и минусов микроархитектуры A64FX. Сопоставлены данные о~производительности, получаемой с~применением различных компиляторов для A64FX. Сформированы признаки, когда A64FX дает обычно преимущества в~производительности относительно x86-64, а когда~.-- проигрывает x86-64. Подтверждается, что применение A64FX в~суперЭВМ может расти далее. Возможно, гегемония x86-64 в~HPC будет уменьшаться, в~том числе за счет расширения применения серверных ARM./процессоров. Однако проведенный анализ A64FX и ожидаемых в~ближайшее время новых процессоров архитектуры AArch64 показал, что ведущим в~этом процессе не обязательно окажется A64FX.
Бесплатно

Современные тенденции в области хранения и обработки сенсорных данных
Статья научная
Содержится обзор современных тенденций в области хранения и обработки сенсорных данных, различные подходы рассматриваются с точки зрения применимости к организации масштабируемых высокопроизводительных хранилищ данных, выделены наиболее перспективные решения с учетом специфики сенсорных данных и их использования
Бесплатно

Специализатор CILPE: частичные вычисления для объектноориентированных языков
Статья научная
В работе рассмотрена специализация программ на основе метода частичных вычислений применительно к программам на объектноориентированных языках. Дан обзор возможностей известных специализаторов для языков этого класса, приведено сравнение специализаторов. Описаны возможности специализатора CILPE и приведен пример его использования.
Бесплатно

Специализатор JaSpe: BT-объекты и межпроцедурный аспект алгоритма анализа времен связывания
Статья научная
Статья посвящена частичным вычислениям, использующим offline-стратегию. Мощность этого метода решения задачи специализации программ во многом зависит от анализа времен связывания, который размечает программные конструкции как выполнимые либо невыполнимые на этапе специализации. Анализ времен связывания может использовать несколько вариантов разметки полей класса, зависящих от их использования в программе. Увеличивая число потенциальных оптимизаций, такая поливариантность по классам позволяет эффективно специализировать большее число программ. Наибольший эффект достигается на объектно./ориентированных языках, предполагающих создание большого количества различающихся по~ назначению экземпляров класса. Известные алгоритмы анализа времен связывания расширяются до поливариантности по классам и распрострают их на~объектно./ориентированный язык общего назначения. Новые методы реализованы в~виде набора плагинов для Eclipse IDE, составляющих специализатор JaSpe для программ на Java.
Бесплатно

Статья научная
Анализ времени связывания в частичных вычислениях, нацеленных на оптимизацию программ, разделяет программные конструкции на статические и динамические. Статические конструкции исполняются специализатором, а динамические переходят в результирующую программу. Частичные вычисления применяются в основном для нетривиальной компиляции программ без компилятора, при наличии лишь интерпретатора и специализатора. Эффективность их существенно зависит от качества разметки программы, получаемой в результате анализа времени связывания.Статья посвящена особенностям алгоритма анализа времени связывания специализатора JaSpe, разрабатываемого авторами данной публикации для широко распространенного объектно-ориентированного языка Java. Она содержит основные понятия, использованные при реализации анализа времени связывания, внутрипроцедурную версию алгоритма и обсуждение деталей анализа конструкций, использующих ссылочные типы данных.Алгоритм отличается от предшествующих аналогов, из числа работающих с программами на объектно-ориентированных языках, нетривиальной обработкой конструкций ветвления (if, switch), циклов (for, while, do) и блочных инструкции, которые содержат последовательность других инструкций...
Бесплатно

Способы повышения производительности систем хранения данных
Статья научная
В статье рассматриваются основные способы повышения производительности систем хранения данных (СХД). Определяется направление совершенствования высокопроизводительных СХД (ВСХД)
Бесплатно

Сравнительная оценка методов планирования приложений в распределенных вычислительных средах
Ред. заметка
Работа посвящена анализу эффективности известных алгоритмов планирования пакетов задач и композитных приложений в распределенных вычислительных средах (РВС). Сравнение алгоритмов производится на основе результатов имитационных экспериментов для различных примеров приложений и конфигураций РВС. Имитационное моделирование позволяет избежать проведения длительных натурных экспериментов и обеспечить воспроизводимость результатов. Помимо полученных результатов описывается используемая имитационная модель (симулятор) РВС на базе платформы SimGrid
Бесплатно

Статья научная
Работа посвящена анализу современного состояния исследований в области алгоритмического, математического и программного обеспечения распределения задач по вычислительным узлам гетерогенной вычислительной среды. Предложена классификация стратегий распределения нагрузки: по принципу учета динамики, по принципу управления, по признаку универсальности, с прогнозированием/без прогнозирования состояния системы и пр. Рассмотрен ряд методов, систем и комплексов распределения нагрузки, в том числе следующие: метод с представлением задачи в виде направленного ациклического графа, модель планировщика задач на основе метаданных, системы «DIET», «ProActive», «Moab», «Maui», система поддержки «пластичных» заданий, комплекс потоковой обработки в терминах теории массового обслуживания, сервис-ориентированный подход. Использование указанного обеспечения позволяет минимизировать время простоя вычислительных устройств, сократить объемы и время передачи данных от одних исполнительных устройств другим, повысить общую масштабируемость, минимизировать время доступа к данным и пр. Выявлены достоинства и недостатки, даны предложения по применению.
Бесплатно

Струи как основа реализации понятия т-процесса для платформы JVM
Статья научная
Распространение и доступность современных параллельных аппаратно-программных платформ демонстрирует отставание уровня инструментов разработки параллельных приложений от нужд разработчиков программ. В ИПС РАН ведется разработка подхода к распараллеливанию программ, основанного на использовании модели вычислений «самотрансформация вычисляемой сети». В данной работе рассматриваются различные варианты подходов к реализации для платформы JVM понятия «Т- процесс» –– базового понятия данной модели вычислений. Анализируются потенциальные проблемы, связанные с реализацией понятия «Т-процесс», как на основе классических потоков ОС/JDK, так и в случае внесения поддержки легковесных потоков непосредственно в код виртуальной машины. Предлагается подход к реализации Т-процессов, основанный на использовании понятия струй, т.е. легковесных потоков, реализуемых вне ядра JVM. Приводятся результаты экспериментального сравнения подходов к реализации понятия «Т-процесс», основанных на использовании классических потоков и струй (англ. fibers). Анализируется эффект от использования струй для реализации модели вычислений «самотрансформация вычисляемой сети», используемой в разрабатываемом языке параллельного программирования ajl для платформы JVM
Бесплатно

Суперкомпиляция функций высших порядков
Статья научная
В работе описана внутренняя структура экспериментального суперкомпилятора HOSC. Дано полное описание всех существенных понятий и алгоритмов суперкомпилятора, работающего с функциональным языком высшего порядка (подмножеством языка Haskell). Особое внимание уделяется проблемам связанным с обобщением и отношением гомеоморфного вложения для выражений со связанными переменными.
Бесплатно

Суперкомпьютерные технологии в решении задач биоинформатики
Статья научная
С 2001 года в ИВМиМГ СО РАН функционирует Центр коллективного пользования «Сибирский суперкомпьютерный центр» (ССКЦ) с пиковой производительностью кластеров 115 TFlops. Основные задачи центра: разработка и использование суперкомпьютерных технологий для математического моделирования различных задач, решаемых в институтах СО РАН; обеспечение работ институтов СО РАН и университетов Сибири по математическому моделированию в фундаментальных и прикладных исследованиях; обучение специалистов СО РАН и студентов университетов методам параллельных вычислений на суперкомпьютерах, методам моделирования больших задач. Одним из основных потребителей ресурсов является Центр коллективного пользования «Биоинформатика», созданный на базе Института Цитологии и Генетики СО РАН. В рамках совместных работ центров коллективного пользования были разработаны программные пакеты по наиболее актуальным научным направлениям биоинформатики. Работа посвящена обзору ресурсов ССКЦ и прикладным программным пакетам по биоинформатике. Ключевые слова и фразы: суперкомпьютеры с гибридной архитектурой, биоинформатика, компьютерная геномика, эволюция, прикладные программные пакеты
Бесплатно

Ред. заметка
Развитие технологий высокопроизводительного секвенирования ДНК привело к появлению нового класса объемных геномных данных и алгоритмов их обработки и анализа. Суперкомпьютерные вычисления являются необходимым инструментом работы с генетическими данными. Представлены задачи геномики и транскриптомики, анализа экспрессии генов в контексте вычислительной сложности. Дан обзор компьютерных подходов и разработанных авторами программ для решения задач, возникающих при аннотации геномных данных и анализе экспрессии генов
Бесплатно

Статья научная
Развитие технологий высокопроизводительного секвенирования ДНК привело к появлению нового класса объемных геномных данных и алгоритмов их обработки и анализа. Суперкомпьютерные вычисления являются необходимым инструментом работы с генетическими данными. Представлены задачи геномики и транскриптомики, анализа экспрессии генов в контексте вычислительной сложности. Дан обзор компьютерных подходов и разработанных авторами программ для решения задач, возникающих при аннотации геномных данных и анализе экспрессии генов.
Бесплатно