Программные системы: теория и приложения @programmnye-sistemy
Статьи журнала - Программные системы: теория и приложения
Все статьи: 457

Извлечение симптомов и автоматическое предсказание диагноза по медицинским клиническим записям
Статья научная
В статье представлена система, которая извлекает симптомы заболеваний из медицинских клинических записей (текстов на естественном русском языке) и автоматически предсказывает по ним диагноз в виде наименования заболевания и его кода в соответствии со справочником МКБ-10. Система ограничена предметной областью из 6 пульмонологических заболеваний (хроническая обструктивная болезнь легких, пневмония, бронхиальная астма и др.) и COVID-19. Извлечение симптомов реализовано с помощью нескольких нейронных сетей, выделяющих отдельные медицинские сущности и связи между ними. Предсказание диагноза также реализовано в виде классификатора на основе нейронной сети. Для обучения извлечению симптомов создан аннотированный корпус предложений. Описаны принципы и правила разметки симптомов. Представлен корпус текстов для обучения классификатора предсказанию диагнозов. Приведены оценки точности при тестировании обеих подсистем. Точность предсказания диагноза на данной предметной области составила 88,5%. Даны сравнения с аналогичными работами по извлечению симптомов из текстов на различных языках, а также по автоматическому предсказанию диагнозов, включая системы типа ChatGPT.
Бесплатно

Извлечение сложных временных выражений из текстов в рамках задачи автоматического выявления ситуаций
Ред. заметка
В рамках проблемы автоматического выявления ситуаций в публицистических текстах на русском языке рассматривается задача поиска сложных временных выражений. Выделение именных групп, содержащих временные выражения, понимается как подзадача частичного синтаксического анализа (shallow parsing). Предлагается алгоритм, состоящий из предварительной сегментации и последующего поиска границ именных групп в выделенном сегменте с помощью машинного обучения (CRF-модели). Приводятся результаты экспериментов
Бесплатно

Инструментальные средства анализа депрессивного состояния и личностных черт человека
Статья научная
Выполнен анализ работ, посвященных выявлению устойчивой связи между личностными чертами и депрессией человека по комплексу информации, доступной в социальных сетях. Значимость автоматизированного решения задачи определяется необходимостью своевременного выявления признаков депрессии как широко распространенного психического заболевания для принятия мер ее профилактики и лечения на ранних стадиях.Рассмотрены вопросы построения механизмов выявления закономерностей и построения современных инструментальные средств анализа данных социальных сетей для проведения научных исследований в предметной области. В качестве инструментальных средств выявления депрессии предлагается применять современные методы автоматического анализа веб-страниц, формализации выявления деструктивной информации по предложениям психологов, проверки гипотез о наличии корреляционных связей, автоматической классификации текстово-графической информации с помощью аппарата искусственных нейронных сетей в сочетании с методами семантического и психологического анализа данных.Эксперименты выявляют существенную корреляционную связь между различными градациями депрессии и некоторыми личностными чертами, а также устойчивую корреляцию между самими личностными чертами большой пятерки.
Бесплатно

Интеграция алгоритма параллельной сортировки Бэтчера и активной системы хранения данных
Статья научная
В статье описан разработанный алгоритм сортировки больших объемов данных при помощи модифицированной версии алгоритма параллельной сортировки Бэтчера. Принципиальной новизной полученного решения является интеграция распространенного и доказавшего свою эффективность алгоритма параллельной сортировки Бэтчера и концепции системы активного хранения на базе библиотеки шаблонных классов TSim и кластерной файловой системы Lustre. В статье представлены результаты тестирования производительности разработанного алгоритма на реальной научной задаче обработки данных сейсмической разведки. Полученные результаты демонстрируют линейное ускорение на задаче, обрабатывающей большой (более 100 Гб) массив данных.
Бесплатно

Статья научная
В статье рассматривается облачная программная платформа Everest, реализующая публикацию, выполнение и композицию вычислительных приложений в распределенной среде. Описаны архитектура платформы, принципы создания приложений, интеграция платформы с внешними вычислительными ресурсами, а также интерфейс прикладного программирования платформы.
Бесплатно

Интеграция приложения Tachyon с системой параллельного программирования OpenTS
Ред. заметка
Работа описывает интеграцию приложения Tachyon из библиотеки Intel® Threading Building Blocks с системой параллельного программирования OpenTS
Бесплатно

Интеллектуальная поддержка процессов контроля и диагностики космических подсистем
Статья научная
В настоящей работе проведено исследование предметной области, выполнен обзор существующих разработок в области построения систем мониторинга, контроля и диагностики подсистем космических аппаратов, в том числе, с использованием нейросетевого подхода. Теоретически исследованы пути реализации математического и алгоритмического обеспечения системы контроля и диагностики подсистем космического аппарата.Разработаны методические подходы, способы и методы решения технических задач по построению нейросетевой системы контроля и диагностики подсистем космического аппарата. Применение технологий искусственных нейронных сетей позволяет обнаруживать, классифицировать и прогнозировать ошибки, осуществлять многоуровневую диагностику подсистем космического аппарата и прогнозировать их дальнейшее поведение, тем самым увеличивая эффективность, скорость принятия решений и надежность работы узлов космического аппарата.Представлен метод графического представления временных последовательностей, позволяющий визуально классифицировать радиотехнический сигнал и обнаружить шум в этом сигнале. Предлагается формировать и ранжировать набор значимых признаков путем применения алгоритмов «Add» и «Del».
Бесплатно

Интерфейс для моделирования эластик Эйлера в программной среде Mathematica
Статья научная
В классическом вариационном вычислении и оптимальном управлении хорошо известна задача о стационарных профилях упругого стержня. Леонард Эйлер, рассмотревший эту задачу в 1744 году, описал все возможные стационарные профили (эйлеровы эластики). В программной среде Mathematica написаны модули вычисления уравнений всех типов эластик, а макже модуль для их визуализации. Модули объединены в интерфейс, позволяющий получить изображение и параметризацию любой эластики через Web.
Бесплатно

Информационная инфраструктура Республики Татарстан: от «Senet-Tatarstan» к «Segrid-Tatarstan»
Статья научная
Описаны этапы формирования в Республике Татарстан телекоммуникационных, информационных и суперкомпьютерных ресурсов организаций науки, образования и государственного управления. Представлены также результаты в области высокопроизводительных вычислений, полученные к настоящему времени.
Бесплатно

Информационная система поддержки исследований в инфраструктурной логистике
Статья научная
Статья посвящена описанию информационной системы, предназначенной для поддержки исследований в области инфраструктурной логистики. Архитектуру информационной системы можно представить в виде двух взаимодействующих подсистем. Первая подсистема обрабатывает предметную информацию и использует экспертную систему для выработки рекомендаций в различных областях транспорта и логистики на основе концептуальной модели. Вторая же подсистема позволяет дополнительно включить в процессе поддержки различные вычислительные методы, основанные на математических моделях инфраструктурной логистики. Основное внимание в статье уделяется первой подсистеме, рассмотрена ее архитектура и процесс функционирования.
Бесплатно

Статья научная
Процессор с архитектурой управления потоком данных может выполнять до 16 команд в такт по сравнению с 4–6 командами в такт у лучших процессоров фон-неймановской архитектуры. Моделирование векторного потокового процессора показало, что его производительность на программе перемножения матриц может быть доведена до 256 флоп в такт при выдаче менее 8 команд в такт, и поддерживаться близкой к пиковой производительности при значительно меньшем размере обрабатываемых матриц. Анализируются преимущества и недостатки использования в этом процессоре на векторной обработке конвейерного «сдвоенного» умножителя и сумматора вместо раздельных умножителей и сумматоров с плавающей запятой. Ключевые слова и фразы: суперкомпьютер, векторный процессор, архитектура управления потоком данных, оценка производительности, мелкозернистый параллелизм, сдвоенная арифметика
Бесплатно

Статья научная
Успешность использования математических моделей, определяющих поведение квантово-полевых систем в параметрических пространствах, критически зависит от уровня оптимизации процедуры получения решения. В работе рассматривается задача вычисления плотности носителей, возникающих в графене в результате действия импульсного электрического поля. Основой модели является система кинетических уравнений, обеспечивающих вычисление остаточной функции распределения. Её интегрирование по импульсному пространству даёт искомую плотность носителей. Проблема заключается в высокой вычислительной сложности покрытия импульсного пространства равномерной сеткой, обеспечивающей точное вычисление плотности для различных параметров импульса поля. При этом модель не содержит критериев определения удовлетворительных параметров сетки. В работе предложена и реализована процедура построения адаптивной сетки в форме квадродерева, имеющего переменный размер покрывающих квадратов. Построение реализовано в форме итерационной процедуры, совмещенной с процессом вычисления значений функции распределения.
Бесплатно

Использование доменной адаптации для задачи распознавания ключевых точек на теле человека
Статья научная
В статье проводится исследования алгоритмов доменной адаптации для задачи распознавания ключевых точек на теле человека с целью применения в спорте, когда требуется повысить точность распознавания и сократить трудоемкость ручной разметки данных. Результатом работы является алгоритм итеративной адаптации модели на собственных псевдометках. Экспериментально показано, что метод позволяет получить более эффективную итоговую нейросетевую модель в сравнении с обычным дообучением.
Бесплатно

Использование контейнерной виртуализации в организации высокопроизводительных вычислений
Статья научная
Статья посвящена вопросу применимости контейнерной виртуализации при организации высокопроизводительных вычислений с точки зрения изоляции пользовательских заданий. В статье приводятся результаты экспериментов по оценке накладных расходов на организацию контейнерной виртуализации, степени взаимного влияния заданий и обеспечения защиты от несанкционированного доступа
Бесплатно

Использование локализации и переполнения для управления параллельными и распределёнными вычислениями
Ред. заметка
Применительно к задачам суперкомпьютинга и сверхбольших баз данных рассматривается абстрактная концепция переполнения и показывается, как её использовать для организации и оптимизации распределённых и параллельных вычислений. Работа является второй в серии, посвящённой методам организации вычислений над локальными системами.
Бесплатно

Использование механизма сверточных нейронных сетей для поиска объектов на аэрофотоснимках
Ред. заметка
В статье описан метод поиска объектов на аэрофотоснимках с применением нейронных сетей, а также алгоритм, позволяющий выполнить постобработку данных, полученных в результате работы нейронных сетей. Рассмотрена задача поиска самолетов на изображениях.
Бесплатно

Ред. заметка
В статье описаны методы обработки потоковых данных, реализованные в системе блочно-параллельной обработки данных. Рассмотрены основные методы сегментации изображений и подход к сегментации с использованием сверточных нейронных сетей, опирающийся на текстурную и цветовую информацию. Результаты сегментации изображений используются в задаче выделения фона на изображении
Бесплатно

Статья научная
В работе представлены результаты применения трансферного обучения глубоких сверточных нейронных сетей для задачи поиска рентгенограмм органов грудной клетки с нарушениями укладки и позиционирования пациента. Оцениваемые нейросетевые архитектуры: InceptionV3, Xception, ResNet152V2, InceptionResNetV2, DenseNet201, VGG16, VGG19, MobileNetV2, NASNetLarge. Для обучения и тестирования использовались рентгенограммы грудной клетки, полученные из открытых наборов данных и Единого радиологического информационного сервиса города Москвы. Все полученные модели имели метрики диагностической точности выше 95., при этом модели на основе архитектур ResNet152V2, DenseNet201, VGG16, MobileNetV2 имели статистически значимо лучшие метрики, чем другие модели. Наилучшие абсолютные значения метрик показала модель ResNet152V2 (AUC =0.999 ,чувствительность=0.987, специфичность=0.988, общая валидность =0.988, F1 мера = 0.988). Модель MobileNetV2 показала наилучшую скорость обработки одного исследования ($67.8 pm5.0$ ms). Широкое использование полученных нами алгоритмов способно облегчить создание больших баз данных качественных медицинских изображений, а также оптимизировать контроль качества при выполнении рентгенографических исследований органов грудной клетки.
Бесплатно

Статья научная
Неклассическая пропозициональная логика $L_{S_{2}}$ построена на базе алгебраической системы, содержащей булеву алгебру множеств и два отношения между множествами: $\subset$ и $=$. Ближайшим аналогом ее является силлогистика Аристотеля, математической моделью которой является алгебраическая система с Булевой алгеброй множеств и одним отношением $\subset$. Недостатком силлогистик, в основе которых лежит алгебраическая система с одним отношением $\subset$, является многосмысловость интерпретации их формул и атомарных суждений. Под логико-семантической моделью предметной области в данной работе мы понимаем совокупность формулы универсальной силлогистики $L_{S_{2}}$ и ее семантического значения, в качестве которого выступает конечное множество неотрицательных целых чисел. Предлагается алгоритм вычисления семантического значения конъюнктивной правильно построенной формулы $L_{S_{2}}$, обладающий высоким уровнем параллелизма на уровне задач, на уровне данных и на уровне алгоритмов, реализующих операции над составляющими множествами. В силу особенностей операций объединения, пересечения и дополнения универсума над конечными множествами все процессы их вычисления и решения подзадач происходят на битовом уровне и, как правило, эффективно реализуются на алгоритмических языках. В предлагаемом алгоритме переход на битовый уровень и обратно реализуется набором программных средств.
Бесплатно

Статья научная
В работе предложен метод распознавания содержимого отсканированных изображений плохого качества с использованием свёрточных нейронных сетей (CNN) и его программная реализация. Метод состоит из 3-х основных этапов. На первом этапе осуществляется предобработка изображения с целью выявлении контуров его буквенных и цифровых элементов и основных знаков пунктуации. На втором этапе содержимое фрагментов изображения внутри выявленных контуров последовательно подаётся на вход CNN, реализующую многоклассовую классификацию. На третьем, заключительном этапе, осуществляется постобработка совокупности ответов CNN и формирование текстового документа с результатами распознавания. Все этапы реализованы на языке Python с использованием библиотек глубокого обучения Keras, компьютерного зрения OpenCV и обработки изображений PIL. Предлагаемый в работе способ показал достаточно хорошие результаты распознавания для основных типов ухудшения качества отсканированного изображения - геометрических искажений, размытия границ, различных пометок на исходном и отсканированном изображении и т.п.
Бесплатно