Архитектура вычислительных машин - 004.2

Научные статьи

В разделе "Архитектура вычислительных машин"
Матрично-векторное умножение многократной точности на графическом процессоре
Multiple-precision matrix-vector multiplication on graphics processing units
Минимизация средних затрат на перераспределение при работе с work-stealing деком в двухуровневой памяти
Высокопроизводительные вычисления с использованием системы остаточных классов
Преимущества и недостатки использования метода векторов указателей в векторном потоковом процессоре
Реализация и оценка производительности разреженного матрично-векторного умножения многократной точности на CUDA с использованием системы остаточных классов
Преимущества и недостатки использования метода векторов указателей в векторном потоковом процессоре
Modern server ARM processors for supercomputers: A64FX and others. Initial data of benchmarks
Современные серверные ARM-процессоры для суперЭВM: A64FX и другие. Начальные данные тестов производительности
Сжатие сенсорных данных с малым расходом оперативной памяти
Memory-efficient sensor data compression
Synchronous execution of group operations in distributed supercomputer components and computer clusters
Синхронное выполнение групповых операций в распределенных компонентах суперкомпьютеров и компьютерных кластерах
Организация взаимодействия активных объектов однородных цифровых структур
Processing-in-memory: текущие направления развития технологии
Новое поколение GPGPU и сопутствующего оборудования: микроархитектура и производительность вычислительных систем от серверов до суперкомпьютеров
Синхронное взаимодействие распределенных неупорядоченных цифровых объектов
Методы квантового машинного обучения для обнаружения атак на программно-конфигурируемые сети
Быстродействие и отказоустойчивость идеальной системной сети через дополнительную параллельность
Алгоритм прямого распространения в парадигме потока данных