Вокруг условного 4-го поколения современных серверных процессоров AMD и Intel: их микроархитектура и производительность соответствующих вычислительных систем

Бесплатный доступ

Обзор посвящен особенностям микроархитектуры и производительности процессоров Intel Xeon — масштабируемых процессоров 4-го поколения (c микроархитектурой Sapphire Rapids-SP, далее Xeon SPR), 5-го поколения (Emerald Rapids-SP, далее Xeon EMR), и разных классов процессоров AMD EPYC архитектуры Zen 4, а также вычислительным системам на их основе. Анализируются данные о моделях Xeon SPR (и Xeon SPR с памятью HBM, то есть Xeon Max), Xeon EMR и процессорax AMD EPYC 9004 (хотя приведены и краткие данные о EPYC 8004 и 4004). Эти процессоры отнесены в обзоре к условному 4-му поколению Xeon и EPYC. Сопоставления проводятся и с масштабируемыми процессорами Xeon 3-го поколения — Ice Lake-SP (далее Xeon ICL), Cooper Lake-SP, с AMD EPYC с архитектурой Zen 3 (Milan), а также иногда с процессорами ARM-архитектуры и GPU. Кратко обсуждаются средства разработки программ (SDK) для процессоров 4-го поколения, имеющие важное значение для достигаемой производительности. В связи с применением чиплетов или использованием HBM-памяти в рассматриваемых процессорах AMD и Intel особое внимание обращается на поддерживаемые варианты NUMA. Анализируется также аппаратная поддержка средств обеспечения безопасности для задач виртуализации, которые теперь часто применяются и в области высокопроизводительных вычислений (HPC). Данные о производительности в обзоре охватывают широкий спектр областей применения, характерных для серверов с этими процессорами. Но основное внимание уделяется HPC и, в меньшей степени, задачам ИИ. Рассматриваемые процессоры анализируются с точки зрения построения с ними гомогенных или содержащих GPU гетерогенных серверов и вычислительных систем на их основе (кластеров и суперкомпьютеров). Анализируется также начальная информация о новейших процессорах Intel Xeon 6 Granite Rapids и AMD EPYC Zen 5 Turin, включая первые данные об их производительности. Сделаны выводы общего характера о состоянии и образовавшихся тенденциях развития таких процессоров x86.

Еще

X86, Zen 4, Genoa, Bergamo, Zen 5, Turin, Sapphire Rapids, Xeon Max, Emerald Rapids, Xeon 6, Granite Rapids, микроархитектура, производительность, HPC, ИИ, суперкомпьютеры

Короткий адрес: https://sciup.org/143185289

IDR: 143185289   |   УДК: 004.051+004.272+004.318+004.382+004.8+004.9   |   DOI: 10.25209/2079-3316-2025-16-5-43-514

Around the Conditional 4th Generation of Modern Server Processors AMD and Intel: their Microarchitecture and the Performance of the Corresponding Computing Systems

This review focuses on the microarchitecture and performance of Intel Xeon processors—4th-generation Scalable processors (with the Sapphire Rapids-SP microarchitecture, hereafter Xeon SPR), 5th-generation (Emerald Rapids-SP, hereafter Xeon EMR), and various classes of AMD EPYC processors based on the Zen 4 architecture—as well as computing systems based on them. Data is analyzed for Xeon SPR models (and Xeon SPR with HBM memory, i.e., Xeon Max), Xeon EMR, and AMD EPYC 9004 processors (although brief data on the EPYC 8004 and 4004 is also provided). These processors are classified in this review as belonging to the 4th generation of Xeon and EPYC processors. Comparisons are also made with 3rd-generation Xeon Scalable Processors (Ice Lake-SP, hereafter referred to as Xeon ICL), Cooper Lake-SP, AMD EPYC with the Zen 3 (Milan) architecture, and occasionally with ARM processors and GPUs. The software development kits (SDKs) for 4th-generation processors, which are crucial for the achieved performance, are briefly discussed. Due to the use of chiplets or HBM memory in the AMD and Intel processors under consideration, special attention is paid to the supported NUMA variants. Hardware support for security features for virtualization tasks, which are now often used in high-performance computing (HPC), is also analyzed. The performance data in the review covers a wide range of application areas typical for servers with these processors, but the primary focus is on HPC and, to a lesser extent, AI workloads. The processors in question are analyzed from the perspective of building homogeneous or GPU-enabled heterogeneous servers and computing systems based on them (clusters and supercomputers). Initial information on the latest Intel Xeon 6 Granite Rapids and AMD EPYC Zen 5 Turin processors, including initial performance data, is also analyzed. General conclusions are drawn about the status and emerging development trends of these x86 processors.

Еще