Тенденции развития вычислительных узлов современных суперкомпьютеров
Автор: Тютляева Екатерина Олеговна, Одинцов Игорь Олегович, Московский Александр Александрович, Мармузов Глеб Владимирович
Статья в выпуске: 3 т.8, 2019 года.
Бесплатный доступ
В данной работе выполнен анализ вычислительных узлов современных суперкомпьютеров с двух точек зрения - аппаратно-компонентной и инфраструктурной. На основании проведённого анализа названы основные конструктивные элементы, которыми должен быть оснащен современный вычислительный узел. В статье приведены классификации архитектур современных универсальных и специализированных ядер с примерами; проведен обзор современных тенденций организации подсистемы памяти и внутриузлового интерконнекта; упомянуты способы использования энергонезависимых устройств хранения на узлах при организации современных высокопроизводительных систем хранения. Также разобраны основные требования к организации инфраструктуры узла современного суперкомпьютера, в частности, дана краткая классификация современных подходов к организации жидкостного охлаждения и мониторинга вычислительных узлов. Выявленные тенденции приводят к основным вариантам дизайна вычислительных узлов, состоящих из энергоэффективного универсального процессора и совокупности энергоэффективных специализированных ускорителей. В статье сделан акцент на современных технологиях, которые достигли стадии выхода в производство или, как минимум, создания рабочих прототипов. Обсуждаются современные суперкомпьютерные задачи и их отображение на архитектуру вычислительных узлов. В заключении приведено кратное обсуждение актуальных технологических проблем и основных направлений для сохранения прогресса в компьютерной отрасли.
Высокопроизводительный вычислительный узел, разработка архитектуры вычислительного узла, анализ суперкомпьютерных архитектур, тенденции развития суперкомпьютеров
Короткий адрес: https://sciup.org/147233203
IDR: 147233203 | DOI: 10.14529/cmse190305
Список литературы Тенденции развития вычислительных узлов современных суперкомпьютеров
- Проект Российской Академии Наук: «Создание вычислительной системы для моделирования суперкомпьютера с производительностью экзафлопсного уровня». Институт прикладной математики им. М.В. Келдыша Российской академии наук. URL: http://www.keldysh.ru/projects/exaflops.pdf (дата обращения: 23.01.2019).
- Reed D.A., Dongarra J. Exascale Computing and Big Data // Communications of the ACM. 2015. Vol. 58, No. 7. P. 56-68. DOI: 10.1145/2699414
- Chrysos G. Intel//bigcirc R Xeon Phi coprocessor (codename Knights Corner) // Proceedings of the 2012 IEEE Hot Chips 24 Symposium, HCS, August 27-29, 2012, Cupertino, CA. P. 1-31. DOI: 10.1109/HOTCHIPS.2012.7476487
- Lindholm E.,Nickolls J., Oberman S., Montrym J. NVIDIA Tesla: A Unified Graphics and Computing Architecture // IEEE Micro. 2008. Vol. 28, No. 2. P. 39-55. DOI: 10.1109/MM.2008.31
- Jouppi N., Young C., Patil N., Patterson D. Motivation for and Evaluation of the First Tensor Processing Unit // IEEE Micro. 2018. Vol. 38, No. 3. P. 10-19. DOI: 10.1109/MM.2018.032271057
- Davies M. et al. Loihi: A Neuromorphic Manycore Processor with On-Chip Learning // IEEE Micro. 2018. Vol. 38, No. 1. P. 82-99.
- DOI: 10.1109/MM.2018.112130359
- Hsu J. CES 2018: Intel's 49-Qubit Chip Shoots for Quantum Supremacy. IEEE Spectrum Tech Talks. 2018. URL: https://spectrum.ieee.org/tech-talk/computing/hardware/ intels-49qubit-chip-aims-for-quantum-supremacy (дата обращения: 23.11.2018).
- Intel//bigcirc R Stratix//bigcirc R 10 SoC FPGAs. URL: https://www.intel.com/content/www/us/en/ products/programmable/soc/stratix-10.html (дата обращения: 23.11.2018).
- Exascale Requirements Review. An Office of Science review sponsored jointly by Advanced Scientific Computing Research and High Energy Physics. June 10-12, 2015, Bethesda, Maryland. URL: http://hepcce.org/files/2016/11/DOE-ExascaleReport-HEP-Final. pdf (дата обращения: 13.11.2018).
- Top500 List Statistics. Release November 2018. URL: https://www.top500.org/ statistics/list/ (дата обращения: 16.11.2018).
- Hemsoth N. Cascade Lake at Heart of 2019 TACC Supercomputer. Онлайн ресурс технологических новостей Next Platform поддерживаемый Stackhouse Publishing Inc в партнерстве с The Register. 2018. URL: https://www.nextplatform.com/2018/08/29/ cascade-lake-heart-of-2019-tacc-supercomputer/ (дата обращения: 13.11.2018).
- Bartsch V. D6.3 Initial Project Press Release // ExaNoDe Consortium Public deliverable. Пресс-релиз по проекту ExaNode. 2016. URL: http://exanode.eu/wp-content/uploads/ 2017/04/D6.3.pdf (дата обращения: 16.11.2018).
- ARMv8 - A Scalable Vector Extension for Post-K. FUJITSU LIMITED. 2016. URL: http: //www.fujitsu.com/global/Images/armv8-a-scalable-vector-extension-for-post-k. pdf (дата обращения: 22.01.2019).
- Astra. Top500 The List. URL: https://www.top500.org/system/179565 (дата обращения: 16.11.2018).
- Xilinx. High Performance Computing and Data Storage. URL: https://www.xilinx.com/ applications/high-performance-computing.html (дата обращения: 23.11.2018).
- Timmel A.N., Daly J.T. Multiplication with Fourier Optics Simulating 16-bit Modular Multiplication. URL: https://arxiv.org/pdf/1801.01121.pdf (дата обращения: 23.11.2018).
- Ким А.К., Перекатов В.И., Фельдман В.М. На пути к российской экзасистеме: планы разработчиков аппаратно-программной платформы «Эльбрус» по созданию суперкомпьютера экзафлопсной производительности // Вопросы радиоэлектроники. Вычислительные системы на базе многоядерных микропроцессоров. 2018. № 2. С. 6-13.
- CORAL Collaboration: Briefing on CORAL-2 RFP and Draft Technical Requirements // Vendor Webinar Meeting. December 6, 2017 URL: https://procurement.ornl.gov/rfp/ CORAL2/Brief-of-Draft-SOW-20171206-SA.PDF (дата обращения: 23.11.2018).
- Farber R. HPC and AI - Two Communities Same Future. HPCwire: Global News and Information on High Performance Computing. 2018. URL: https://www.hpcwire.com/2018/ 01/25/hpc-ai-two-communities-future/ (дата обращения: 23.11.2018).
- JEDEC DDR5 & NVDIMM-P Standards Under Development. Global Standards for the Microelectronics Industry. 2017. URL: https://www.jedec.org/news/pressreleases/ jedec-ddr5-nvdimm-p-standards-under-development (дата обращения: 23.11.2018).
- Hadidi R. et al. Demystifying the Characteristics of 3D-Stacked Memories: A Case Study for Hybrid Memory Cube // Proceedings of the IEEE International Symposium on Workload Characterization, IISWC 2017, October 1-3, 2017, Seattle, WA, USA, P. 66-75.
- DOI: 10.1109/IISWC.2017.8167757
- High Bandwidth Memory (HBM) DRAM. JESD235A. Global Standards for the Microelectronics Industry. 2015. URL: https://www.jedec.org/standards-documents/ docs/jesd235a (дата обращения: 23.11.2018).
- Hybrid Memory Cube (HMC). Hybrid Memory Cube Consortium Page. URL: http: //hybridmemorycube.org/ (дата обращения: 16.11.2018).
- Intel//bigcirc R Memory Drive Technology Application Note. URL: https://www. intel.com/content/dam/support/us/en/documents/memory-and-storage/ intel-mem-drive-tech-appnote.pdf (дата обращения: 23.11.2018).
- Graphics Double Data Rate (GDDR5) SGRAM standard. JESD212C. Global Standards for the Microelectronics Industry. 2016. URL: https://www.jedec.org/standards-documents/ docs/jesd212c (дата обращения: 23.11.2018).
- Graphics Double Data Rate 6 (GDDR6) SGRAM standard. JESD250A. Global Standards for the Microelectronics Industry. 2017. URL: https://www.jedec.org/standards-documents/ docs/jesd250a (дата обращения: 23.11.2018).
- Ferreira da Silva R., Callaghan S., Deelman E. On the use of burst buffers for accelerating data-intensive scientific workflows // Proceedings of the 12th Workshop on Workflows in Support of Large-Scale Science, WORKS '17. ACM, 2017. P. 2:1-2:9.
- DOI: 10.1145/3150994.3151000
- Bhimji W., Bard D., Romanus M., Paul, D., Ovsyannikov A., Friesen B., et al. Accelerating Science with the NERSC Burst Buffer Early User Program. Lawrence Berkeley National Laboratory. 2016. URL: https://escholarship.org/uc/item/9wv6k14t (дата обращения: 23.11.2018).
- Cray//bigcirc R DataWarpTM Applications I/O Accelerator. URL: https://www.cray.com/ products/storage/datawarp (дата обращения: 23.11.2018).
- Morgan T.P. For many hyperconverged is the next platform. Онлайн ресурс технологических новостей Next Platform поддерживаемый Stackhouse Publishing Inc в партнерстве с The Register. 2018. URL: https://www.nextplatform.com/2018/01/29/ hyperconverged-next-platform-many-jobs/ (дата обращения: 23.11.2018).
- Бахур В. РСК представила гиперконвергентное HPC-решение на новейших компонентах. Интернет-издание о высоких технологиях cnews. 2018. URL: http://www. cnews.ru/news/line/2018-06-27_rsk_predstavila_giperkonvergentnoe_hpcreshenie (дата обращения: 23.11.2018).
- The GEN-Z Consortium. URL: https://genzconsortium.org/ (дата обращения: 23.11.2018).
- The OpenCAPI Consortium. URL: https://opencapi.org/ (дата обращения: 23.11.2018).
- NVLink Fabric. URL: https://www.nvidia.com/ru-ru/data-center/nvlink/ (дата обращения: 23.11.2018).
- Краткое описание продукции: платформа масштабируемых процессоров Intel//bigcirc R Xeon//bigcirc R. URL: https://www.intel.ru/content/www/ru/ru/processors/xeon/scalable/ xeon-scalable-platform-brief.html (дата обращения: 23.11.2018).
- Infinity Fabric (IF) - AMD. URL: https://en.wikichip.org/wiki/amd/infinity_fabric (дата обращения: 23.11.2018).
- Российские микропроцессоры серии «Эльбрус» и МЦСТ R и системные платы на их основе. Каталог продукции 2017. URL: http://mcst.ru/files/59db45/cf0cd8/50a21b/ 000000/katalog_produktsii_mtsst_hq.pdf (дата обращения: 23.11.2018).
- CCIX. URL: https://www.ccixconsortium.com/(дата обращения: 23.11.2018).
- Coherent Accelerator Processor Interface (CAPI). URL: https://developer.ibm.com/ linuxonpower/capi/ (дата обращения: 23.11.2018).
- Шустиков В. Ученые Сколтеха создали суперкомпьютер «Жорес». Фонд «Сколково», пресс-релизы. 2019. URL: https://sk.ru/news/b/pressreleases/archive/2019/01/18/ uchenye-skolteha-sozdali-superkompyuter-zhores.aspx (дата обращения: 25.01.2019).
- Is Liquid Cooling Ready to Go Mainstream? HPCwire: Global News and Information on High Performance Computing. URL: https://www.hpcwire.com/2017/02/ 13/liquid-cooling-ready-go-mainstream/ (дата обращения: 16.11.2018).
- Aquila. URL: https://www.aquilagroup.com/cooling/ (дата обращения: 26.11.2018).
- Группа компаний РСК. URL: http://www.rscgroup.ru/ru (дата обращения: 25.01.2019).
- Asetek. URL: https://www.asetek.com/ (дата обращения: 26.11.2018).
- Ebullient. URL: http://ebullientcooling.com/ (дата обращения: 26.11.2018).
- ExaScaler Inc. Overview. URL: http://www.exascaler.co.jp/en/company (дата обращения: 26.11.2018).
- 3M Server Solutions for Data Centers. URL: https://www.3m.com/3M/en_US/ data-center-us/solutions/data-center-servers/ (дата обращения: 26.11.2018).
- Абрамов С.М., Амелькин С.А., Романенко А.Ю., Симонов А.С., Чичковский А.А. Опыт реализации высокопроизводительных вычислительных систем с погружной жидкостной системой охлаждения // Труды 3-й Всероссийской научно-технической конференции «Суперкомпьютерные технологии» (СКТ-2014) (Дивноморское, Геленджик, 29 сентября - 4 октября 2014 г.). С. 9-15.
- Левин И.И., Дордопуло А.И., Доронченко Ю.И., Раскладкин М.К., Федоров А.М. Погружная система охлаждения реконфигурируемых вычислительных систем на основе ПЛИС // Программные системы: теория и приложения. 2016. №4 (31).
- Liquid MIPS. URL: http://www.liquidmips.com/cms/en-us/howitworks.aspx (дата обращения: 26.11.2018).
- Libri A., Bartolini A., Benini L. Dwarf in a Giant: Enabling Scalable, High-Resolution HPC Energy Monitoring for Real-Time Profiling and Analytics. URL: https://arxiv.org/pdf/ 1806.02698.pdf (дата обращения: 19.11.2018).
- Grant R.E., Levenhagen M., Olivier S.L., DeBonis D., Pedretti K.T., Laros III J.H. Standardizing Power Monitoring and Control at Exascale // Computer. 2016. Vol. 49, No. 10. P. 38-46.
- DOI: 10.1109/MC.2016.308
- Georgiou Y., Glesser D., Trystram D. Adaptive Resource and Job Management for Limited Power Consumption // IEEE International Parallel and Distributed Processing Symposium Workshop, 2015, Hyderabad. P. 863-870.
- DOI: 10.1109/IPDPSW.2015.118
- Shalf J.M., Leland R. Computing beyond Moore's Law // Computer. 2015. Vol. 48, No. 12. P. 14-23.
- DOI: 10.1109/mc.2015.37