Преимущества и недостатки использования метода векторов указателей в векторном потоковом процессоре

Автор: Дикарев Николай Иванович, Шабанов Борис Михайлович, Шмелв Александр Сергеевич

Журнал: Программные системы: теория и приложения @programmnye-sistemy

Рубрика: Программное и аппаратное обеспечение для супер ЭВМ

Статья в выпуске: 4 (47) т.11, 2020 года.

Бесплатный доступ

Статья посвящена анализу выполнения программы быстрой сортировки (QS) в векторном процессоре с архитектурой управления потоком данных, в котором для хранения массивов используется метод векторов/указателей. Анализируется выявленный на программе QS недостаток хранения массивов с помощью векторов указателей и предложен способ решения этого недостатка введением команд split и fuse в систему команд процессора. Несмотря на значительное усложнение графа и числа выполняемых команд в программе QS, введение в систему команд ВПП новых команд split и fuse позволило достичь на этой программе до 7.4 раз более высокой производительности по сравнению с процессорным ядром Intel Skylake.

Еще

Векторный процессор, архитектура управления потоком данных, программа сортировки, параллелизм уровня команд, мелкоструктурный параллелизм, векторная производительность

Короткий адрес: https://sciup.org/143174570

IDR: 143174570   |   УДК: 004.272.25:004.272.44   |   DOI: 10.25209/2079-3316-2020-11-4-55-71

Advantages and disadvantages of using the pointer vector method in a vector dataflow processor

The article is devoted to the analysis of the quick sort (QS) program execution in a vector dataflow processor (VDP), which uses the pointer vectors method to store arrays. The deficiency of pointer vectors method revealed in the QS program is analyzed and a method for solving this disadvantage is proposed by introducing split and fuse commands into the processor instruction set. Despite the significant complication of the graph and increase the overall number of commands executed in the QS program, the introduction of new split and fuse commands into VDP command system made it possible to achieve up to 7.4times faster performance than Intel Skylake processor core.

Еще

Список литературы Преимущества и недостатки использования метода векторов указателей в векторном потоковом процессоре

  • Д. Л. Хеннеси, Д. А. Паттерсон. Компьютерная архитектура. Количественный подход, ред. А. К. Ким , Техносфера, М., 2016, 978-5-94836-413-1, 936 с. ISBN: 978-5-94836-413-1
  • Н. И. Дикарев, Б. М. Шабанов, А. С. Шмелёв. «Мелкоструктурный параллелизм и более высокая производительность процессорного ядра: преимущества векторного потокового процессора», Программные системы: теория и приложения, 10:4(43) (2019), с. 201--217. DOI: 10.25209/2079-3316-2019-10-4-201-217
  • Arvind, R. S. Nikhil. “Executing a program on the MIT tagged-token data-flow architecture”, IEEE Transactions on Computers, 39:3 (1990), pp. 300--318. DOI: 10.1109/12.48862
  • G. V. Papadopoulos, K. R. Traub. “Multithreading: A revisionist view of dataflow architectures” (30 May 1991, Toronto, Canada), 1991, pp. 342--351. DOI: 10.1145/115953.115986
  • W. M. Miller, W. A. Najjar, A. P. Wim Bohm. “A model for dataflow based vector execution”, ICS'94 (July 1994), 1994, pp. 11--22. DOI: 10.1145/181181.181197
  • A. R. Hurson, K. M. Kavi. “Dataflow computers: their history and future”, Wiley Encyclopedia of Computer Science and Engineering, ed. B. Wah, John Wiley amp; Sons, Inc., 2008, 12 pp. DOI: 10.1002/9780470050118.ecse102
  • H. Terada, S. Miyata, M. Iwata. “DDMP's: self-timed super-pipelined data-driven multimedia processors”, Proceedings of the IEEE, 97:2 (1999), pp. 282--296. DOI: 10.1109/5.740021
  • J. Gurd, W. Bohm, Yong Meng Teo. “Performance issues in dataflow machines”, Future Generations Computer Systems, 3:4, pp. 285--297. DOI: 10.1016/0167-739X(87)90033-1
  • Н. И. Дикарев, Б. М. Шабанов, А. С. Шмелёв. «Векторный потоковый процессор: оценка производительности», Известия ЮФУ. Технические науки, 2014, №12 (161), Тематический выпуск: Суперкомпьютерные технологии, с. 36--46.
  • B. Bramas. “A novel hybrid Quicksort algorithm vectorized using AVX-512 on Intel Skylake”, International Journal of Advanced Computer Science and Applications, 8:10 (2017), pp. 337--344. DOI: 10.14569/IJACSA.2017.081044
Еще