Определение оптимального числа дополнительных слоёв передаваемых данных схемы сокрытия сетевой латентности
Автор: Новиков А.Б., Евтушенко Г.И.
Журнал: Вестник Воронежского государственного университета инженерных технологий @vestnik-vsuet
Рубрика: Информационные технологии, моделирование и управление
Статья в выпуске: 1 (71), 2017 года.
Бесплатный доступ
Ключевым компонентом эффективности параллельных вычислений является организация обмена данными между вычислительными узлами. Для повышения эффективности параллельных вычислений необходимо сокращать задержки на обмен данными. Для этого был разработан алгоритм перекрытия задержек обмена данными B+2R. В отечественных и зарубежных работах не рассматривается способ выбора числа слоёв дополнительно передаваемых данных R. Для возможности применения математического аппарата оптимизации в работе вводятся модели всех систем, влияющих на время выполнения параллельного расчёта. Вводится модель сети передачи данных и модель параллельного расчётного приложения. Время вычисления ячейки считается постоянной величиной, зависящей от конкретного расчёта. Вводится оценка времени счёта в зависимости от количества слоёв дополнительно передаваемых данных. Далее, вводится производная зависимости времени счёта параллельного приложения от количества слоёв дополнительно передаваемых данных. Наименьший действительный положительный корень получившегося кубического уравнения является минимумом времени счёта параллельного приложения. Может оказаться так, что уравнение не будет иметь действительных положительных корней, это соответствует существенно большему времени локальной сетки с приграничными слоями по отношению к задержкам обмена данными, что делает не целесообразным применение рассматриваемого алгоритма. Для проверки полученных зависимостей был проведён вычислительный эксперимент, результаты которого согласуются с прогнозируемыми величинами. Стоит отметить, что целью проведения вычислительного эксперимента является не столько совпадение полученного времени счёта параллельного приложения с данным числом слоёв данных и времени счёта вычисляемого по предлагаемой модели, сколько совпадение минимумов этих зависимостей. Это объясняется тем, что цель разработанной модели - достижение минимального времени счёта, а не его прогнозирование. Результатом работы служит зависимость, позволяющая по ряду параметров вычислительного комплекса и задачи определить оптимальное количество слоёв дополнительно передаваемых данных.
Схемы сокрытия сетевой латентности, структурированные сетки
Короткий адрес: https://sciup.org/140229786
IDR: 140229786 | DOI: 10.20914/2310-1202-2017-1-95-98
Список литературы Определение оптимального числа дополнительных слоёв передаваемых данных схемы сокрытия сетевой латентности
- Brandon G.A., Kalyan S.P., Sudip K.S. Efficient Simulation of Agent-Based Modoels on Multi-GPU and Multi-Core Clusters. Proceedings of SIMUTools. 2010 March 15-19
- Калмыков В.В., Ибраев, Р.А. Алгоритм с перекрытиями для решения системы уравнений мелкой воды на параллельных компьютерах с распределённой памятью//Вестник УГАТУ. 2013. № 5. С. 252-259.
- Jaehyuk H. Hardware Techniques to Reduce Communication Costs in Multiprocessors. Doctoral dissertation, 2006.
- Cicotti P. Tarragon: a programming model for latency-hiding scientific computations. Doctoral dissertation, 2011.
- Alameldeen Alaa R. Using Compression to improve chip multiprocessor performance. Doctoral dissertation, 2006.
- Afsahi A. Design and Evaluation of Communication Latency Hiding/Reduction Techniques for Message-Passing Environments. Doctoral dissertation, 2000.
- Chen Li-li, Huang Jian-xin, Zhang Jing A Latency-Hiding Algorithm for ABMS on Parallel/Distributed Computing Environment. ACM/IEEE/SCS 26th Workshop on Principles of Advanced and Distributed Simulation, 2012.
- Yong Chen, Surendra Byna, Xian-He Sun, Rajeev Thakur et al. Hiding I/O latency with pre-execution prefetching for parallel applications. In Proceedings of the 2008 ACM/IEEE conference on Supercomputing (SC '08). IEEE Press, Piscataway, NJ, USA, 2008, Article 40, pp. 10.
- Hakan Grahn Comparative Evaluation of Latency-Tolerating and -Reducing Techniques for Hardware-Only and Software-Only Directory Protocols. Journal of Parallel and Distributed Computing 60, 2000, pp. 807-834.