Расчет временных характеристик системы массового обслуживания с процессами расщепления и слияния заявок и разогревом

Автор: Хабаров Роман Сергеевич, Лохвицкий Владимир Александрович, Корчагин Павел Викторович

Журнал: Вестник Российского нового университета. Серия: Сложные системы: модели, анализ и управление @vestnik-rosnou-complex-systems-models-analysis-management

Рубрика: Математическое моделирование

Статья в выпуске: 2, 2021 года.

Бесплатный доступ

Представлена модель и алгоритм расчета начальных моментов времени пребывания в системе массового обслуживания с процессами расщепления и слияния заявок и «разогревом». Предложенный подход позволяет оценить оперативность проектируемых систем распределенной обработки данных, функционирующих в реальном масштабе времени, с учетом временных задержек на прием информации с приемлемой для практических целей точностью.

Распределенная обработка в реальном масштабе времени, теория очередей, система массового обслуживания, процессы расщепления и слияния заявок, обслуживание с «разогревом»

Короткий адрес: https://sciup.org/148321626

IDR: 148321626   |   УДК: 519.64:004.75:004.94   |   DOI: 10.25586/RNU.V9187.21.02.P.010

Calculation of a split-merge queueing system with warm up

The model and algorithm for calculating the sojourn time ordinary moments in the Queuing system with the split-merge processes and warm up are presented. The proposed approach allow to evaluate the efficiency of the designed distributed data processing systems operating in real time, taking into account the receiving information time delays with acceptable accuracy for practical purposes.

Текст научной статьи Расчет временных характеристик системы массового обслуживания с процессами расщепления и слияния заявок и разогревом

В последние годы все большее распространение получают технологии распределенной обработки данных в реальном масштабе времени. Примером применения такой технологии в сфере обработки данных дистанционного зондирования Земли (ДЗЗ) является создание единой территориально распределенной системы (ЕТРИС) ДЗЗ. Эта система позволяет перейти к распределенной обработке данных со всех типов космических аппаратов (КА) ДЗЗ с использованием универсальных комплексов приема информации [5]. Данные подходы предполагается реализовать с помощью создания унифицированных программных комплексов распределенной обработки, хранения и распространения данных ДЗЗ, функционирующих на вычислительных кластерах пунктов приема информации или в центрах обработки данных.

Текущими проблемными вопросами дальнейшего развития технологии распределенной обработки данных являются увеличение объема обрабатываемых данных и недостаточная пропускная способность каналов передачи.

Например, в сфере обработки информации с КА ДЗЗ увеличение объема данных наблюдения вызвано повышением пространственного разрешения космических снимков

Расчет временных характеристик системы массового обслуживания ...

с--------------------------------------------------------------------------------------------------------------

Хабаров Роман Сергеевич начальник лаборатории военного института (научно-исследовательского) Военнокосмической академии им. А.Ф. Можайского. Сфера научных интересов: исследование операций, теория очередей, машинное обучение. Автор 11 опубликованных научных работ.

и использованием многоспектральной и гиперспектральной съемки. Существует практическая необходимость обработки и интерпретации таких данных в реальном масштабе времени, например при космическом мониторинге чрезвычайных ситуаций [7]. В связи с этим остро встает проблема оперативной передачи гиперспектральных данных по радиоканалам с ограниченной пропускной способностью. Существенную роль приобретает соотношение между информационной производительностью аппаратуры ДЗЗ и пропускной способностью используемых радиоканалов передачи информации [4].

Анализ оценок информационной производительности современных КА ДЗЗ с гиперспектральной съемкой показывает, что передача видеоданных с КА на наземные пункты приема информации в масштабе времени, близком к реальному, требует обеспечения скорости передачи информации в сотни мегабит – единицы гигабит в секунду. В существующих и перспективных спутниковых системах передачи видеоданных с КА ДЗЗ скорости передачи информации составляют сотни мегабит в секунду. Однако эти возможности систем передачи информации уже сейчас не согласуются с информационными возможностями многих гиперспектральных систем ДЗЗ, в перспективе это рассогласование будет только усиливаться [4].

В связи со сложившейся ситуацией все большую актуальность приобретают вопросы оценивания оперативности проектируемых систем распределенной обработки данных, функционирующих в реальном масштабе времени, с учетом временных задержек на прием информации. Особую сложность представляет тот факт, что оценка оперативности таких систем в виде среднего времени обработки, как правило, является недостаточной, и требуется получить оценку вероятности превышения (непревышения) директивно заданного времени.

Методы обработки данных

В [3] отмечается, что, несмотря на наличие различных подходов к анализу работы вычислительных сетей (математический аппарат теории графов и сетевого анализа, теории нечетких множеств и нечеткой логики, тензорного анализа, теории фракталов), методически разработанным и применяемым на практике математическим аппаратом является теория очередей. При моделировании распределенной обработки данных с учетом задержки на время их приема и (или) восстановление необходимо учитывать также следующие особенности:

  • •    обработка осуществляется параллельно на заданном наборе серверов;

  • •    каждый сервер результаты своей работы записывает в отдельный файл, после чего выполняются их «склеивание» и дальнейшая интерпретация результатов выполнения.

Подобный процесс разделения задачи на подзадачи с параллельным их выполнением и последующим объединением результатов традиционно называется Split-Join. На рисунке 1 изображена схема процесса обработки по технологии Split-Join применительно к данным ДЗЗ. Общее время выполнения такой задачи определяется длительностью этапов ее декомпозиции и объединения результатов, а также временем решения самой трудоемкой из подзадач.

Рис. 1. Схема процесса обработки с разделением и слиянием задач

На рисунке 2 в качестве примера изображена циклограмма обработки данных ДЗЗ, полученных в текущем сеансе связи, в процессе выдачи восстановленной информации с распределением по серверам обработки. В общем случае время восстановления одной части принятых данных τ является случайной величиной. Из представленного рисунка видно, что время обработки всего объема принятых в текущем сеансе связи данных без учета временных затрат на операции «склеивания» и интерпретации результатов определяется моментом завершения обработки последнего фрагмента t max. Такие дополнительные временные затраты на обслуживание при поступлении заявок в свободную систему в теории очередей традиционно называются процессами «разогрева».

На рисунке 3 изображена циклограмма для случая одновременной обработки данных сеанса связи после завершения восстановления всей принятой информации. Поскольку для операции восстановления, как правило, выделяются отдельные сервера, при поступлении данных в занятую систему процесс восстановления происходит во время ожидания начала обработки и не оказывает влияния на оперативность обработки данных в целом.

Расчет временных характеристик системы массового обслуживания ...

n-1

n

Рис. 2. Циклограмма обработки данных в процессе выдачи восстановленной информации

Рис. 3. Циклограмма обработки данных после завершения восстановления информации

Несмотря на то, что процессам Split-Join посвящено достаточно большое количество работ [8–16], вопросы оценивания времени пребывания в системах массового обслуживания (СМО) с процессами Split-Join, а также с «разогревом» до сих пор не освещены. В данной работе предлагается алгоритм расчета СМО с процессами Split-Join и «разогревом», позволяющий получить начальные моменты времени пребывания заявок в системе.

Постановка задачи

Будем считать, что заданы начальные моменты времени обработки фрагмента данных в канале bj , j = 1, m. Поток поступления заявок будем считать простейшим с интенсивностью λ . Заданы начальные моменты времени задержки, вызванной операциями приема и восстановления части информации aj , j = 1, m . Число каналов обработки – n . Дисциплина обслуживания в СМО – Split-Join. Требуется найти начальные моменты времени пребывания в системе vj , j = 1, m .

Для оценки вероятности превышения директивно заданного времени необходимо по найденным моментам vj , j = 1, m рассчитать параметры аппроксимирующего распределения (например, Вейбулла) и получить значение дополнительной функции распределения (ДФР) при заданном значении требуемого времени обработки.

Алгоритм расчета

Расчет начальных моментов времени пребывания в представленной СМО предлагается осуществить в два этапа. На первом этапе произведем расчет начальных моментов времени обработки с учетом разделения и слияния задач для двух случаев:

  • 1 . Обработка осуществляется после прибытия заявки в свободную систему. Расчет начальных моментов времени обработки gj *, j = 1, m необходимо производить с учетом временных задержек на прием и восстановление.

Обработка данных осуществляется синхронно без учета задержки на прием и восстановление. Соответствующие начальные моменты времени обработки gj , j = 1, m представляют собой начальные моменты распределения максимума из n случайных величин времен обработки части данных в канале и могут быть рассчитаны по формулам, представленным в [8]:

Методы обработки данных

r gj = jZtk-1 AkF ^k) et ’                             (1)

k = 1

где для {xk} и {Ak} существуют справочные таблицы [3] для различных значений r, а F*(t) представляет собой ДФР распределения максимума времени обработки в n каналах, функция которого определяется как n F *( t) =П F (t), i=1

где Fi ( t ) функция распределения времени обслуживания в i -м канале.

После получения упомянутых начальных моментов становится возможным представить весь процесс обработки в виде одноканальной системы массового обслуживания типа M/G/ 1 с начальными моментами времени обслуживания в канале gj , j = 1, m и начальными моментами времени «разогрева» gj *, j = 1, m .

На втором этапе производится непосредственный расчет начальных моментов времени пребывания заявок в системе vj , j = 1, m дифференцированием в нуле соответствующего преобразования Лапласа – Стилтьеса (ПЛС), которое определяется выражением [7]

v ( s ) = p 0

a-^M s hM

1 - sA - e( s )

где p *0 = 1/(1 + λTB ), TB = b *(1 – λb ); β( s ), β*( s ) – ПЛС времени обслуживания, соответственно, без «разогрева» и с «разогревом»; b , b * – математические ожидания времени обслуживания без «разогрева» и с «разогревом» соответственно.

Осталось указать способ расчета gj *, j = 1, m . Далее предлагается рассмотреть отдельно варианты расчета для случаев детерминированной и случайной задержки на время приема и восстановления части данных.

Расчет начальных моментов распределения максимума при детерминированной задержке

Как видно из рисунка 2, при детерминированной задержке начало обслуживания в j -м канале будет сдвинуто относительно момента начала обслуживания на время . Таким образом, расчет gj *, j = 1, m для случая детерминированной задержки осуществляется согласно

r

gj=j^ tk-1 AkG *(tk) et, k=1

где

n

G(tk,t)=1—nF(tk,iT)’ F(tk,т)= i=1

' 0, t k < T, F ( t k - T ),

t k ^ T

Расчет начальных моментов распределения максимума при случайной задержке

При заданных начальных моментах aj , j = 1, m времени приема и восстановления части информации τ начальные моменты времени задержки начала обслуживания в j -м канале

Расчет временных характеристик системы массового обслуживания ...

am*,j. будут определяться j-кратной сверткой τ, а начальный момент m порядка времени обработки в j-м канале определяется на основании символьного представления gm,j = (b + a*j)m, m = 1,2,…, (3) где после развертывания бинома степени переводятся в номера соответствующих начальных моментов. Дальнейший расчет можно осуществлять по формуле (1), при этом для каждого канала по найденным с помощью (3) начальным моментам gm,j осуществляется подбор по методу моментов параметров аппроксимирующей функции распределения времени обработки в канале с учетом задержек. В качестве аппроксимирующей функции может выступать гамма-распределение, позволяющее выровнять два первых начальных момента при произвольных значениях коэффициента вариации.

Экспериментальная проверка точности расчета начальных моментов времени обработки с расщеплением и слиянием заявок и задержкой начала обслуживания

Верификация предложенного алгоритма расчета производилась сравнением результатов, полученных с помощью формул (1)–(3) с данными имитационного моделирования (ИМ). Приведем здесь пример расчета в сравнении с данными ИМ для следующих исходных данных:

  • •    исходная заявка разделяется на 3 подзадачи;

  • •    случайная длительность выполнения каждой задачи задана гиперэкспоненциальным распределением второго порядка ( H 2-распределение) с параметрами y 1 = 0,3, y 2 = 0,7, μ 1 = 0,15, μ2 1 = 0,7.

При детерминированной задержке параметр τ был задан равным 0,5. При случайной задержке начала обслуживания были заданы первые три начальные моменты времени задержки aj – {0,5, 2,0, 10,0} соответственно.

Полученные результаты сопоставлены с результатами имитационного моделирования и представлены в таблицах 1 и 2. Символом σ обозначено среднеквадратическое отклонение времени пребывания заявок в системе. Для численного расчета представлены собственно значения моментов, а также абсолютная и относительная погрешность, обозначенные ∆ и δ соответственно.

Таблица 1

Результаты расчетов при детерминированной задержке

ИМ

Численный расчет

Знач.

δ, %

b 1

6,638

6,571

6,67e-2

1,02

σ

0,414

0,429

1,49e-2

3,48

b 3

525,8

519,9

5,96

1,15

Таблица 2

Результаты расчетов при случайной задержке

ИМ

Численный расчет

Знач.

δ, %

b 1

10,34

10,18

1,63e-1

1,60

σ

0,397

0,432

3,58e2

8,27

b 3

1696

1758

6,19e1

3,52

Как видно из таблиц 1 и 2, результаты численных расчетов хорошо согласуются с результатами имитационного моделирования.

Методы обработки данных

Расчет начальных моментов времени пребывания в системе

Найденные на предыдущем этапе начальные моменты времени обработки с учетом задержки позволяют перейти к расчету СМО.

Проверку точности расчета приведем для тех же исходных данных. Зададим интенсивность входящего потока λ = 0,12. При таком значении λ обеспечивается коэффициент загрузки СМО, равный 0,75. В таблицах 3 и 4 представлены результаты расчетов для начальных моментов времени пребывания в системе vj , j = 1,3 при детерминированной и случайной задержке соответственно.

Согласно [2], для оценок первого момента считается допустимой погрешность 20, второго – 40, третьего – 60%. Погрешности расчетных значений не превысили указанных требований. Заметим, что ИМ не является эталоном, поскольку датчики равномерно распределенных чисел не идеальны, а конечные результаты содержат статистическую погрешность.

Таблица 4

Таблица 3

Начальные моменты времени пребывания в СМО при детерминированной задержке

ИМ

Численный расчет

Знач.

δ, %

v 1

26,36

24,92

1,441

5,467

v 2

1365

1204

161,3

11,81

v 3

1,06e5

8,62e4

1,96e4

18,51

Начальные моменты времени пребывания в СМО при случайной задержке

ИМ

Численный расчет

Знач.

δ, %

v 1

26,54

25,20

1,337

5,036

v 2

1363

1220

142,7

10,46

v 3

1,04e5

8,74e4

1,62e4

15,59

На рисунке 4 представлен график ДФР времени пребывания заявки в СМО, построенный аппроксимацией распределением Вейбулла. Параметры распределения подбирались с помощью метода моментов по найденным на предыдущем шаге значениям vj , j = 1,3. Полученные графики ДФР позволяют оценить вероятность превышения директивно заданного времени.

Рис. 4. ДФР времени пребывания заявок в системе

Расчет временных характеристик системы массового обслуживания ...

Заключение

Предложены модель и реализующий ее алгоритм расчета начальных моментов времени пребывания в СМО с процессами расщепления и слияния заявок и «разогревом». Представленная модель позволяет оценить оперативность (среднее время обработки, высшие моменты, вероятность превышения директивно заданного времени) проектируемых систем распределенной обработки данных, функционирующих в реальном масштабе времени, с учетом временных задержек на прием и восстановление информации.

Список литературы Расчет временных характеристик системы массового обслуживания с процессами расщепления и слияния заявок и разогревом

  • Бучнев А.А., Пяткин В.П., Русин Е.В. Распределенная высокопроизводительная обработка данных дистанционного зондирования Земли // Исследование Земли из космоса. 2007. № 4. С. 34–38.
  • Вишневский В.М. Теоретические основы проектирования компьютерных сетей. М.: Техносфера, 2003. 512 с.
  • Крылов В.И., Шульгина Л.Т. Справочная книга по численному интегрированию. М.: Наука. 1966. 372 с.
  • Макаренко С.И. Анализ математического аппарата расчета качества обслуживания информационно-вычислительной сети на сетевом уровне эталонной модели взаимодействия открытых систем // VII Всероссийская конференция молодых ученых по математическому моделированию и информационным технологиям (с участием иностранных ученых): программа и тезисы докладов. Красноярск, 1–3 ноября 2006 г. Красноярск: Изд-во Ин-та вычислительных технологий Сибирского отделения Российской академии наук.
  • Мальцев Г.Н., Козинов И.А. Передача гиперспектральных видеоданных дистанционного зондирования Земли по радиоканалам с ограниченной пропускной способностью // Информационно-управляющие системы. 2016. № 2. С. 74–83.
  • Ромашкин В.В., Лошкарев П.А., Федоткин Д.И., Тохиян О.О. и др. ЕТ РИС ДЗЗ – современные решения в развитии отечественной наземной космической инфраструктуры дистанционного зондирования Земли из космоса // Современные проблемы дистанционного зондирования Земли из космоса. 2019. Т. 16, № 3. С. 220–227. DOI: 10.21046/2070-7401-2019-16-3-220-227
  • Рыжиков Ю.И. Алгоритмический подход к задачам массового обслуживания: монография. СПб.: Изд-во Военно-космической академии им. А.Ф. Можайского, 2013. 496 с.
  • Рыжиков Ю.И., Лохвицкий В.А., Хабаров Р.С. Метод расчета длительности обработки задач в системе массового обслуживания с учетом процессов Split-Join // Известия вузов. Приборостроение. 2019. № 5. С. 419–422.
  • Хабаров Р.С., Лохвицкий В.А. Модель оценивания оперативности многопоточной обработки задач в распределенной вычислительной среде с учетом процессов Split-Join // Вестник Российского нового университета. Серия «Сложные системы: модели, анализ, управление». 2019. Вып. 1. C. 26–34. DOI: 10.25586/RNU.V9187.19.01.P.026
  • Baccelli F. Two Parallel Queues Created by Arrivals with Two Demands. The M/G/2 Symmetrical Case // Technical report INRIA-Rocquencourt. 1985. No. 426.
  • Baccelli F., Makowski A.M., Shwartz A. The Fork-Join Queue and Related Systems with Synchronization Constraints: Stochastic Ordering and Computable Bounds // Advances in Applied Probability. 1989. Vol. 21. Pp. 629–660. DOI: 10.2307/1427640
  • Fiorini P., Lipsky L. Exact Analysis of Some Split-Merge Queues // Performance Evaluation Review. 2015. Vol. 43, no. 2. Pp. 51–53.
  • Flatto L., Hahn S. Two Parallel Queues Created by Arrivals with Two Demands // SIAM Journal on Applied Mathematics. 1979. Vol. 44. Pp. 1041–1053.
  • Harrison P.G., Zertal S. Queueing Models with Maxima of Service Times // Computer Performance Evaluation. Modelling Techiniques and Tools: Proceedings of the 13th International Conference, TOOLS 2003, Urbana, IL, USA, 2–5th of September 2003. Pp. 152–168.
  • Nelson R., Tantawi A.N. Approximate Analysis of Fork-Join Synchronization in Parallel Queues // IEEE Transactions on Computers. 1988. Vol. 37. Pp. 739–743.
  • Olvera-Cravioto M., Ruiz-Lacedelli O. Parallel Queues with Synchronization // arXiv preprint arXiv:1501.00186. 2014. Pp. 1–37 [Digital Resource]. URL: https://arxiv.org/abs/1501.00186 (date of the аpplication: 23.04.2021).
Еще