Расчет временных характеристик системы массового обслуживания с процессами расщепления и слияния заявок и разогревом

Автор: Хабаров Роман Сергеевич, Лохвицкий Владимир Александрович, Корчагин Павел Викторович

Журнал: Вестник Российского нового университета. Серия: Сложные системы: модели, анализ и управление @vestnik-rosnou-complex-systems-models-analysis-management

Рубрика: Математическое моделирование

Статья в выпуске: 2, 2021 года.

Бесплатный доступ

Представлена модель и алгоритм расчета начальных моментов времени пребывания в системе массового обслуживания с процессами расщепления и слияния заявок и «разогревом». Предложенный подход позволяет оценить оперативность проектируемых систем распределенной обработки данных, функционирующих в реальном масштабе времени, с учетом временных задержек на прием информации с приемлемой для практических целей точностью.

Распределенная обработка в реальном масштабе времени, теория очередей, система массового обслуживания, процессы расщепления и слияния заявок, обслуживание с «разогревом»

Короткий адрес: https://sciup.org/148321626

IDR: 148321626   |   DOI: 10.25586/RNU.V9187.21.02.P.010

Текст научной статьи Расчет временных характеристик системы массового обслуживания с процессами расщепления и слияния заявок и разогревом

В последние годы все большее распространение получают технологии распределенной обработки данных в реальном масштабе времени. Примером применения такой технологии в сфере обработки данных дистанционного зондирования Земли (ДЗЗ) является создание единой территориально распределенной системы (ЕТРИС) ДЗЗ. Эта система позволяет перейти к распределенной обработке данных со всех типов космических аппаратов (КА) ДЗЗ с использованием универсальных комплексов приема информации [5]. Данные подходы предполагается реализовать с помощью создания унифицированных программных комплексов распределенной обработки, хранения и распространения данных ДЗЗ, функционирующих на вычислительных кластерах пунктов приема информации или в центрах обработки данных.

Текущими проблемными вопросами дальнейшего развития технологии распределенной обработки данных являются увеличение объема обрабатываемых данных и недостаточная пропускная способность каналов передачи.

Например, в сфере обработки информации с КА ДЗЗ увеличение объема данных наблюдения вызвано повышением пространственного разрешения космических снимков

Расчет временных характеристик системы массового обслуживания ...

с--------------------------------------------------------------------------------------------------------------

Хабаров Роман Сергеевич начальник лаборатории военного института (научно-исследовательского) Военнокосмической академии им. А.Ф. Можайского. Сфера научных интересов: исследование операций, теория очередей, машинное обучение. Автор 11 опубликованных научных работ.

и использованием многоспектральной и гиперспектральной съемки. Существует практическая необходимость обработки и интерпретации таких данных в реальном масштабе времени, например при космическом мониторинге чрезвычайных ситуаций [7]. В связи с этим остро встает проблема оперативной передачи гиперспектральных данных по радиоканалам с ограниченной пропускной способностью. Существенную роль приобретает соотношение между информационной производительностью аппаратуры ДЗЗ и пропускной способностью используемых радиоканалов передачи информации [4].

Анализ оценок информационной производительности современных КА ДЗЗ с гиперспектральной съемкой показывает, что передача видеоданных с КА на наземные пункты приема информации в масштабе времени, близком к реальному, требует обеспечения скорости передачи информации в сотни мегабит – единицы гигабит в секунду. В существующих и перспективных спутниковых системах передачи видеоданных с КА ДЗЗ скорости передачи информации составляют сотни мегабит в секунду. Однако эти возможности систем передачи информации уже сейчас не согласуются с информационными возможностями многих гиперспектральных систем ДЗЗ, в перспективе это рассогласование будет только усиливаться [4].

В связи со сложившейся ситуацией все большую актуальность приобретают вопросы оценивания оперативности проектируемых систем распределенной обработки данных, функционирующих в реальном масштабе времени, с учетом временных задержек на прием информации. Особую сложность представляет тот факт, что оценка оперативности таких систем в виде среднего времени обработки, как правило, является недостаточной, и требуется получить оценку вероятности превышения (непревышения) директивно заданного времени.

Методы обработки данных

В [3] отмечается, что, несмотря на наличие различных подходов к анализу работы вычислительных сетей (математический аппарат теории графов и сетевого анализа, теории нечетких множеств и нечеткой логики, тензорного анализа, теории фракталов), методически разработанным и применяемым на практике математическим аппаратом является теория очередей. При моделировании распределенной обработки данных с учетом задержки на время их приема и (или) восстановление необходимо учитывать также следующие особенности:

  • •    обработка осуществляется параллельно на заданном наборе серверов;

  • •    каждый сервер результаты своей работы записывает в отдельный файл, после чего выполняются их «склеивание» и дальнейшая интерпретация результатов выполнения.

Подобный процесс разделения задачи на подзадачи с параллельным их выполнением и последующим объединением результатов традиционно называется Split-Join. На рисунке 1 изображена схема процесса обработки по технологии Split-Join применительно к данным ДЗЗ. Общее время выполнения такой задачи определяется длительностью этапов ее декомпозиции и объединения результатов, а также временем решения самой трудоемкой из подзадач.

Рис. 1. Схема процесса обработки с разделением и слиянием задач

На рисунке 2 в качестве примера изображена циклограмма обработки данных ДЗЗ, полученных в текущем сеансе связи, в процессе выдачи восстановленной информации с распределением по серверам обработки. В общем случае время восстановления одной части принятых данных τ является случайной величиной. Из представленного рисунка видно, что время обработки всего объема принятых в текущем сеансе связи данных без учета временных затрат на операции «склеивания» и интерпретации результатов определяется моментом завершения обработки последнего фрагмента t max. Такие дополнительные временные затраты на обслуживание при поступлении заявок в свободную систему в теории очередей традиционно называются процессами «разогрева».

На рисунке 3 изображена циклограмма для случая одновременной обработки данных сеанса связи после завершения восстановления всей принятой информации. Поскольку для операции восстановления, как правило, выделяются отдельные сервера, при поступлении данных в занятую систему процесс восстановления происходит во время ожидания начала обработки и не оказывает влияния на оперативность обработки данных в целом.

Расчет временных характеристик системы массового обслуживания ...

n-1

n

Рис. 2. Циклограмма обработки данных в процессе выдачи восстановленной информации

Рис. 3. Циклограмма обработки данных после завершения восстановления информации

Несмотря на то, что процессам Split-Join посвящено достаточно большое количество работ [8–16], вопросы оценивания времени пребывания в системах массового обслуживания (СМО) с процессами Split-Join, а также с «разогревом» до сих пор не освещены. В данной работе предлагается алгоритм расчета СМО с процессами Split-Join и «разогревом», позволяющий получить начальные моменты времени пребывания заявок в системе.

Постановка задачи

Будем считать, что заданы начальные моменты времени обработки фрагмента данных в канале bj , j = 1, m. Поток поступления заявок будем считать простейшим с интенсивностью λ . Заданы начальные моменты времени задержки, вызванной операциями приема и восстановления части информации aj , j = 1, m . Число каналов обработки – n . Дисциплина обслуживания в СМО – Split-Join. Требуется найти начальные моменты времени пребывания в системе vj , j = 1, m .

Для оценки вероятности превышения директивно заданного времени необходимо по найденным моментам vj , j = 1, m рассчитать параметры аппроксимирующего распределения (например, Вейбулла) и получить значение дополнительной функции распределения (ДФР) при заданном значении требуемого времени обработки.

Алгоритм расчета

Расчет начальных моментов времени пребывания в представленной СМО предлагается осуществить в два этапа. На первом этапе произведем расчет начальных моментов времени обработки с учетом разделения и слияния задач для двух случаев:

  • 1 . Обработка осуществляется после прибытия заявки в свободную систему. Расчет начальных моментов времени обработки gj *, j = 1, m необходимо производить с учетом временных задержек на прием и восстановление.

Обработка данных осуществляется синхронно без учета задержки на прием и восстановление. Соответствующие начальные моменты времени обработки gj , j = 1, m представляют собой начальные моменты распределения максимума из n случайных величин времен обработки части данных в канале и могут быть рассчитаны по формулам, представленным в [8]:

Методы обработки данных

r gj = jZtk-1 AkF ^k) et ’                             (1)

k = 1

где для {xk} и {Ak} существуют справочные таблицы [3] для различных значений r, а F*(t) представляет собой ДФР распределения максимума времени обработки в n каналах, функция которого определяется как n F *( t) =П F (t), i=1

где Fi ( t ) функция распределения времени обслуживания в i -м канале.

После получения упомянутых начальных моментов становится возможным представить весь процесс обработки в виде одноканальной системы массового обслуживания типа M/G/ 1 с начальными моментами времени обслуживания в канале gj , j = 1, m и начальными моментами времени «разогрева» gj *, j = 1, m .

На втором этапе производится непосредственный расчет начальных моментов времени пребывания заявок в системе vj , j = 1, m дифференцированием в нуле соответствующего преобразования Лапласа – Стилтьеса (ПЛС), которое определяется выражением [7]

v ( s ) = p 0

a-^M s hM

1 - sA - e( s )

где p *0 = 1/(1 + λTB ), TB = b *(1 – λb ); β( s ), β*( s ) – ПЛС времени обслуживания, соответственно, без «разогрева» и с «разогревом»; b , b * – математические ожидания времени обслуживания без «разогрева» и с «разогревом» соответственно.

Осталось указать способ расчета gj *, j = 1, m . Далее предлагается рассмотреть отдельно варианты расчета для случаев детерминированной и случайной задержки на время приема и восстановления части данных.

Расчет начальных моментов распределения максимума при детерминированной задержке

Как видно из рисунка 2, при детерминированной задержке начало обслуживания в j -м канале будет сдвинуто относительно момента начала обслуживания на время . Таким образом, расчет gj *, j = 1, m для случая детерминированной задержки осуществляется согласно

r

gj=j^ tk-1 AkG *(tk) et, k=1

где

n

G(tk,t)=1—nF(tk,iT)’ F(tk,т)= i=1

' 0, t k < T, F ( t k - T ),

t k ^ T

Расчет начальных моментов распределения максимума при случайной задержке

При заданных начальных моментах aj , j = 1, m времени приема и восстановления части информации τ начальные моменты времени задержки начала обслуживания в j -м канале

Расчет временных характеристик системы массового обслуживания ...

am*,j. будут определяться j-кратной сверткой τ, а начальный момент m порядка времени обработки в j-м канале определяется на основании символьного представления gm,j = (b + a*j)m, m = 1,2,…, (3) где после развертывания бинома степени переводятся в номера соответствующих начальных моментов. Дальнейший расчет можно осуществлять по формуле (1), при этом для каждого канала по найденным с помощью (3) начальным моментам gm,j осуществляется подбор по методу моментов параметров аппроксимирующей функции распределения времени обработки в канале с учетом задержек. В качестве аппроксимирующей функции может выступать гамма-распределение, позволяющее выровнять два первых начальных момента при произвольных значениях коэффициента вариации.

Экспериментальная проверка точности расчета начальных моментов времени обработки с расщеплением и слиянием заявок и задержкой начала обслуживания

Верификация предложенного алгоритма расчета производилась сравнением результатов, полученных с помощью формул (1)–(3) с данными имитационного моделирования (ИМ). Приведем здесь пример расчета в сравнении с данными ИМ для следующих исходных данных:

  • •    исходная заявка разделяется на 3 подзадачи;

  • •    случайная длительность выполнения каждой задачи задана гиперэкспоненциальным распределением второго порядка ( H 2-распределение) с параметрами y 1 = 0,3, y 2 = 0,7, μ 1 = 0,15, μ2 1 = 0,7.

При детерминированной задержке параметр τ был задан равным 0,5. При случайной задержке начала обслуживания были заданы первые три начальные моменты времени задержки aj – {0,5, 2,0, 10,0} соответственно.

Полученные результаты сопоставлены с результатами имитационного моделирования и представлены в таблицах 1 и 2. Символом σ обозначено среднеквадратическое отклонение времени пребывания заявок в системе. Для численного расчета представлены собственно значения моментов, а также абсолютная и относительная погрешность, обозначенные ∆ и δ соответственно.

Таблица 1

Результаты расчетов при детерминированной задержке

ИМ

Численный расчет

Знач.

δ, %

b 1

6,638

6,571

6,67e-2

1,02

σ

0,414

0,429

1,49e-2

3,48

b 3

525,8

519,9

5,96

1,15

Таблица 2

Результаты расчетов при случайной задержке

ИМ

Численный расчет

Знач.

δ, %

b 1

10,34

10,18

1,63e-1

1,60

σ

0,397

0,432

3,58e2

8,27

b 3

1696

1758

6,19e1

3,52

Как видно из таблиц 1 и 2, результаты численных расчетов хорошо согласуются с результатами имитационного моделирования.

Методы обработки данных

Расчет начальных моментов времени пребывания в системе

Найденные на предыдущем этапе начальные моменты времени обработки с учетом задержки позволяют перейти к расчету СМО.

Проверку точности расчета приведем для тех же исходных данных. Зададим интенсивность входящего потока λ = 0,12. При таком значении λ обеспечивается коэффициент загрузки СМО, равный 0,75. В таблицах 3 и 4 представлены результаты расчетов для начальных моментов времени пребывания в системе vj , j = 1,3 при детерминированной и случайной задержке соответственно.

Согласно [2], для оценок первого момента считается допустимой погрешность 20, второго – 40, третьего – 60%. Погрешности расчетных значений не превысили указанных требований. Заметим, что ИМ не является эталоном, поскольку датчики равномерно распределенных чисел не идеальны, а конечные результаты содержат статистическую погрешность.

Таблица 4

Таблица 3

Начальные моменты времени пребывания в СМО при детерминированной задержке

ИМ

Численный расчет

Знач.

δ, %

v 1

26,36

24,92

1,441

5,467

v 2

1365

1204

161,3

11,81

v 3

1,06e5

8,62e4

1,96e4

18,51

Начальные моменты времени пребывания в СМО при случайной задержке

ИМ

Численный расчет

Знач.

δ, %

v 1

26,54

25,20

1,337

5,036

v 2

1363

1220

142,7

10,46

v 3

1,04e5

8,74e4

1,62e4

15,59

На рисунке 4 представлен график ДФР времени пребывания заявки в СМО, построенный аппроксимацией распределением Вейбулла. Параметры распределения подбирались с помощью метода моментов по найденным на предыдущем шаге значениям vj , j = 1,3. Полученные графики ДФР позволяют оценить вероятность превышения директивно заданного времени.

Рис. 4. ДФР времени пребывания заявок в системе

Расчет временных характеристик системы массового обслуживания ...

Заключение

Предложены модель и реализующий ее алгоритм расчета начальных моментов времени пребывания в СМО с процессами расщепления и слияния заявок и «разогревом». Представленная модель позволяет оценить оперативность (среднее время обработки, высшие моменты, вероятность превышения директивно заданного времени) проектируемых систем распределенной обработки данных, функционирующих в реальном масштабе времени, с учетом временных задержек на прием и восстановление информации.

Список литературы Расчет временных характеристик системы массового обслуживания с процессами расщепления и слияния заявок и разогревом

  • Бучнев А.А., Пяткин В.П., Русин Е.В. Распределенная высокопроизводительная обработка данных дистанционного зондирования Земли // Исследование Земли из космоса. 2007. № 4. С. 34–38.
  • Вишневский В.М. Теоретические основы проектирования компьютерных сетей. М.: Техносфера, 2003. 512 с.
  • Крылов В.И., Шульгина Л.Т. Справочная книга по численному интегрированию. М.: Наука. 1966. 372 с.
  • Макаренко С.И. Анализ математического аппарата расчета качества обслуживания информационно-вычислительной сети на сетевом уровне эталонной модели взаимодействия открытых систем // VII Всероссийская конференция молодых ученых по математическому моделированию и информационным технологиям (с участием иностранных ученых): программа и тезисы докладов. Красноярск, 1–3 ноября 2006 г. Красноярск: Изд-во Ин-та вычислительных технологий Сибирского отделения Российской академии наук.
  • Мальцев Г.Н., Козинов И.А. Передача гиперспектральных видеоданных дистанционного зондирования Земли по радиоканалам с ограниченной пропускной способностью // Информационно-управляющие системы. 2016. № 2. С. 74–83.
  • Ромашкин В.В., Лошкарев П.А., Федоткин Д.И., Тохиян О.О. и др. ЕТ РИС ДЗЗ – современные решения в развитии отечественной наземной космической инфраструктуры дистанционного зондирования Земли из космоса // Современные проблемы дистанционного зондирования Земли из космоса. 2019. Т. 16, № 3. С. 220–227. DOI: 10.21046/2070-7401-2019-16-3-220-227
  • Рыжиков Ю.И. Алгоритмический подход к задачам массового обслуживания: монография. СПб.: Изд-во Военно-космической академии им. А.Ф. Можайского, 2013. 496 с.
  • Рыжиков Ю.И., Лохвицкий В.А., Хабаров Р.С. Метод расчета длительности обработки задач в системе массового обслуживания с учетом процессов Split-Join // Известия вузов. Приборостроение. 2019. № 5. С. 419–422.
  • Хабаров Р.С., Лохвицкий В.А. Модель оценивания оперативности многопоточной обработки задач в распределенной вычислительной среде с учетом процессов Split-Join // Вестник Российского нового университета. Серия «Сложные системы: модели, анализ, управление». 2019. Вып. 1. C. 26–34. DOI: 10.25586/RNU.V9187.19.01.P.026
  • Baccelli F. Two Parallel Queues Created by Arrivals with Two Demands. The M/G/2 Symmetrical Case // Technical report INRIA-Rocquencourt. 1985. No. 426.
  • Baccelli F., Makowski A.M., Shwartz A. The Fork-Join Queue and Related Systems with Synchronization Constraints: Stochastic Ordering and Computable Bounds // Advances in Applied Probability. 1989. Vol. 21. Pp. 629–660. DOI: 10.2307/1427640
  • Fiorini P., Lipsky L. Exact Analysis of Some Split-Merge Queues // Performance Evaluation Review. 2015. Vol. 43, no. 2. Pp. 51–53.
  • Flatto L., Hahn S. Two Parallel Queues Created by Arrivals with Two Demands // SIAM Journal on Applied Mathematics. 1979. Vol. 44. Pp. 1041–1053.
  • Harrison P.G., Zertal S. Queueing Models with Maxima of Service Times // Computer Performance Evaluation. Modelling Techiniques and Tools: Proceedings of the 13th International Conference, TOOLS 2003, Urbana, IL, USA, 2–5th of September 2003. Pp. 152–168.
  • Nelson R., Tantawi A.N. Approximate Analysis of Fork-Join Synchronization in Parallel Queues // IEEE Transactions on Computers. 1988. Vol. 37. Pp. 739–743.
  • Olvera-Cravioto M., Ruiz-Lacedelli O. Parallel Queues with Synchronization // arXiv preprint arXiv:1501.00186. 2014. Pp. 1–37 [Digital Resource]. URL: https://arxiv.org/abs/1501.00186 (date of the аpplication: 23.04.2021).
Еще
Статья научная